Publicación:
Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

dc.contributor.advisorHolguín-Ontiveros, Erika Paolaspa
dc.contributor.advisorMenéndez-Mora, Raúl Ernestospa
dc.contributor.authorEspitia-Betancourt, César Augustospa
dc.contributor.authorPáramo-Lozada, Juan Pablospa
dc.date.accessioned2019-01-24T13:45:03Zspa
dc.date.available2019-01-24T13:45:03Zspa
dc.date.issued2018spa
dc.descriptionTrabajo de investigaciónspa
dc.description.abstractColombia lleva alrededor de 50 años en guerra y aunque se realizo un proceso de paz, las disputas continúan entre los diferentes actores, un medio en donde se desarrollan las disputas son las redes sociales, los diferentes actores expresan sus opiniones, existen diferentes técnicas y algoritmos que permiten procesar estos textos con la finalidad de que el gobierno Colombiano tenga claridad de como se encuentra el conflicto en la actualidad y como debe proceder de una manera eficiente.spa
dc.description.degreelevelPregradospa
dc.description.degreenameIngeniero de Sistemasspa
dc.description.tableofcontentsRESUMEN INTRODUCCIÓN 1. GENERALIDADES 2. ANTECEDENTES 3. PLANTEAMIENTO DEL PROBLEMA 4. OBJETIVOS 5. JUSTIFICACIÓN 6. DELIMIETACIÓN 7. MARCO REFERENCIAL 8. ESTADO DEL ARTE 9. METODOLOGIA 10. PLATAFORMAS 11. ENTORNOS 12. ALGORITMOS 13. HISTORIAS DE USUARIO 14. DESARROLLO DEL COMPONENTE 15. RESULTADOS 16. CONCLUSIONES 17. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOSspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationEspitia-Betancourt, C. A. & Páramo-Lozada, J. P. (2018). Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombiaspa
dc.identifier.urihttps://hdl.handle.net/10983/22546spa
dc.language.isospaspa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.programIngeniería de Sistemas y Computaciónspa
dc.relation.referencesAdam Marcus y Eugene Wu. (2012). Text Processing Overviewspa
dc.relation.referencesArcila-Calderón, C., Barbosa-Caro, E., & Cabezuelo-Lorenzo, F. (2016). Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística. El Profesional de La Información, 25(4), 623. https://doi.org/10.3145/epi.2016.jul.12spa
dc.relation.referencesBakeman, R., McArthur, D., Quera, V., & Robinson, B. F. (2014). Kappa. Psychological Methods, 2(4), 357–370. https://doi.org/10.1037/1082-989X.2.4.357spa
dc.relation.referencesBarve, A., Rahate, M., Gaikwad, A., & Patil, P. (2018). Terror Attack Identifier: Classify using KNN, SVM, Random Forest algorithm and alert through messages. International Research Journal of Engineering and Technology, 4. Retrieved from www.irjet.netspa
dc.relation.referencesBifet, A., & Frank, E. (n.d.-a). Sentiment Knowledge Discovery in Twitter Streaming Data. Retrieved from https://www.cs.waikato.ac.nz/ml/publications/2010/Twitter-crc.pdfspa
dc.relation.referencesBifet, A., & Frank, E. (n.d.-b). Sentiment Knowledge Discovery in Twitter Streaming Data.spa
dc.relation.referencesBouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2016). WEKA Manual for Version 3-8-0.spa
dc.relation.referencesCambronero, C. G., & Moreno, I. G. (2010). ALGORITMOS DE APRENDIZAJE: KNN & KMEANS. Madrid. Retrieved from http://blogs.ujaen.es/barranco/wp-content/uploads/2012/02/Algoritmos-deaprendizaje-knn-y-kmeans.pdfspa
dc.relation.referencesCentro Nacional de Información de Ciencias Médicas., E., & Cabrera-Gato, J. E. (2007). Minería de textos: Una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED (Vol. 16). 2000, Editorial Ciencias Médicas. Retrieved from http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024- 94352007001000005spa
dc.relation.referencesCorso, I., & Lorena, C. (2010). Aplicación de algoritmos de clasificación supervisada usando Weka.spa
dc.relation.referencesDe Mauro, A., Greco, M., & Grimaldi, M. (2015). What is big data ? A consensual definition and a review of key research topics. Big Data Comput. Sci. Eng, 1644, 9. https://doi.org/10.1063/1.4907823spa
dc.relation.referencesDel Pilar, A., & Robles, A. (2017). ANÁLISIS DE EFECTIVIDAD AL IMPLEMENTAR LA TÉCNICA DE ÁRBOLES DE DECISIÓN DEL ENFOQUE DE APRENDIZAJE DE MÁQUINA PARA LA DETERMINACIÓN DE AVALÚOS MASIVOS PARA LAS UPZ 79 CALANDAIMA, 65 ARBORIZADORA Y 73 GARCÉS NAVAS. Retrieved from http://repository.udistrital.edu.co/bitstream/11349/5779/1/AlbancandoRoblesAdrianaDelPilar2017.pdfspa
dc.relation.referencesDiccionario Cambridge. (2018). Tweetspa
dc.relation.referencesDong, L., Wei, F., Tan, C., Tang, D., Zhou, M., & Xu, K. (n.d.). Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/P14-2009spa
dc.relation.referencesEscortell Pérez, A., Giménez Fayos, M., & Rosso, P. (2017). The Impact of Emotions on Polarity Analysis using Figurative Language in Twitter, 8. Retrieved from http://alt.qcri.org/semeval2015/task11/spa
dc.relation.referencesFiguerola, C. G., Alonso Berrocal, J. L., Zazo Rodríguez, Á. F., & Rodríguez, E. (2004). Algunas Técnicas de Clasificación Automática de Documentos. Página, 15, 10. Retrieved from https://core.ac.uk/download/pdf/153334293.pdfspa
dc.relation.referencesFrank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016a). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques" Retrieved from https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdfspa
dc.relation.referencesFrank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016b). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques"spa
dc.relation.referencesGálvez, C. (2008). MINERÍA DE TEXTOS: LA NUEVA GENERACIÓN DE ANÁLISIS DE LITERATURA CIENTÍFICA EN BIOLOGÍA MOLECULAR Y GENÓMICA, 14. Retrieved from https://doi.org/10.5007/1518-2924.2008v13n25p1spa
dc.relation.referencesHosmer, D. W., & Lemeshow Stanley. (1989). Applied logistic regression. Retrieved from http://resource.heartonline.cn/20150528/1_3kOQSTg.pdfspa
dc.relation.referencesKDnuggets. (2017). A General Approach to Preprocessing Text Data. Retrieved September 19, 2018, from https://www.kdnuggets.com/2017/12/generalapproach-preprocessing-text-data.htmlspa
dc.relation.referencesKuhn, M. (2018). The caret Package. Retrieved September 3, 2018, from http://topepo.github.io/caret/index.htmlspa
dc.relation.referencesKusner, M. J., Sun, Y., Kolkin, N. I., & Weinberger, K. Q. (2015). From Word Embeddings To Document Distances. Retrieved fromhttp://proceedings.mlr.press/v37/kusnerb15.pdfspa
dc.relation.referencesLe, Q., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Retrieved from https://cs.stanford.edu/~quocle/paragraph_vector.pdfspa
dc.relation.referencesLetelier, P., & Penadés, M. C. (2006). Métodologías ágiles para el desarrollo de software: eXtreme Programming (XP). Retrieved from www.agileuniverse.com.spa
dc.relation.referencesLevy, O., Goldberg, Y., & Dagan, I. (2015). Improving Distributional Similarity with Lessons Learned from Word Embeddings. Ramat Gan, Israel. Retrieved from https://www.transacl.org/ojs/index.php/tacl/article/view/570spa
dc.relation.referencesLos Modelos Geométricos (Modelos parte I). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/09/los-modelosgeometricos-modelos-parte-i/spa
dc.relation.referencesMiguel Ángel Vallejo Pareja. (2006). MINDFULNESS. Retrieved from http://www.redalyc.org/html/778/77827204/spa
dc.relation.referencesModelos Logicos (Modelos parte 3). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/23/modelos-logicos-modelosparte-3/spa
dc.relation.referencesModelos Probabilísticos (Modelos parte 2). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/12/modelosprobabilisticos-modelos-parte-2/spa
dc.relation.referencesPascual, D., Pla, F., & Sánchez, S. (n.d.). Algoritmos de agrupamiento. Retrieved from http://marmota.dlsi.uji.es/WebBIB/papers/2007/1_Pascual-MIA-2007.pdfspa
dc.relation.referencesPatil, T. R., & Sherekar, M. S. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal Of Computer Science And Applications, 6(2), 256–261. Retrieved from http://www.cs.bme.hu/~kiskat/adatb/bank-dataspa
dc.relation.referencesPaute, D. J., Soroa, A., & López, O. (2016). ANÁLISIS Y CLASIFICACIÓN DE INFORMACIÓN MEDIÁTICA ELECTORAL UTILIZANDO MINERÍA DE TEXTO. Retrieved from https://addi.ehu.es/bitstream/handle/10810/19300/TesisFinal_26092016.pdf?sequence=1&isAllowed=yspa
dc.relation.referencesPérez Abelleira, A., & Cardoso, C. A. (2010). Minería de texto para la categorización automática de documentos (Vol. 5). Salta, Argentina. Retrieved from http://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-aliciaarticulo-cuadernos-formateado.pdfspa
dc.relation.referencesRadio, C. (2017). De las balas a los votos. Retrieved from http://caracol.com.co/radio/2017/11/24/nacional/1511492119_078663.htmlspa
dc.relation.referencesRangra, K., & Bansal Research Scholar Professor, K. L. (2014). Comparative Study of Data Mining Tools. International Journal of Advanced Research in Computer Science and Software Engineering (Vol. 4). Retrieved from www.rproject.orgspa
dc.relation.referencesRapidMiner. (2014). RapidMiner Studio Manual. Retrieved from https://docs.rapidminer.com/downloads/RapidMiner-v6-user-manual.pdfspa
dc.relation.referencesRatinov, L., & Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Urbana, USA. Retrieved from http://l2r.cs.uiuc.edu/spa
dc.relation.referencesRepaso didáctico sobre machine learning. (n.d.). Retrieved September 30, 2018, from https://lapastillaroja.net/2015/02/ml-algols/spa
dc.relation.referencesReyes-Ortiz, J. A., Paniagua-Reyes, F., & Sánchez, L. (2017). Mining of Opinions Centered on Topics Using Short Texts in Spanish. Research in Computing Science (Vol. 134). Ciudad de México, México. Retrieved from http://www.rcs.cic.ipn.mx/rcs/2017_134/Mineria de opiniones centrada en topicos usando textos cortos en espanol.pdfspa
dc.relation.referencesRitter, A., Clark, S., & Etzioni, O. (2011). Named Entity Recognition in Tweets: An Experimental Study. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/D11-1141spa
dc.relation.referencesRosenthal, S., Farra, N., & Nakov, P. (n.d.). SemEval-2017 Task 4: Sentiment Analysis in Twitter. Retrieved from https://trends24.in/spa
dc.relation.referencesSantana Mansilla, P., Costaguta, R., & Missio, D. (2014). Aplicación de Algoritmos de Clasificación de Minería de Textos para el Reconocimiento de Habilidades de E-tutores Colaborativos. Inteligencia Artificial, 17(53), 57–67. Retrieved from http://journal.iberamia.org/spa
dc.relation.referencesSasaki, Y., & Fellow, R. (2007). The truth of the F-measure.spa
dc.relation.referencesscikit-learn user guide. (2018). Retrieved from http://scikitlearn.org/stable/_downloads/scikit-learn-docs.pdfspa
dc.relation.referencesscikit learn. (2017). Documentation scikit-learn: machine learning in Pythonscikit-learn 0.19.2 documentation. Retrieved September 3, 2018, from http://scikit-learn.org/stable/documentation.htmlspa
dc.relation.referencesShashanka, M. (2011). A FAST ALGORITHM FOR DISCRETE HMM TRAINING USING OBSERVED TRANSITIONS. East Hartford. Retrieved from http://cns.bu.edu/~mvss/stuff/ShashankaICASSP2011.pdfspa
dc.relation.referencesSrividhya, V., & Anitha, R. (2010). Evaluating Preprocessing Techniques in Text Categorization. International Journal of Computer Science and Application Issue. Retrieved from http://sinhgad.edu/ijcsa-2012/pdfpapers/1_11.pdfspa
dc.relation.referencesSucar, L. E. (2011). Redes Bayesianas. Retrieved from https://ccc.inaoep.mx/~esucar/Clases-mgp/caprb.pdfspa
dc.relation.referencesThe MathWorks Inc. (2018). MATLAB - El lenguaje del cálculo técnico - MATLAB & Simulink. Retrieved September 3, 2018, from https://la.mathworks.com/products/matlab.htmlspa
dc.relation.referencesTornero Lucas, J. (2017). Machine Learning: Modelos Ocultos de Markov (HMM) y Redes Neuronales Artificiales (ANN). Barcelona, España. Retrieved from http://diposit.ub.edu/dspace/bitstream/2445/122446/2/memoria.pdfspa
dc.relation.referencesUniversidad Nacional Mayor de San Marcos. Facultad de Ingenieria Industrial. ́ Instituto de Investigación, Oscar; Rosales López, Pedro Pablo; Salas Bacalla, J. (2010). Criterios de selección de metodologías de desarrollo de software. Industrial Data (Vol. 13). Universidad Nacional Mayor de San Marcos. Retrieved from http://www.redalyc.org/html/816/81619984009/spa
dc.relation.referencesValdivia, Eugenio Martínez Cámara, M. Teresa Martín Valdivia, José M. Perea Ortega L, A. U. L. (2011). Técnicas de clasificación de opiniones aplicadas a un corpus en español. Retrieved from http://www.booking.comspa
dc.relation.referencesVenables, W. N., & Smith, D. M. (1997). An Introduction to R Notes on R: A Programming Environment for Data Analysis and Graphics Version 3.5.1 (2018-07-02). R. Gentleman & R. Ihaka Copyright c. Retrieved from https://cran.r-project.org/doc/manuals/r-release/R-intro.pdfspa
dc.relation.referencesVenegas, R. (2007). Clasificación de textos académicos en función de su contenido léxico-semántico. Revista Signos, 40(63), 239–271. https://doi.org/10.4067/S0718-09342007000100012spa
dc.relation.referencesXiang, G., Fan, B., Wang, L., Hong, J. I., & Rose, C. P. (2012). Detecting Offensive Tweets via Topical Feature Discovery over a Large Scale Twitter Corpus. Retrieved from http://www.cs.cmu.edu/~binfan/papers/cikm12_twitter.pdfspa
dc.relation.referencesZontisa. (2018). El etiquetado gramatical o POS tagging - Zontisa Smart Technology. Retrieved September 2, 2018, from https://www.zontisa.com/eletiquetado-gramatical-o-pos-tagging/spa
dc.rightsDerechos Reservados - Universidad Católica de Colombia, 2018spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)spa
dc.rights.urihttps://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.lembINTELIGENCIA ARTIFICIALspa
dc.subject.proposalCONFLICTO ARMADOspa
dc.subject.proposalRED SOCIALspa
dc.subject.proposalAPRENDIZAJE AUTOMÁTICOspa
dc.subject.proposalINTELIGENCIA ARTIFICIALspa
dc.subject.proposalALGORITMOSspa
dc.titleAplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombianospa
dc.typeTrabajo de grado - Pregradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa
dc.type.redcolhttps://purl.org/redcol/resource_type/TPspa
dc.type.versioninfo:eu-repo/semantics/submittedVersionspa
dspace.entity.typePublication
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa
oaire.versionhttp://purl.org/coar/version/c_71e4c1898caa6e32spa
Archivos
Bloque original
Mostrando1 - 2 de 2
Cargando...
Miniatura
Nombre:
APLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf
Tamaño:
2.88 MB
Formato:
Adobe Portable Document Format
Descripción:
Cargando...
Miniatura
Nombre:
RAE.pdf
Tamaño:
207.95 KB
Formato:
Adobe Portable Document Format
Descripción: