Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

Espitia-Betancourt, César Augusto; Páramo-Lozada, Juan Pablo

Publicación:
Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

dc.contributor.advisor	Holguín-Ontiveros, Erika Paola	spa
dc.contributor.advisor	Menéndez-Mora, Raúl Ernesto	spa
dc.contributor.author	Espitia-Betancourt, César Augusto	spa
dc.contributor.author	Páramo-Lozada, Juan Pablo	spa
dc.date.accessioned	2019-01-24T13:45:03Z	spa
dc.date.available	2019-01-24T13:45:03Z	spa
dc.date.issued	2018	spa
dc.description	Trabajo de investigación	spa
dc.description.abstract	Colombia lleva alrededor de 50 años en guerra y aunque se realizo un proceso de paz, las disputas continúan entre los diferentes actores, un medio en donde se desarrollan las disputas son las redes sociales, los diferentes actores expresan sus opiniones, existen diferentes técnicas y algoritmos que permiten procesar estos textos con la finalidad de que el gobierno Colombiano tenga claridad de como se encuentra el conflicto en la actualidad y como debe proceder de una manera eficiente.	spa
dc.description.degreelevel	Pregrado	spa
dc.description.degreename	Ingeniero de Sistemas	spa
dc.description.tableofcontents	RESUMEN INTRODUCCIÓN 1. GENERALIDADES 2. ANTECEDENTES 3. PLANTEAMIENTO DEL PROBLEMA 4. OBJETIVOS 5. JUSTIFICACIÓN 6. DELIMIETACIÓN 7. MARCO REFERENCIAL 8. ESTADO DEL ARTE 9. METODOLOGIA 10. PLATAFORMAS 11. ENTORNOS 12. ALGORITMOS 13. HISTORIAS DE USUARIO 14. DESARROLLO DEL COMPONENTE 15. RESULTADOS 16. CONCLUSIONES 17. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOS	spa
dc.format.mimetype	application/pdf	spa
dc.identifier.citation	Espitia-Betancourt, C. A. & Páramo-Lozada, J. P. (2018). Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombia	spa
dc.identifier.uri	https://hdl.handle.net/10983/22546	spa
dc.language.iso	spa	spa
dc.publisher.faculty	Facultad de Ingeniería	spa
dc.publisher.program	Ingeniería de Sistemas y Computación	spa
dc.relation.references	Adam Marcus y Eugene Wu. (2012). Text Processing Overview	spa
dc.relation.references	Arcila-Calderón, C., Barbosa-Caro, E., & Cabezuelo-Lorenzo, F. (2016). Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística. El Profesional de La Información, 25(4), 623. https://doi.org/10.3145/epi.2016.jul.12	spa
dc.relation.references	Bakeman, R., McArthur, D., Quera, V., & Robinson, B. F. (2014). Kappa. Psychological Methods, 2(4), 357–370. https://doi.org/10.1037/1082-989X.2.4.357	spa
dc.relation.references	Barve, A., Rahate, M., Gaikwad, A., & Patil, P. (2018). Terror Attack Identifier: Classify using KNN, SVM, Random Forest algorithm and alert through messages. International Research Journal of Engineering and Technology, 4. Retrieved from www.irjet.net	spa
dc.relation.references	Bifet, A., & Frank, E. (n.d.-a). Sentiment Knowledge Discovery in Twitter Streaming Data. Retrieved from https://www.cs.waikato.ac.nz/ml/publications/2010/Twitter-crc.pdf	spa
dc.relation.references	Bifet, A., & Frank, E. (n.d.-b). Sentiment Knowledge Discovery in Twitter Streaming Data.	spa
dc.relation.references	Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2016). WEKA Manual for Version 3-8-0.	spa
dc.relation.references	Cambronero, C. G., & Moreno, I. G. (2010). ALGORITMOS DE APRENDIZAJE: KNN & KMEANS. Madrid. Retrieved from http://blogs.ujaen.es/barranco/wp-content/uploads/2012/02/Algoritmos-deaprendizaje-knn-y-kmeans.pdf	spa
dc.relation.references	Centro Nacional de Información de Ciencias Médicas., E., & Cabrera-Gato, J. E. (2007). Minería de textos: Una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED (Vol. 16). 2000, Editorial Ciencias Médicas. Retrieved from http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024- 94352007001000005	spa
dc.relation.references	Corso, I., & Lorena, C. (2010). Aplicación de algoritmos de clasificación supervisada usando Weka.	spa
dc.relation.references	De Mauro, A., Greco, M., & Grimaldi, M. (2015). What is big data ? A consensual definition and a review of key research topics. Big Data Comput. Sci. Eng, 1644, 9. https://doi.org/10.1063/1.4907823	spa
dc.relation.references	Del Pilar, A., & Robles, A. (2017). ANÁLISIS DE EFECTIVIDAD AL IMPLEMENTAR LA TÉCNICA DE ÁRBOLES DE DECISIÓN DEL ENFOQUE DE APRENDIZAJE DE MÁQUINA PARA LA DETERMINACIÓN DE AVALÚOS MASIVOS PARA LAS UPZ 79 CALANDAIMA, 65 ARBORIZADORA Y 73 GARCÉS NAVAS. Retrieved from http://repository.udistrital.edu.co/bitstream/11349/5779/1/AlbancandoRoblesAdrianaDelPilar2017.pdf	spa
dc.relation.references	Diccionario Cambridge. (2018). Tweet	spa
dc.relation.references	Dong, L., Wei, F., Tan, C., Tang, D., Zhou, M., & Xu, K. (n.d.). Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/P14-2009	spa
dc.relation.references	Escortell Pérez, A., Giménez Fayos, M., & Rosso, P. (2017). The Impact of Emotions on Polarity Analysis using Figurative Language in Twitter, 8. Retrieved from http://alt.qcri.org/semeval2015/task11/	spa
dc.relation.references	Figuerola, C. G., Alonso Berrocal, J. L., Zazo Rodríguez, Á. F., & Rodríguez, E. (2004). Algunas Técnicas de Clasificación Automática de Documentos. Página, 15, 10. Retrieved from https://core.ac.uk/download/pdf/153334293.pdf	spa
dc.relation.references	Frank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016a). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques" Retrieved from https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf	spa
dc.relation.references	Frank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016b). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques"	spa
dc.relation.references	Gálvez, C. (2008). MINERÍA DE TEXTOS: LA NUEVA GENERACIÓN DE ANÁLISIS DE LITERATURA CIENTÍFICA EN BIOLOGÍA MOLECULAR Y GENÓMICA, 14. Retrieved from https://doi.org/10.5007/1518-2924.2008v13n25p1	spa
dc.relation.references	Hosmer, D. W., & Lemeshow Stanley. (1989). Applied logistic regression. Retrieved from http://resource.heartonline.cn/20150528/1_3kOQSTg.pdf	spa
dc.relation.references	KDnuggets. (2017). A General Approach to Preprocessing Text Data. Retrieved September 19, 2018, from https://www.kdnuggets.com/2017/12/generalapproach-preprocessing-text-data.html	spa
dc.relation.references	Kuhn, M. (2018). The caret Package. Retrieved September 3, 2018, from http://topepo.github.io/caret/index.html	spa
dc.relation.references	Kusner, M. J., Sun, Y., Kolkin, N. I., & Weinberger, K. Q. (2015). From Word Embeddings To Document Distances. Retrieved fromhttp://proceedings.mlr.press/v37/kusnerb15.pdf	spa
dc.relation.references	Le, Q., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Retrieved from https://cs.stanford.edu/~quocle/paragraph_vector.pdf	spa
dc.relation.references	Letelier, P., & Penadés, M. C. (2006). Métodologías ágiles para el desarrollo de software: eXtreme Programming (XP). Retrieved from www.agileuniverse.com.	spa
dc.relation.references	Levy, O., Goldberg, Y., & Dagan, I. (2015). Improving Distributional Similarity with Lessons Learned from Word Embeddings. Ramat Gan, Israel. Retrieved from https://www.transacl.org/ojs/index.php/tacl/article/view/570	spa
dc.relation.references	Los Modelos Geométricos (Modelos parte I). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/09/los-modelosgeometricos-modelos-parte-i/	spa
dc.relation.references	Miguel Ángel Vallejo Pareja. (2006). MINDFULNESS. Retrieved from http://www.redalyc.org/html/778/77827204/	spa
dc.relation.references	Modelos Logicos (Modelos parte 3). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/23/modelos-logicos-modelosparte-3/	spa
dc.relation.references	Modelos Probabilísticos (Modelos parte 2). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/12/modelosprobabilisticos-modelos-parte-2/	spa
dc.relation.references	Pascual, D., Pla, F., & Sánchez, S. (n.d.). Algoritmos de agrupamiento. Retrieved from http://marmota.dlsi.uji.es/WebBIB/papers/2007/1_Pascual-MIA-2007.pdf	spa
dc.relation.references	Patil, T. R., & Sherekar, M. S. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal Of Computer Science And Applications, 6(2), 256–261. Retrieved from http://www.cs.bme.hu/~kiskat/adatb/bank-data	spa
dc.relation.references	Paute, D. J., Soroa, A., & López, O. (2016). ANÁLISIS Y CLASIFICACIÓN DE INFORMACIÓN MEDIÁTICA ELECTORAL UTILIZANDO MINERÍA DE TEXTO. Retrieved from https://addi.ehu.es/bitstream/handle/10810/19300/TesisFinal_26092016.pdf?sequence=1&isAllowed=y	spa
dc.relation.references	Pérez Abelleira, A., & Cardoso, C. A. (2010). Minería de texto para la categorización automática de documentos (Vol. 5). Salta, Argentina. Retrieved from http://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-aliciaarticulo-cuadernos-formateado.pdf	spa
dc.relation.references	Radio, C. (2017). De las balas a los votos. Retrieved from http://caracol.com.co/radio/2017/11/24/nacional/1511492119_078663.html	spa
dc.relation.references	Rangra, K., & Bansal Research Scholar Professor, K. L. (2014). Comparative Study of Data Mining Tools. International Journal of Advanced Research in Computer Science and Software Engineering (Vol. 4). Retrieved from www.rproject.org	spa
dc.relation.references	RapidMiner. (2014). RapidMiner Studio Manual. Retrieved from https://docs.rapidminer.com/downloads/RapidMiner-v6-user-manual.pdf	spa
dc.relation.references	Ratinov, L., & Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Urbana, USA. Retrieved from http://l2r.cs.uiuc.edu/	spa
dc.relation.references	Repaso didáctico sobre machine learning. (n.d.). Retrieved September 30, 2018, from https://lapastillaroja.net/2015/02/ml-algols/	spa
dc.relation.references	Reyes-Ortiz, J. A., Paniagua-Reyes, F., & Sánchez, L. (2017). Mining of Opinions Centered on Topics Using Short Texts in Spanish. Research in Computing Science (Vol. 134). Ciudad de México, México. Retrieved from http://www.rcs.cic.ipn.mx/rcs/2017_134/Mineria de opiniones centrada en topicos usando textos cortos en espanol.pdf	spa
dc.relation.references	Ritter, A., Clark, S., & Etzioni, O. (2011). Named Entity Recognition in Tweets: An Experimental Study. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/D11-1141	spa
dc.relation.references	Rosenthal, S., Farra, N., & Nakov, P. (n.d.). SemEval-2017 Task 4: Sentiment Analysis in Twitter. Retrieved from https://trends24.in/	spa
dc.relation.references	Santana Mansilla, P., Costaguta, R., & Missio, D. (2014). Aplicación de Algoritmos de Clasificación de Minería de Textos para el Reconocimiento de Habilidades de E-tutores Colaborativos. Inteligencia Artificial, 17(53), 57–67. Retrieved from http://journal.iberamia.org/	spa
dc.relation.references	Sasaki, Y., & Fellow, R. (2007). The truth of the F-measure.	spa
dc.relation.references	scikit-learn user guide. (2018). Retrieved from http://scikitlearn.org/stable/_downloads/scikit-learn-docs.pdf	spa
dc.relation.references	scikit learn. (2017). Documentation scikit-learn: machine learning in Pythonscikit-learn 0.19.2 documentation. Retrieved September 3, 2018, from http://scikit-learn.org/stable/documentation.html	spa
dc.relation.references	Shashanka, M. (2011). A FAST ALGORITHM FOR DISCRETE HMM TRAINING USING OBSERVED TRANSITIONS. East Hartford. Retrieved from http://cns.bu.edu/~mvss/stuff/ShashankaICASSP2011.pdf	spa
dc.relation.references	Srividhya, V., & Anitha, R. (2010). Evaluating Preprocessing Techniques in Text Categorization. International Journal of Computer Science and Application Issue. Retrieved from http://sinhgad.edu/ijcsa-2012/pdfpapers/1_11.pdf	spa
dc.relation.references	Sucar, L. E. (2011). Redes Bayesianas. Retrieved from https://ccc.inaoep.mx/~esucar/Clases-mgp/caprb.pdf	spa
dc.relation.references	The MathWorks Inc. (2018). MATLAB - El lenguaje del cálculo técnico - MATLAB & Simulink. Retrieved September 3, 2018, from https://la.mathworks.com/products/matlab.html	spa
dc.relation.references	Tornero Lucas, J. (2017). Machine Learning: Modelos Ocultos de Markov (HMM) y Redes Neuronales Artificiales (ANN). Barcelona, España. Retrieved from http://diposit.ub.edu/dspace/bitstream/2445/122446/2/memoria.pdf	spa
dc.relation.references	Universidad Nacional Mayor de San Marcos. Facultad de Ingenieria Industrial. ́ Instituto de Investigación, Oscar; Rosales López, Pedro Pablo; Salas Bacalla, J. (2010). Criterios de selección de metodologías de desarrollo de software. Industrial Data (Vol. 13). Universidad Nacional Mayor de San Marcos. Retrieved from http://www.redalyc.org/html/816/81619984009/	spa
dc.relation.references	Valdivia, Eugenio Martínez Cámara, M. Teresa Martín Valdivia, José M. Perea Ortega L, A. U. L. (2011). Técnicas de clasificación de opiniones aplicadas a un corpus en español. Retrieved from http://www.booking.com	spa
dc.relation.references	Venables, W. N., & Smith, D. M. (1997). An Introduction to R Notes on R: A Programming Environment for Data Analysis and Graphics Version 3.5.1 (2018-07-02). R. Gentleman & R. Ihaka Copyright c. Retrieved from https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf	spa
dc.relation.references	Venegas, R. (2007). Clasificación de textos académicos en función de su contenido léxico-semántico. Revista Signos, 40(63), 239–271. https://doi.org/10.4067/S0718-09342007000100012	spa
dc.relation.references	Xiang, G., Fan, B., Wang, L., Hong, J. I., & Rose, C. P. (2012). Detecting Offensive Tweets via Topical Feature Discovery over a Large Scale Twitter Corpus. Retrieved from http://www.cs.cmu.edu/~binfan/papers/cikm12_twitter.pdf	spa
dc.relation.references	Zontisa. (2018). El etiquetado gramatical o POS tagging - Zontisa Smart Technology. Retrieved September 2, 2018, from https://www.zontisa.com/eletiquetado-gramatical-o-pos-tagging/	spa
dc.rights	Derechos Reservados - Universidad Católica de Colombia, 2018	spa
dc.rights.accessrights	info:eu-repo/semantics/openAccess	spa
dc.rights.creativecommons	Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)	spa
dc.rights.uri	https://creativecommons.org/licenses/by-nc/4.0/	spa
dc.subject.lemb	INTELIGENCIA ARTIFICIAL	spa
dc.subject.proposal	CONFLICTO ARMADO	spa
dc.subject.proposal	RED SOCIAL	spa
dc.subject.proposal	APRENDIZAJE AUTOMÁTICO	spa
dc.subject.proposal	INTELIGENCIA ARTIFICIAL	spa
dc.subject.proposal	ALGORITMOS	spa
dc.title	Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano	spa
dc.type	Trabajo de grado - Pregrado	spa
dc.type.coar	http://purl.org/coar/resource_type/c_7a1f	spa
dc.type.content	Text	spa
dc.type.driver	info:eu-repo/semantics/bachelorThesis	spa
dc.type.redcol	https://purl.org/redcol/resource_type/TP	spa
dc.type.version	info:eu-repo/semantics/submittedVersion	spa
dspace.entity.type	Publication
oaire.accessrights	http://purl.org/coar/access_right/c_abf2	spa
oaire.version	http://purl.org/coar/version/c_71e4c1898caa6e32	spa

Archivos

Bloque original

Mostrando1 - 2 de 2

Nombre:: APLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf
Tamaño:: 2.88 MB
Formato:: Adobe Portable Document Format
Descripción:

Repositorio Institucional Universidad Católica de Colombia - RIUCaC

Publicación:
Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

Archivos

Bloque original

Colecciones

Normatividad Institucional

Servicios

Contacto y Sedes

Publicación: Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

Archivos

Bloque original

Colecciones

Normatividad Institucional

Servicios

Contacto y Sedes

Publicación:
Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano