Para este ejercicio, podemos definir el análisis de sentimientos como el proceso en el que mediante un algoritmo se asocia un sentimiento -alegría o tristeza- o una categoría -apoyo o rechazo- a un texto, audio o imagen. En nuestro caso utilizaremos las opiniones vertidas por las personas en las distintas encuestas que el Centro de Estudios Ciudadanos de la Universidad Francisco Gavidia ha llevado a cabo en el año 2018 y la reciente encuesta de enero 2019.
Existen muchos recursos para la detección de sentimientos, muchos artículos sobre la materia y software de código abierto especializado que implementan algoritmos sumamente complejos para la detección de sentimientos; en nuestro caso utilizamos el software estadístico libre “R”, que es muy rico y versátil.
Para esta implementación nos basaremos en la frecuencia en la que palabras positivas o negativas aparecen en las opiniones vertidas por las personas entrevistadas en los diferentes sondeos de opinión. Para esto utilizamos un archivo de cerca de 3 mil palabras que son consideradas negativas y un archivo de cerca de 2 mil palabras que son consideradas positivas (adaptación al español de la base de datos “opinión-lexicon-English”).
A través de una métrica matemática adaptada para comparar palabras, se ha construido un algoritmo en el software “R”, que realiza minería de texto y compara las opiniones dichas por los entrevistados con las palabras en los archivos de palabras positivas y negativas, y regresa la cuenta de la cantidad de palabras positivas y negativas encontradas en dichas opiniones. Luego ocupando las bondades de visualización de datos del software “R”, se utiliza el paquete ggplot2 para graficar dichas métricas.