15 January, 2025 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Ingeotext: análisis de textos con inteligencia artificial

Por Ricardo Capilla

Ciudad de México.  (Agencia Informativa Conacyt).- El grupo de investigación Ingeotec, conformado por investigadores Cátedras Conacyt pertenecientes al Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec) y al Centro de Investigación en Ciencias de Información Geoespacial (Centrogeo), desarrolló Ingeotext, un conjunto de herramientas que utilizan técnicas de inteligencia artificial para la categorización de textos de manera automática.

Este desarrollo realizado por el grupo Ingeotec consta de algoritmos que aprenden las características de las categorías involucradas a partir de una serie de ejemplos de las mismas. Una vez que los algoritmos aprenden a identificar el contenido de los textos, estos son capaces de clasificar nuevos textos dentro de las categorías aprendidas, explicó el doctor Mario Graff Guerrero, doctor en ciencias computacionales.

Para lograr esto se utilizan las herramientas microTC y B4MSA, desarrolladas también por el grupo de investigación, que se encargan de buscar, entre billones de posibles configuraciones, el modelo que mejor se adapte a la tarea. Sin embargo, este procedimiento considera un solo tipo de conocimiento o fuente de datos a la vez, por ello los investigadores desarrollaron EvoMSA, una herramienta que es capaz de combinar diferentes fuentes de información para generar un modelo más complejo.

Aplicaciones

Estas herramientas pueden utilizarse de una forma muy variada y en diferentes idiomas, por ejemplo para categorizar los textos como humorísticos, agresivos, si son de un tópico en particular, entre otros, hasta para ayudar a identificar amenazas potenciales dentro de las redes sociales.

“Las técnicas que hemos desarrollado son independientes del idioma y pueden aplicarse a cualquier tipo de texto, pero por facilidad las hemos probado en Twitter, ya que es muy fácil acceder a los tuits públicos. Las hemos probado en español, inglés, árabe, ruso, portugués, alemán, sueco y otros idiomas”, puntualizó el doctor Mario Graff.

1-ingeotecju0718.jpgAsimismo, explicó que estos algoritmos pueden utilizarse en distintos idiomas gracias a que solo se toman en cuenta los elementos más básicos del lenguaje escrito, es decir, las palabras y los caracteres que las componen, haciendo posible que no se requiera conocer a fondo la estructura de un lenguaje en particular.

Como ejemplo, mencionó que los algoritmos pueden ser entrenados para que identifiquen a personas que acosan a menores en las redes sociales. Dadas las características de los mensajes escritos por una de estas personas, el algoritmo puede identificar su edad aproximada y palabras clave que puedan indicar que existe un tipo de acoso.

Los algoritmos de Ingeotext se han aplicado a la red social Twitter, en donde se pudieron identificar mensajes con contenido agresivo y misógino, así como también emociones. En este último caso, este desarrollo se podría utilizar para analizar las publicaciones que hace una persona e identificar si está deprimida, si presenta tendencias suicidas o si sufre de anorexia, de acuerdo con la doctora Daniela Moctezuma Ochoa, doctora en tecnologías de la información y sistemas informáticos e investigadora cátedra Conacyt asignada a Centrogeo.

El grupo Ingeotec ha sido galardonado por este desarrollo en diferentes competencias. En 2018, participaron en dos talleres de la Sociedad Española de Procesamiento de Lenguaje Natural (SEPLN), donde obtuvieron el primer lugar en la tarea de Análisis de humor basado en anotación humana (HAHA, por sus siglas en inglés), mientras que en la tarea de Análisis de la autoría y agresividad en Twitter: estudio de caso en el español mexicano (MEX-A3T, por sus siglas en inglés), obtuvieron el primer lugar en detección de agresividad y el tercero en perfilado de usuarios.

En el segundo taller, titulado Taller de Análisis Semántico (TASS Tarea-4), obtuvieron el primer lugar al conseguir el mayor puntaje en la tarea cuyo objetivo era determinar si un texto comunicaba buenas o malas noticias.

Asimismo, el grupo participó en la Conferencia y Laboratorios del Foro de Evaluación, organización que promueve la investigación, innovación y desarrollo de sistemas de acceso de información plurilingüe y multimodal, en donde alcanzaron el tercer lugar en una serie de pruebas cuyo objetivo fue realizar perfilado de usuarios multimodal en los idiomas árabe, inglés y español.

Siguiendo la idea de que la ciencia debe ser abierta, las herramientas generadas por este grupo de catedráticos Conacyt están a disposición del público a través de su página en GitHub, en donde los interesados en el tema pueden descargarlas y hacer uso de ellas, además se pueden consultar los artículos científicos asociados a estas herramientas.

1-geotec0718.jpg

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Investigadores de la BUAP crean sistema de identificación por medio de voz

2 mayo, 2017

2 mayo, 2017

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx • El modelo puede ser utilizado como mecanismo...

Universitarios crean híbrido de chayote contra el cáncer

26 julio, 2018

26 julio, 2018

El extracto crudo es agente antitumoral que no daña las células normales Tras 10 años de investigación, académicos de la...

Nutrilete: un sistema web para consultas de nutrición

27 julio, 2018

27 julio, 2018

Por Érika Rodríguez Zacatecas, Zacatecas. (Agencia Informativa Conacyt).- “La última vez que visité a mi nutrióloga, tardó cerca de una...

Desarrolla CICESE interfaz cerebro-computadora

13 marzo, 2017

13 marzo, 2017

Por Karla Navarro Ensenada, Baja California.  (Agencia Informativa Conacyt).- Gustavo Olague Caballero, investigador del Departamento de Ciencias de la Computación del Centro...

Mexicana crea en la Gran Bretaña cerámicas que convierten el calor en energía eléctrica

8 febrero, 2016

8 febrero, 2016

Por Agencia ID * Diana Talía Álvarez Ruiz, originaria de Chiapas, moldea la composición química del material y el proceso...

Obtienen dos patentes científicos mexicanos por desarrollos que descontaminan el agua mediante la energía solar

22 marzo, 2018

22 marzo, 2018

Ambos han comprobado su efectividad en comunidades tarahumaras, donde el uso de cloro como desinfectante (descontaminante) no es aceptado El...

POSTULA TU INNOVACIÓN Y GANA 50 MIL DÓLARES

28 marzo, 2016

28 marzo, 2016

Comparte tu opinión sobre este artículo Comentarios

Crean biblioteca digital que engloba 100 mil horas de audio, video e imágenes de la cultura mexicana

3 febrero, 2016

3 febrero, 2016

Investigadores de México y Francia están por concretar poderoso software que lo llevará a cabo, pues en el país no...

Química verde, del laboratorio al quirófano

28 noviembre, 2016

28 noviembre, 2016

Saltillo, Coahuila. (Agencia Informativa Conacyt).- Científicos del Cuerpo Académico de Química Orgánica en la Facultad de Ciencias Químicas (FCQ), de la...

Niño de primaria crea removedor de graffiti a base de nopal

31 agosto, 2017

31 agosto, 2017

El logro del niño de 11 años fue probado ya con éxito Jayro Díaz Hernández, de once años, creó un...

Un viaje al mundo de los materiales en el Cimav

8 diciembre, 2018

8 diciembre, 2018

Por Ricardo Capilla Vilchis Ciudad de México.  (Agencia Informativa Conacyt).- El Centro de Investigaciones en Materiales Avanzados (Cimav) busca acercar...

Jóvenes apuestan por la tecnología para combatir la inseguridad

15 abril, 2019

15 abril, 2019

HackLeón 2019 reunió a 350 personas entre participantes, mentores, líderes en el tema de seguridad del municipio de León, para generar ideas que permitieran atender la inseguridad.

. Nuevos proyectos de vivienda en México podrían tener el sello IBERO Puebla

25 agosto, 2017

25 agosto, 2017

UNIVERSIDAD IBEROAMERICANA PUEBLA Boletín de Prensa DCI 17-122 Jueves 3 de agosto de 2017   Con propuestas innovadoras de construcción alumnos...

Politécnicos construyen aeronave no tripulada a partir de madera balsa

7 agosto, 2017

7 agosto, 2017

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx Su estructura y diseño es similar a la...

Neurosoft, una aplicación para conectarse con el mundo

9 diciembre, 2016

9 diciembre, 2016

La Paz, Baja California Sur. (Agencia Informativa Conacyt).- Un grupo de estudiantes de la Universidad Autónoma de Baja California Sur (UABCS)...