16 April, 2025 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Ingeotext: análisis de textos con inteligencia artificial

Por Ricardo Capilla

Ciudad de México.  (Agencia Informativa Conacyt).- El grupo de investigación Ingeotec, conformado por investigadores Cátedras Conacyt pertenecientes al Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec) y al Centro de Investigación en Ciencias de Información Geoespacial (Centrogeo), desarrolló Ingeotext, un conjunto de herramientas que utilizan técnicas de inteligencia artificial para la categorización de textos de manera automática.

Este desarrollo realizado por el grupo Ingeotec consta de algoritmos que aprenden las características de las categorías involucradas a partir de una serie de ejemplos de las mismas. Una vez que los algoritmos aprenden a identificar el contenido de los textos, estos son capaces de clasificar nuevos textos dentro de las categorías aprendidas, explicó el doctor Mario Graff Guerrero, doctor en ciencias computacionales.

Para lograr esto se utilizan las herramientas microTC y B4MSA, desarrolladas también por el grupo de investigación, que se encargan de buscar, entre billones de posibles configuraciones, el modelo que mejor se adapte a la tarea. Sin embargo, este procedimiento considera un solo tipo de conocimiento o fuente de datos a la vez, por ello los investigadores desarrollaron EvoMSA, una herramienta que es capaz de combinar diferentes fuentes de información para generar un modelo más complejo.

Aplicaciones

Estas herramientas pueden utilizarse de una forma muy variada y en diferentes idiomas, por ejemplo para categorizar los textos como humorísticos, agresivos, si son de un tópico en particular, entre otros, hasta para ayudar a identificar amenazas potenciales dentro de las redes sociales.

“Las técnicas que hemos desarrollado son independientes del idioma y pueden aplicarse a cualquier tipo de texto, pero por facilidad las hemos probado en Twitter, ya que es muy fácil acceder a los tuits públicos. Las hemos probado en español, inglés, árabe, ruso, portugués, alemán, sueco y otros idiomas”, puntualizó el doctor Mario Graff.

1-ingeotecju0718.jpgAsimismo, explicó que estos algoritmos pueden utilizarse en distintos idiomas gracias a que solo se toman en cuenta los elementos más básicos del lenguaje escrito, es decir, las palabras y los caracteres que las componen, haciendo posible que no se requiera conocer a fondo la estructura de un lenguaje en particular.

Como ejemplo, mencionó que los algoritmos pueden ser entrenados para que identifiquen a personas que acosan a menores en las redes sociales. Dadas las características de los mensajes escritos por una de estas personas, el algoritmo puede identificar su edad aproximada y palabras clave que puedan indicar que existe un tipo de acoso.

Los algoritmos de Ingeotext se han aplicado a la red social Twitter, en donde se pudieron identificar mensajes con contenido agresivo y misógino, así como también emociones. En este último caso, este desarrollo se podría utilizar para analizar las publicaciones que hace una persona e identificar si está deprimida, si presenta tendencias suicidas o si sufre de anorexia, de acuerdo con la doctora Daniela Moctezuma Ochoa, doctora en tecnologías de la información y sistemas informáticos e investigadora cátedra Conacyt asignada a Centrogeo.

El grupo Ingeotec ha sido galardonado por este desarrollo en diferentes competencias. En 2018, participaron en dos talleres de la Sociedad Española de Procesamiento de Lenguaje Natural (SEPLN), donde obtuvieron el primer lugar en la tarea de Análisis de humor basado en anotación humana (HAHA, por sus siglas en inglés), mientras que en la tarea de Análisis de la autoría y agresividad en Twitter: estudio de caso en el español mexicano (MEX-A3T, por sus siglas en inglés), obtuvieron el primer lugar en detección de agresividad y el tercero en perfilado de usuarios.

En el segundo taller, titulado Taller de Análisis Semántico (TASS Tarea-4), obtuvieron el primer lugar al conseguir el mayor puntaje en la tarea cuyo objetivo era determinar si un texto comunicaba buenas o malas noticias.

Asimismo, el grupo participó en la Conferencia y Laboratorios del Foro de Evaluación, organización que promueve la investigación, innovación y desarrollo de sistemas de acceso de información plurilingüe y multimodal, en donde alcanzaron el tercer lugar en una serie de pruebas cuyo objetivo fue realizar perfilado de usuarios multimodal en los idiomas árabe, inglés y español.

Siguiendo la idea de que la ciencia debe ser abierta, las herramientas generadas por este grupo de catedráticos Conacyt están a disposición del público a través de su página en GitHub, en donde los interesados en el tema pueden descargarlas y hacer uso de ellas, además se pueden consultar los artículos científicos asociados a estas herramientas.

1-geotec0718.jpg

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Método Wolbachia para control del dengue, zika y chikungunya

11 agosto, 2018

11 agosto, 2018

Por Joel Cosío La Paz, Baja California Sur.  (Agencia Informativa Conacyt).- La Secretaría de Salud del estado de Baja California Sur...

Estudiantes de la FCQ UASLP producen bebida vegetal a base de garbanzo

22 junio, 2018

22 junio, 2018

María Fernanda Contreras Mendioza estudiante de la carrera de Ingeniero en Alimentos que se imparte en la Facultad de Ciencias...

Científico mexicano participa de la primera secuenciación del genoma de un connacional con una enfermedad genética rara

26 octubre, 2016

26 octubre, 2016

El estudio lo realizó la Universidad de Harvard, y en el cual colaboró el genetista yucateco basado en Escocia donde...

Empresa mexicana crea tecnología que posibilita nuevo método para detectar cáncer cervicouterino

17 julio, 2017

17 julio, 2017

Se obtiene un diagnóstico temprano, preciso, no invasivo, en menos tiempo y a bajo costo Investigadores mexicanos diseñaron y desarrollaron...

Realidad virtual colaborativa para la educación

17 enero, 2019

17 enero, 2019

Por Israel Pérez Valencia Santiago de Querétaro, Querétaro.  (Agencia Informativa Conacyt).- Con el objetivo de maximizar los procesos de enseñanza...

Ruido sináptico, el bombardeo eléctrico que hace funcionar las neuronas

11 marzo, 2017

11 marzo, 2017

Por Amapola Nava Ciudad de México.  (Agencia Informativa Conacyt).- Las neuronas son células capaces de comunicarse mediante señales eléctricas. Pero este...

Crean el Laboratorio Nacional del Agua en el IPN

18 junio, 2017

18 junio, 2017

Por Janet Cacelín Ciudad de México.  (Agencia Informativa Conacyt).- En el año 2014, cada habitante tenía disponible tres mil 736...

Optimizan politécnicos función de las sillas de ruedas eléctricas

20 junio, 2018

20 junio, 2018

Estudiantes del CECyT 7 “Cuauhtémoc adaptaron un panel solar al prototipo para aumentar la vida y eficiencia de la batería...

Entre las neurociencias y el arte

5 septiembre, 2018

5 septiembre, 2018

Por Aketzalli González Ciudad de México.  (Agencia Informativa Conacyt).- Mostrar la relación entre neurociencias y arte simboliza un viaje interdisciplinario y...

Con desechos de agave, politécnico crea empaques inteligentes

9 septiembre, 2016

9 septiembre, 2016

Es un polímero comestible que puede colocarse en los alimentos y a partir de indicadores de pH situados en las...

Promueven uso y diseño de software libre en Querétaro

5 mayo, 2016

5 mayo, 2016

AUTOR: Israel Pérez Valencia FUENTE:  AGENCIA INFORMATIVA CONACYT Santiago de Querétaro, Querétaro.  (Agencia Informativa Conacyt).- Con la finalidad de promover el uso...

Desarrollan brazalete para personas con ceguera

6 agosto, 2018

6 agosto, 2018

Por Francisco Torres Monterrey, Nuevo León.  (Agencia Informativa Conacyt).- Bajo la dirección de la investigadora Sofía Luna Rodríguez, un grupo de...

Instala CICESE estación gravimétrica en Nayarit

20 junio, 2016

20 junio, 2016

AUTOR: Claudia Karina Gómez   FUENTE: CONACYT, AGENCIA INFORMATIVA CONACYT Tepic, Nayarit.  (Agencia Informativa Conacyt).- El efecto que ejerce la gravedad sobre...

Buscan politécnicos independencia tecnológica con simulador de vuelo

15 marzo, 2017

15 marzo, 2017

INSTITUTO POLÍTECNICO NACIONAL COMUNICADO DE PRENSA C-155 El prototipo desarrollado en el Cidetec, costaría una tercera parte del costo de...

TOYOTA CREA PIERNA ROBÓTICA PARA PERSONAS CON PARÁLISIS

21 abril, 2017

21 abril, 2017

Fuente: Mundo Ejecutivo, www.mundoejecutivo.com.mx Toyota presentó una estructura robótica de soporte diseñada para ayudar a caminar a personas con parálisis...