Ingeotext: análisis de textos con inteligencia artificial

Por Ricardo Capilla

Ciudad de México. (Agencia Informativa Conacyt).- El grupo de investigación Ingeotec, conformado por investigadores Cátedras Conacyt pertenecientes al Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec) y al Centro de Investigación en Ciencias de Información Geoespacial (Centrogeo), desarrolló Ingeotext, un conjunto de herramientas que utilizan técnicas de inteligencia artificial para la categorización de textos de manera automática.

Este desarrollo realizado por el grupo Ingeotec consta de algoritmos que aprenden las características de las categorías involucradas a partir de una serie de ejemplos de las mismas. Una vez que los algoritmos aprenden a identificar el contenido de los textos, estos son capaces de clasificar nuevos textos dentro de las categorías aprendidas, explicó el doctor Mario Graff Guerrero, doctor en ciencias computacionales.

Para lograr esto se utilizan las herramientas microTC y B4MSA, desarrolladas también por el grupo de investigación, que se encargan de buscar, entre billones de posibles configuraciones, el modelo que mejor se adapte a la tarea. Sin embargo, este procedimiento considera un solo tipo de conocimiento o fuente de datos a la vez, por ello los investigadores desarrollaron EvoMSA, una herramienta que es capaz de combinar diferentes fuentes de información para generar un modelo más complejo.

Aplicaciones

Estas herramientas pueden utilizarse de una forma muy variada y en diferentes idiomas, por ejemplo para categorizar los textos como humorísticos, agresivos, si son de un tópico en particular, entre otros, hasta para ayudar a identificar amenazas potenciales dentro de las redes sociales.

“Las técnicas que hemos desarrollado son independientes del idioma y pueden aplicarse a cualquier tipo de texto, pero por facilidad las hemos probado en Twitter, ya que es muy fácil acceder a los tuits públicos. Las hemos probado en español, inglés, árabe, ruso, portugués, alemán, sueco y otros idiomas”, puntualizó el doctor Mario Graff.

Asimismo, explicó que estos algoritmos pueden utilizarse en distintos idiomas gracias a que solo se toman en cuenta los elementos más básicos del lenguaje escrito, es decir, las palabras y los caracteres que las componen, haciendo posible que no se requiera conocer a fondo la estructura de un lenguaje en particular.

Como ejemplo, mencionó que los algoritmos pueden ser entrenados para que identifiquen a personas que acosan a menores en las redes sociales. Dadas las características de los mensajes escritos por una de estas personas, el algoritmo puede identificar su edad aproximada y palabras clave que puedan indicar que existe un tipo de acoso.

Los algoritmos de Ingeotext se han aplicado a la red social Twitter, en donde se pudieron identificar mensajes con contenido agresivo y misógino, así como también emociones. En este último caso, este desarrollo se podría utilizar para analizar las publicaciones que hace una persona e identificar si está deprimida, si presenta tendencias suicidas o si sufre de anorexia, de acuerdo con la doctora Daniela Moctezuma Ochoa, doctora en tecnologías de la información y sistemas informáticos e investigadora cátedra Conacyt asignada a Centrogeo.

El grupo Ingeotec ha sido galardonado por este desarrollo en diferentes competencias. En 2018, participaron en dos talleres de la Sociedad Española de Procesamiento de Lenguaje Natural (SEPLN), donde obtuvieron el primer lugar en la tarea de Análisis de humor basado en anotación humana (HAHA, por sus siglas en inglés), mientras que en la tarea de Análisis de la autoría y agresividad en Twitter: estudio de caso en el español mexicano (MEX-A3T, por sus siglas en inglés), obtuvieron el primer lugar en detección de agresividad y el tercero en perfilado de usuarios.

En el segundo taller, titulado Taller de Análisis Semántico (TASS Tarea-4), obtuvieron el primer lugar al conseguir el mayor puntaje en la tarea cuyo objetivo era determinar si un texto comunicaba buenas o malas noticias.

Asimismo, el grupo participó en la Conferencia y Laboratorios del Foro de Evaluación, organización que promueve la investigación, innovación y desarrollo de sistemas de acceso de información plurilingüe y multimodal, en donde alcanzaron el tercer lugar en una serie de pruebas cuyo objetivo fue realizar perfilado de usuarios multimodal en los idiomas árabe, inglés y español.

Siguiendo la idea de que la ciencia debe ser abierta, las herramientas generadas por este grupo de catedráticos Conacyt están a disposición del público a través de su página en GitHub, en donde los interesados en el tema pueden descargarlas y hacer uso de ellas, además se pueden consultar los artículos científicos asociados a estas herramientas.

Comparte tu opinión sobre este artículo

Comentarios

Aplicaciones

Comparte tu opinión sobre este artículo

Entradas recientes

Llegaron las gomitas antiestrés, una creación de estudiantes del Tec de Monterrey

Revelan patente de Microsoft de computadora plegable

Buscan protección intelectual de diseños de mujeres indígenas

Alistan empresas patentes de marihuana

Presentan auto que funciona con agua salada, ¿es el fin de la gasolina?

Apuesta Jalisco con organismo a ser puntero en protección a propiedad intelectual

Avanza China en materia de propiedad intelectual; impulsan desarrollo integral

Elaboran alumnas mexicanas un helado para diabéticos

Crean jóvenes leoneses zapatos de sargazo

Apuesta IMPI a modernización para agilizar registro de marcas y patentes

¡Crean estudiantes plantilla antisecuestro!

Adidas y la eterna lucha por sus tres rayas

El arma de Huawei que usará contra Trump: 56 mil patentes

La ciencia no tiene género: en grandes avances científicos han participado mujeres

Ahora Facebook tendrá su criptomoneda llamada Libra

Universidad de Chapingo pone a disposición de agricultores patentes e innovaciones científicas

Descubre UNAM antibiótico para tuberculosis en veneno de alacrán

Nuevo parche dérmico mexicano evitará más amputaciones por pie diabético

Las marcas famosas y el furor del Licenciado Valeriano… ¿pero qué sucedió?

Verizon tendrá que pagar mil millones de dólares a Huawei en patentes

¿Abejas robots serán el futuro para Walmart? ¡Ya las patentó!

Destacan jóvenes de la UNAM en concurso de la NASA

¿Sabes cuánto pasa un mexicano en WhatsApp?

Presenta General Motors ¡llantas que no se ponchan!

UNAM desarrolla proyecto tecnológico para pronóstico del clima

Liberan recursos para científicos y estudiantes; no se restringirán viajes: Conacyt

Crea UNAM prototipo de casa sustentable ¡de 14 metros cuadrados!

Gana Apple patente de pantalla plegable para dispositivos móviles

Presentan 78 mil patentes de inteligencia artificial en 2018

¿Quieres estudiar en el extranjero? Consulta esta convocatoria del Fonca y Conacyt

Por veto, Huawei reduce producción de celulares

Ingresa UNAM a la Federación Internacional de Astronáutica

¿Sabías que hay una máquina que convierte el aire en agua? ¡Conócela!

México, el país con más especies en peligro de extinción: UNAM

Estudiante de la UNAM crea croquetas anticonceptivas para perritos callejeros

Uber desactivará cuentas de conductores con mala calificación

Hay recursos suficientes para becas e investigación: Conacyt

Supera Huawei en patentes 5G a empresas de Estados Unidos

Sorprende caída de meteorito en Uruapan

Alexa de Amazon podría escucharte antes de que le hables

Aumentar patentes en México beneficiaría al PIB

Coordina UNAM proyecto científico de cambio global y sustentabilidad

Trump da tregua de tres meses para el veto a Huawei

Ponen en marcha octavo parque eólico en Tamaulipas

Registra Apple nueva patente para su carro autónomo

Elimina AMLO condonación de impuestos

Jalisco, segundo estado en registro de marcas y patentes

Termina batalla legal de patentes entre Huawei y Samsung

Agiliza IMPI registro de marcas y patentes con notificaciones electrónicas

Supera Inversión Extranjera Directa los 10 mil millones de dólares durante el primer trimestre de 2019

La docencia, una especie de fuente de la juventud: Leonardo Lomelí

Llega Salmerón a la dirección general del CIESAS

Aprovechar la innovación, tarea pendiente en México: William Lee

Desafía China a Estados Unidos con oleada de patentes en tecnología

Refrendan México y Canadá cooperación en ciencia, tecnología e innovación

Dialoga directora de Conacyt con investigadores del programa Cátedras

Fabricante de electrodomésticos construye su primer auto eléctrico

Gran Bretaña pasa una semana sin usar electricidad generada por carbón; esto no ocurría desde hace 137 años

Estrena IMPI ventanilla virtual para agilizar registros de la industria del deporte

Busca Conacyt información para combatir sargazo; empresarios apuestan a la bioindustria para aprovechar el alga

La innovación requiere esfuerzo sostenido y compromiso: UNAM

Revelan patente de audífonos de Samsung con batería intercambiable

UNAM estrena récord de registro de patentes

Descubren astrofísicos ‘cúmulos globulares’; mexicana lidera equipo

Premian mejores patentes de la UNAM

Buscan patente de proceso para obtener biodiésel a partir de aceite de reúso

Logra NASA lanzamiento exitoso de nave con carga para la Estación Espacial

iPhone 11 podría desbloquearse al tocar cualquier parte de la pantalla

Comparte Toyota sus patentes de modelos híbridos

Aluminio defectuoso, causante de pérdidas por 700 millones de dólares a la NASA en lanzamientos fallidos

Energía limpia destrona al carbón en Estados Unidos

Desarrollan patente en la UG para reducir viscosidad del petróleo

Universidad de Guanajuato es octavo lugar en patentes

Se reduce inversión en propiedad intelectual en México

Invertirá gobierno federal 743 millones de pesos para financiar proyectos de ciencia básica

Lanzan Lego en Braille para ayudar a niños con discapacidad visual

Científicos curan heridas con pegamentos de células madre