M3, un sistema para saber de qué hablan los medios de comunicación

Por Marytere Narváez

Mérida, Yucatán. (Agencia Informativa Conacyt).- ¿Sabes cuántas veces se ha publicado en los principales medios electrónicos mexicanos la palabra “ciencia”? Al menos 399 veces de enero de 2016 a agosto de 2018, de acuerdo con la plataforma http://m3.geoint.mx/ del Centro de Investigación en Ciencias de Información Geoespacial (Centrogeo), unidad Yucatán.

El grupo de investigación de Geointeligencia computacional de Centrogeo, unidad Yucatán, desarrolla el proyecto Monitoreo de Múltiples Medios (conocido también como M³), un sistema de obtención, análisis y visualización de información publicada en medios masivos de comunicación en su versión electrónica.

En entrevista para la Agencia Informativa Conacyt, el ingeniero Mario Chirinos Colunga, investigador del Centrogeo encargado del proyecto, describió que la base de datos consta hasta el momento de 45 fuentes de información en texto y nueve fuentes de audio, con un total dos millones 285 mil 926 documentos de texto y 29 mil 981.35 horas de audio.

“No todos los diarios tienen una hemeroteca, y de los que la tienen no en todos los casos se puede realizar una búsqueda adecuada y en otros casos las noticias solo están disponibles por un periodo de tiempo. Solo unos pocos diarios, como La Jornada, tienen bien organizada su información. Por lo que nuestro sistema M³ nos permite tener una base de datos única para hacer búsquedas y realizar diversas investigaciones”.

Además de las fuentes de texto, se monitorea y almacena el audio de 10 estaciones de radio durante la transmisión que realizan de 6:00 a 24:00 horas, misma que se transcribe automáticamente utilizando un transcriptor llamado CMU Sphinx.

“Ya que se ha transcrito el audio, se pueden hacer búsquedas de la misma forma que se hace con las noticias de los periódicos. Podemos encontrar cuáles son los temas más importantes de lo que se está hablando o de cuántos temas se está hablando en cierto periodo de tiempo, utilizando técnicas de procesamiento de lenguaje natural”, apuntó Chirinos Colunga.

“Programamos lo que se llaman crawlers o arañas que ‘suben’ a las páginas de Internet y bajan su contenido. Son pequeños programas que se les dice a dónde ir y qué información buscar”.

El proyecto inició con el propósito de desarrollar una base de datos que sustente otras investigaciones del grupo de geointeligencia computacional, como la del doctor Alejandro Molina Villegas, experto en procesamiento de lenguaje natural (NLP, por sus siglas en inglés), la de Gandhi Hernández Chan, quien trabaja con identificación de emociones en texto, y la del doctor Oscar Sánchez Siordia, coordinador de la unidad Yucatán, quien trabaja con redes sociales y sobre identificación automática de conflictos violentos en notas de prensa.

Desarrollo tecnológico

El primer paso del proyecto fue escoger los periódicos más reconocidos, como La Jornada, que era el más óptimo debido a que almacena sus publicaciones de manera ordenada. Posteriormente se consultó ComScore, una página que hace un listado de los medios más importantes de comunicación.

“Escogimos los principales diarios nacionales y los dos primeros diarios locales de cada estado. En este momento tenemos 45 diarios, pero la idea es tener todos los diarios de circulación nacional y local”, apuntó Chirinos Colunga.

Una vez que la araña (crawler) descarga la información en un archivo de formato JSON (JavaScript Object Notation) y se almacena en la base de datos, permite que el usuario pueda buscar en dicha base cualquier información que desee a través de una plataforma intuitiva. “Tenemos dos millones 337 mil noticias al día de hoy y 26 mil 800 minutos de audio. El proyecto comenzó en agosto de 2017”, resaltó el investigador.

Procesamiento del lenguaje natural

De acuerdo con Alejandro Molina Villegas, el procesamiento de lenguaje natural tiene por objetivo que la computadora analice, entienda y derive significado a partir del lenguaje humano. “Es decir, se busca modelar los mecanismos necesarios para la comunicación humana pero por medio de programas de cómputo. Dichos modelos se enfocan no solo en el procesamiento simbólico del lenguaje, sino en su comprensión y en otros aspectos cognitivos”.

Para checar el listado completo, dar clic aquí.Para el investigador, el mayor reto del procesamiento de lenguaje natural es emular los aspectos cognitivos del ser humano y su manera eficiente de vincular pensamiento y lenguaje.

“En la década de los cuarenta, el matemático Alan Turing se planteó la cuestión de si una computadora podría llegar a pensar. Es decir, si es posible generar inteligencia artificial. Desde entonces, los científicos soñamos con poder conversar con un robot tal y como lo haríamos con una persona: expresando ideas abstractas en nuestro idioma”, describió.

En el proyecto M³, se busca utilizar procesamiento de lenguaje natural para generar modelos para la georreferenciación. “Por ejemplo, queremos detectar cuando se menciona un lugar o una entidad georreferenciable para luego obtener sus coordenadas”, apuntó el investigador.

Molina Villegas trabaja también en la identificación automática de temas por medio de técnicas de agrupamiento (clustering) para agrupar los documentos que hablan de temas similares, así como en la identificación de emociones en el texto.

De acuerdo con el especialista, el área de modelización probabilística de tópicos (Probabilistic Topic Modeling) está basada en la idea de que un documento es una mezcla de temas (tópicos), donde un tema es definido como una distribución de probabilidad sobre las palabras.

“Esto tiene muchas aplicaciones interesantes, empezando por la posibilidad de agrupar semánticamente los documentos, de manera que aquellos que hablan de la misma mezcla de temas quedan juntos. Una vez programado, se puede correr el experimento para toda la biblioteca digital de una universidad. Los motores de búsqueda que utilizamos a diario funcionan con módulos como este”.

En la línea de análisis y reconocimiento de voz, Molina Villegas se ha interesado también en la clasificación automática de llamadas delictivas. Como resultado, desarrolló un programa que identifica cuándo está en curso una llamada de secuestro y permite emitir una alerta a las autoridades o a los familiares de la persona que recibe la llamada. “Estoy buscando financiamiento o capital semilla para ponerlo en una app”.

Comparte tu opinión sobre este artículo

Comentarios

By Mi Patente 12 octubre, 2018

in INNOVACIÓN, TECNOLOGÍA

CIENCIA Y CON…CIENCIA, INNOVACIÓN, MARCAS, PROPIEDAD INTELECTUAL, TECNOLOGÍA

¿Litros de a litro? Cenam verificará bombas despachadoras de gasolina

7 junio, 2016 Mi Patente

AUTOR: Israel Pérez FUENTE: AGENCIA INFORMATIVA CONACYT Santiago de Querétaro, Querétaro. (Agencia Informativa Conacyt).- Con la finalidad de brindar una...

CIENCIA Y CON…CIENCIA, INNOVACIÓN, TECNOLOGÍA

Dos equipos jaliscienses rumbo a RoboCup 2016

12 julio, 2016 Mi Patente

AUTOR: Montserrat Muñoz FUENTE: AGENCIA INFORMATIVA CONACYT Guadalajara, Jalisco. (Agencia Informativa Conacyt).- Dos equipos de niños y jóvenes jaliscienses participarán del próximo...

CIENCIA Y CON…CIENCIA, En el Mundo, INNOVACIÓN, TECNOLOGÍA

UNA TECNOLOGÍA PERMITE QUE LOS ‘SMARTPHONES’ CONSUMAN DIEZ MIL VECES MENOS ENERGÍA

1 marzo, 2016 Mi Patente

Por Agencia ID Un grupo de científicos de la Universidad de Washington, en EEUU, ha desarrollado un sistema de...

INNOVACIÓN, TECNOLOGÍA

Investigadora de la BUAP desarrolla antibióticos naturales

21 junio, 2018 Mi Patente

Obtuvo extractos a partir de plantas frescas y secas, los cuales probó en medios de cultivo con cinco tipos de...

CIENCIA Y CON…CIENCIA, INNOVACIÓN

Desarrollan edulcorante para pacientes con diabetes

21 febrero, 2018 Mi Patente

Por Carmen Báez Ciudad de México. (Agencia Informativa Conacyt).- Enterarse que un familiar ha sido diagnosticado con diabetes es quizá una...

CIENCIA Y CON…CIENCIA, INNOVACIÓN

Obtiene CENIT2 registro de Laboratorio Nacional de Inocuidad Alimentaria

14 octubre, 2016 Mi Patente

Tepic, Nayarit. (Agencia Informativa Conacyt).- El Laboratorio de Contaminación Biológica del Centro Nayarita de Innovación y Transferencia de Tecnología (Cenit2) recibió...

INNOVACIÓN, PROPIEDAD INTELECTUAL

Necesita México más innovación en sector biomédico

6 abril, 2017 Mi Patente

Los factores potenciadores del sector biomédico son: Capital humano, investigación y desarrollo, infraestructura, propiedad intelectual, incentivos comerciales, fortalecimiento del Estado...

INNOVACIÓN, TECNOLOGÍA

Exploran politécnicos recubrimiento biodegradable para el envasado de alimentos

27 junio, 2017 Mi Patente

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx • Especialistas del Ceprobi proponen un empaque amigable...

CIENCIA Y CON…CIENCIA, INNOVACIÓN, PROPIEDAD INTELECTUAL, TECNOLOGÍA

Crean material con fibra de coco para absorber ondas electromagnéticas

15 marzo, 2016 Mi Patente

AUTOR: Erika González FUENTE: AGENCIA INFORMATIVA CONACYT Zacatecas, Zacatecas. 10 de marzo de 2016 (Agencia Informativa Conacyt).- En el área de...

INNOVACIÓN, TECNOLOGÍA

Desarrollan celdas solares de silicio cristalino

4 agosto, 2017 Mi Patente

Por Ricardo Capilla Vilchis Ciudad de México. (Agencia Informativa Conacyt).- El mundo se enfrenta a grandes retos ante el cambio...

CIENCIA Y CON…CIENCIA, INNOVACIÓN

Comercia MX, una plataforma para mujeres artesanas

23 noviembre, 2018 Mi Patente

Por Hugo Valencia Juliao Ciudad de México. (Agencia Informativa Conacyt).- Con el objetivo de visibilizar los productos de mujeres artesanas para...

Actualidad, Ciencia, INNOVACIÓN, Main Senior, PROPIEDAD INTELECTUAL, TECNOLOGÍA

Nuevo parche dérmico mexicano evitará más amputaciones por pie diabético

15 junio, 2019 Editorial Mi patente

El registro de patente del parche dérmico único en el mundo, creado por el Instituto Politécnico Nacional (IPN), ya está en trámite

INNOVACIÓN, PROPIEDAD INTELECTUAL

Andrea Sánchez: entre la ciencia y el emprendimiento

14 junio, 2017 Mi Patente

Por Érika Rodríguez Zacatecas, Zacatecas. (Agencia Informativa Conacyt).- Andrea Cecilia Sánchez Náñez es una joven emprendedora de 23 años de...

CIENCIA Y CON…CIENCIA, INNOVACIÓN, TECNOLOGÍA

REALIZA CINVESTAV NOVEDOSO SISTEMA PARA CELDAS DE CONCENTRACIÓN SOLAR

19 junio, 2016 Mi Patente

FUENTE: CINVESTAV Los investigadores emplean sistemas de control automático que dirigen de forma precisa el panel a la dirección de los...

CIENCIA Y CON…CIENCIA, INNOVACIÓN, PROPIEDAD INTELECTUAL, TECNOLOGÍA

Anuncia gobierno federal cuatro acciones para impulsar ciencia y tecnología

8 junio, 2016 Mi Patente

AUTOR: Armando Bonilla FUENTE: , AGENCIA INFORMATIVA CONACYT Ciudad de México. (Agencia Informativa Conacyt).- En el marco de la entrega de...

Desarrollo tecnológico

Procesamiento del lenguaje natural

Comparte tu opinión sobre este artículo

Entradas recientes

Llegaron las gomitas antiestrés, una creación de estudiantes del Tec de Monterrey

Revelan patente de Microsoft de computadora plegable

Buscan protección intelectual de diseños de mujeres indígenas

Alistan empresas patentes de marihuana

Presentan auto que funciona con agua salada, ¿es el fin de la gasolina?

Apuesta Jalisco con organismo a ser puntero en protección a propiedad intelectual

Avanza China en materia de propiedad intelectual; impulsan desarrollo integral

Elaboran alumnas mexicanas un helado para diabéticos

Crean jóvenes leoneses zapatos de sargazo

Apuesta IMPI a modernización para agilizar registro de marcas y patentes

¡Crean estudiantes plantilla antisecuestro!

Adidas y la eterna lucha por sus tres rayas

El arma de Huawei que usará contra Trump: 56 mil patentes

La ciencia no tiene género: en grandes avances científicos han participado mujeres

Ahora Facebook tendrá su criptomoneda llamada Libra

Universidad de Chapingo pone a disposición de agricultores patentes e innovaciones científicas

Descubre UNAM antibiótico para tuberculosis en veneno de alacrán

Nuevo parche dérmico mexicano evitará más amputaciones por pie diabético

Las marcas famosas y el furor del Licenciado Valeriano… ¿pero qué sucedió?

Verizon tendrá que pagar mil millones de dólares a Huawei en patentes

¿Abejas robots serán el futuro para Walmart? ¡Ya las patentó!

Destacan jóvenes de la UNAM en concurso de la NASA

¿Sabes cuánto pasa un mexicano en WhatsApp?

Presenta General Motors ¡llantas que no se ponchan!

UNAM desarrolla proyecto tecnológico para pronóstico del clima

Liberan recursos para científicos y estudiantes; no se restringirán viajes: Conacyt

Crea UNAM prototipo de casa sustentable ¡de 14 metros cuadrados!

Gana Apple patente de pantalla plegable para dispositivos móviles

Presentan 78 mil patentes de inteligencia artificial en 2018

¿Quieres estudiar en el extranjero? Consulta esta convocatoria del Fonca y Conacyt

Por veto, Huawei reduce producción de celulares

Ingresa UNAM a la Federación Internacional de Astronáutica

¿Sabías que hay una máquina que convierte el aire en agua? ¡Conócela!

México, el país con más especies en peligro de extinción: UNAM

Estudiante de la UNAM crea croquetas anticonceptivas para perritos callejeros

Uber desactivará cuentas de conductores con mala calificación

Hay recursos suficientes para becas e investigación: Conacyt

Supera Huawei en patentes 5G a empresas de Estados Unidos

Sorprende caída de meteorito en Uruapan

Alexa de Amazon podría escucharte antes de que le hables

Aumentar patentes en México beneficiaría al PIB

Coordina UNAM proyecto científico de cambio global y sustentabilidad

Trump da tregua de tres meses para el veto a Huawei

Ponen en marcha octavo parque eólico en Tamaulipas

Registra Apple nueva patente para su carro autónomo

Elimina AMLO condonación de impuestos

Jalisco, segundo estado en registro de marcas y patentes

Termina batalla legal de patentes entre Huawei y Samsung

Agiliza IMPI registro de marcas y patentes con notificaciones electrónicas

Supera Inversión Extranjera Directa los 10 mil millones de dólares durante el primer trimestre de 2019

La docencia, una especie de fuente de la juventud: Leonardo Lomelí

Llega Salmerón a la dirección general del CIESAS

Aprovechar la innovación, tarea pendiente en México: William Lee

Desafía China a Estados Unidos con oleada de patentes en tecnología

Refrendan México y Canadá cooperación en ciencia, tecnología e innovación

Dialoga directora de Conacyt con investigadores del programa Cátedras

Fabricante de electrodomésticos construye su primer auto eléctrico

Gran Bretaña pasa una semana sin usar electricidad generada por carbón; esto no ocurría desde hace 137 años

Estrena IMPI ventanilla virtual para agilizar registros de la industria del deporte

Busca Conacyt información para combatir sargazo; empresarios apuestan a la bioindustria para aprovechar el alga

La innovación requiere esfuerzo sostenido y compromiso: UNAM

Revelan patente de audífonos de Samsung con batería intercambiable

UNAM estrena récord de registro de patentes

Descubren astrofísicos ‘cúmulos globulares’; mexicana lidera equipo

Premian mejores patentes de la UNAM

Buscan patente de proceso para obtener biodiésel a partir de aceite de reúso

Logra NASA lanzamiento exitoso de nave con carga para la Estación Espacial

iPhone 11 podría desbloquearse al tocar cualquier parte de la pantalla

Comparte Toyota sus patentes de modelos híbridos

Aluminio defectuoso, causante de pérdidas por 700 millones de dólares a la NASA en lanzamientos fallidos

Energía limpia destrona al carbón en Estados Unidos

Desarrollan patente en la UG para reducir viscosidad del petróleo

Universidad de Guanajuato es octavo lugar en patentes

Se reduce inversión en propiedad intelectual en México

Invertirá gobierno federal 743 millones de pesos para financiar proyectos de ciencia básica

Lanzan Lego en Braille para ayudar a niños con discapacidad visual