Puebla, Puebla. (Agencia Informativa Conacyt).- Un grupo multidisciplinario encabezado por el doctor Luis Enrique Colmenares Guillén y la doctora Maya Carrillo Ruiz, investigadores de la Facultad de Ciencias de la Computación de la Benemérita Universidad Autónoma de Puebla (FCC-BUAP), trabaja en la creación de un software que permitirá identificar y bloquear perfiles de pedófilos en las redes sociales.
A través del procesamiento del lenguaje natural, así como del procesamiento digital de imágenes, este proyecto detectará automáticamente y en fracciones de segundo, texto e imágenes con contenido pedófilo en páginas de Internet y redes sociales.
El equipo de investigadores construyó modelos cognitivos, perfiles psicológicos y criminológicos de pedófilos con el apoyo de colaboradores docentes y estudiantes de las áreas de psicología, criminología y, recientemente, del área de lingüística de la BUAP.
Inteligencia artificial y lenguaje natural
El procesamiento de lenguaje natural es considerado como una disciplina de la inteligencia artificial, es decir, es la creación de mecanismos computacionales para la comunicación entre personas y máquinas mediante el uso de lenguajes naturales, partiendo de la idea de que la inteligencia y el lenguaje guardan una estrecha relación.
En entrevista para la Agencia Informativa Conacyt, la doctora Maya Carrillo explicó que en este proyecto lo que se hace es “enseñar” a la computadora distintas conversaciones, entre ellas, de pedófilos con menores, para que la máquina pueda crear modelos y aprenda a distinguir los diálogos y sus características.
“Hemos hecho experimentos para lograr que la máquina detecte, por ejemplo, a poetas que cometieron suicidio a partir del análisis de sus textos. Le enseñamos a la máquina poesía de autores que sí se suicidaron y otros que no, entonces con métodos de procesamiento de lenguaje natural y aprendizaje automático se creó un modelo que permite a la computadora determinar si un texto nuevo es de un poeta que cometió o no suicidio, mismo que nos ha arrojado un 72 por ciento de precisión. De igual forma se hace con diferentes tipos de conversaciones, incluyendo las de pedófilos. Seguimos trabajando con esto y sumando nuevos aportes”.
Patrones de conducta en la red
Para la aplicación del procesamiento de lenguaje natural era necesario un corpus: conversaciones en las que fuera explícito este delito. Al respecto, el doctor Luis Enrique Colmenares Guillén refirió en entrevista que uno de los problemas existentes fue la falta de base de datos.
“Inicialmente en las redes sociales se encontró una serie de palabras que nos indicaban cierto tipo de delincuencia, que pudimos identificar y analizar para realizar una clasificación de palabras y saber a qué tipo de delito se refería. El problema fue que esas palabras estaban en el idioma inglés y por eso estamos creando nuestro propio corpus en español para poderlo adaptar al tipo de delincuencia que nos interesa en el contexto mexicano”, explicó el doctor Luis Enrique Colmenares.
Por su parte, la doctora Maya Carrillo añadió que para ir generando un corpus en este proyecto ha sido necesaria la suma de otras disciplinas que permitieran la creación de patrones de conducta semejante, frases y términos frecuentes que posteriormente servirán para identificar este tipo de conversaciones y construir herramientas de prevención que se puedan instalar en los equipos de cómputo de los menores de edad, para que cuando la máquina detecte una palabra, conversación o imagen inadecuada, emita una alerta en automático al celular y correo de los padres.
“Como no encontramos material en nuestro idioma, se realizaron seminarios para reunirnos con estudiantes de computación, criminología y psicología y empezar a crear los primeros corpus lingüísticos para este proyecto. La investigación nos condujo a la página Perverted Justice, organización de voluntarios que trabaja en colaboración con el departamento de justicia penal de los Estados Unidos, ahí tienen grabadas conversaciones con pedófilos, y con este material los alumnos establecieron características de dichos agresores. A partir de esto, los alumnos de computación han generado perfiles falsos en cuentas que abrimos en redes sociales, primordialmente Facebook, así hemos logrado recabar conversaciones que ya estamos estudiando para determinar patrones y caracterizar las etapas de las mismas, palabras clave, entre otros aspectos”.
Procesamiento de imágenes
El doctor Colmenares Guillén inició este proyecto hace más de tres años, enfocándose en problemas específicos como pornografía infantil, pederastia y trata de personas. La primera aportación que hizo fue un proceso para detectar desnudez en las imágenes digitales, el cual se registró en el 2012 ante el Instituto Mexicano de la Propiedad Industrial (IMPI) y en 2015 obtuvo el título de patente.
Se realizó un browser que consiste en un filtro para generar navegaciones seguras en Internet que detecta, ubica y bloquea páginas con imágenes pornográficas, pero además guarda evidencia. Su interés, dice, radica en la responsabilidad social, que tiene como investigador, para dar soluciones que aporten a la universidad y a la sociedad.
El investigador de la BUAP reconoció que aún hay un trabajo por desarrollar y se mostró confiado en concretar un aporte tecnológico que pueda coadyuvar de alguna forma a esta problemática social.
“Luchamos con abrir brecha e innovación para poder plantear nuevas herramientas, basados en el análisis del procesamiento del lenguaje natural y del procesamiento digital de imágenes para detectar a un pederasta, y aunque hay teorías que te dicen que eso no es posible, trabajamos para debatir académicamente que sí pueden haber estrategias para detectar a posibles criminales y bloquearlos en Internet”.
Aunque están conscientes de que los delincuentes emplean tecnología sofisticada, el doctor Colmenares Guillén aseguró que pueden diseñar herramientas informáticas que inhiban las conductas delictivas en Internet. En cuanto a los riesgos de trabajar con este tipo de proyectos, los investigadores refieren que ellos se enfocan en modelos de prevención, ya que su tarea solo se limita a este rubro.
De acuerdo con información de la Cámara de Diputados, a través de la Comisión de Derechos de la Niñez, en México, en tan solo cinco años, se detectaron más de cuatro mil páginas de pornografía infantil en Internet, además de más de un millón de imágenes de menores de edad sometidos a abusos sexuales y explotación circulando en línea. Los pederastas tardan solo 12 minutos en contactar a sus víctimas por Internet para inducirlas a desnudarse o ver pornografía.