FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx
• El modelo puede ser utilizado como mecanismo de autentificación de personas al realizar diversos trámites, así como en seguridad pública
Investigadores del Laboratorio de Ingeniería del Lenguaje y Conocimiento, de la Facultad de Ciencias de la Computación (FCC) de la BUAP, en colaboración con la empresa Code Ingeniería, desarrollaron un sistema de identificación de personas por medio de voz, que puede ser utilizado en los programas de pensionados y jubilaciones, así como para la validación de trámites bancarios y en seguridad.
David Eduardo Pinto Avendaño, profesor investigador de la FCC, doctor en Inteligencia Artificial y Reconocimiento de Formas, por la Universidad Politécnica de Valencia, España, informó que el grupo de investigación generó modelos computacionales para identificar a las personas a partir de ciertas características de la voz, además de trabajar en la validación del sistema. Para realizar el proyecto se contó con la participación de 120 personas, 60 hombres y 60 mujeres, de los cuales 20 eran adultos mayores.
“El objetivo del proyecto fue generar modelos computacionales implementados, capaces de discernir entre diferentes voces quién es la persona que está hablando”, explicó.
A cada individuo se le grabó su voz varias veces, mientras decían su nombre y apellidos, lugar y fecha de nacimiento, nombre de sus padres, número de hermanos, los dígitos del 0 al 9, los nombres de los estados de la República Mexicana y un texto seleccionado por los académicos, el cual estaba conformado por palabras que emulaban los diferentes sonidos del idioma español.
“A partir de eso generamos unas ‘huellas acústicas’ en las que registramos diversos aspectos como las tonalidades de la voz y la forma en la que pronunciaban determinadas letras; es decir, hicimos un análisis de la manera en que ellos modificaban su tracto vocal, lengua, labios y dientes para generar los sonidos”, precisó.
El investigador refirió que la parte acústica se asocia con símbolos ortográficos, fonológicos y letras que proporcionan una serie de señales que pueden ser modeladas matemáticamente. “Lo que hicimos fue tomar la voz y transformarla de un espectro de amplitud a uno de frecuencias y posteriormente examinamos las similitudes de sonidos en una matriz de valores”.
De esos audios se escogió un conjunto para generar modelos de voz de las personas, mientras que los demás datos se utilizaron para validar que el sistema se ejecutó de forma correcta.
En este proyecto, la empresa Code Ingeniería desarrolló módulos de transformación para la obtención de ciertos valores, así como un modelo específico de similitud. “Nosotros también diseñamos un modelo propio e implementamos un sistema híbrido que permitió combinar sus técnicas con las nuestras para obtener mejores resultados”, indicó Pinto Avendaño.
El sistema tiene una amplia variedad de aplicaciones, como verificar que una persona de la tercera edad que cobra una pensión continúa con vida: “Con una llamada telefónica el sistema es capaz de corroborar si la voz del individuo que habla corresponde verdaderamente a quien dice ser, ya que hay situaciones en las que otras personas siguen cobrando una pensión aun cuando la persona ha fallecido”.
Este mecanismo de autentificación también es útil al momento de realizar alguna transacción bancaria: “Normalmente tenemos que proporcionar una serie de datos para validar que realmente somos nosotros quienes deseamos realizar dicha operación, por lo que de esta forma la voz se convertiría en nuestra firma electrónica, sin la necesidad de que nos pregunten fecha de nacimiento, CURP, números clave y otros datos”, abundó.
Además, dijo, si se obtienen suficientes muestras de voz, podrían ser aplicadas en situaciones de seguridad; por ejemplo, en casos de personas extraviadas o llamadas de extorsión “se sugiere grabar voces de las personas que se encuentran en los reclusorios para caracterizarlos, y si en algún momento alguien recibe una llamada de amenaza, se vincule la voz del extorsionador con las voces grabadas en los modelos y así se corrobore si existe una similitud”.
El proyecto “Validación en ambiente de laboratorio de sistemas de identificación de personas por medio de voz“ recibió fondos del Programa de Estímulos a la Innovación del Conacyt, el cual busca fomentar la innovación en productos tecnológicos a nivel nacional, a través de la vinculación entre las empresas y las instituciones educativas.
“Esta es un área que tiene mucha oportunidad de desarrollo y que además es de gran interés para la comunidad científica y los estudiantes, por ello seguiremos trabajando para mejorar los modelos de clasificación y aplicarlos a una mayor población, como niños y jóvenes”, subrayó David Pinto.
En este proyecto participaron Darnes Vilariño Ayala, Iván Olmos Pineda, Arturo Olvera López, Juan Manuel González Calleros e Ivo Pineda Torres, investigadores del Laboratorio de Ingeniería del Lenguaje y del Conocimiento, así como Emanuel Aguilar Benítez y Yuvila Mariela Sanzón Rosas, egresados de la FCC.
El video sobre este texto puede verse en el siguiente enlace: https://youtu.be/0lkvXzMbH28.