21 November, 2024 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Comprueba investigación México-estadunidense la hipersensibilidad a la luz por parte del paciente con diabetes

29 agosto, 2018

29 agosto, 2018

La falta de control de glucosa en sangre afecta los tejidos del fondo del ojo, especialmente a la retina que...

Gracias a un desarrollo tecnológico de la UAM, se puede medir la respiración de microorganismos

3 junio, 2016

3 junio, 2016

FUENTE: AGENCIA ID   El dispositivo se ha vendido a instituciones de investigación en México, y se pretende comercializar también fuera...

Jorge Lechuga Andrade: desalinización sustentable del agua

9 abril, 2016

9 abril, 2016

Mérida, Yucatán. 4 de abril de 2016 (Agencia Informativa Conacyt).- Jorge Antonio Lechuga Andrade cuenta con 33 años de experiencia en...

Jóvenes desarrollan láminas para casa habitación a partir del plátano

23 marzo, 2016

23 marzo, 2016

AUTOR: [email protected] FUENTE: AGENCIA INFORMATIVA CONACYT   Ciudad de México. 17 de marzo de 2016 (Agencia Informativa Conacyt).- LAMBIO es el nombre del...

Construirán centro de estudios vitivinícolas en Baja California

13 diciembre, 2018

13 diciembre, 2018

Por Karla Navarro Ensenada, Baja California.  (Agencia Informativa Conacyt).- El Centro de Enseñanza Técnica y Superior (Cetys) Universidad albergará en...

La Propiedad Intelectual y el Marco Jurídico actual en Guatemala

8 abril, 2016

8 abril, 2016

FUENTE: Gustavo Noyola., Intellectual Property Regional Director, Central Law, Guatemala, Guatemala. La Propiedad Intelectual y el Marco Jurídico actual en Guatemala  ...

Multiplica Imaatech viajes con su bicicleta eléctrica

14 mayo, 2018

14 mayo, 2018

Boletín de prensa no.188 Ciudad de México, 6 de mayo de 2018 Multiplica Imaatech viajes con su bicicleta eléctrica ·        Gracias a...

Destaca la Unaq en el Certamen Nacional Innovación Aeroespacial México 2016

27 enero, 2017

27 enero, 2017

Santiago de Querétaro, Querétaro.  (Agencia Informativa Conacyt).- Un estudiante de posgrado y tres egresados de licenciatura de la Universidad Aeronáutica en...

Estudian contaminación radioactiva en alimentos en México

27 abril, 2017

27 abril, 2017

Por Tania Robles Ciudad de México.  (Agencia Informativa Conacyt).- La contaminación en alimentos no solo se presenta por hongos o...

Panorama del emprendimiento de base tecnológica en la salud

30 junio, 2017

30 junio, 2017

Por Hugo Valencia Juliao Ciudad de México. (Agencia Informativa Conacyt).- El desarrollo de tecnología en el sector de la salud es...

Estudiantes desarrollan app para promover autoexploración mamaria

1 junio, 2016

1 junio, 2016

AUTOR: Montserrat Muñoz FUENTE: AGENCIA INFORMATIVA CONACYT Guadalajara, Jalisco. (Agencia Informativa Conacyt).- Con una aplicación móvil (app) que promueve la autoexploración de los...

Estudiantes de la UASLP presentan Incubadora automatizada

13 junio, 2017

13 junio, 2017

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx Estudiantes de la Universidad Autónoma de San Luis...

En busca del superamaranto

23 octubre, 2018

23 octubre, 2018

Por Armando Bonilla Ciudad de México.  (Agencia Informativa Conacyt).- A través de campos experimentales en el estado de Tlaxcala, investigadores...

Limpian aguas contaminadas con un nuevo material adsorbente fabricado con cáscaras de frutas

16 marzo, 2017

16 marzo, 2017

FUENTE: Unidad de Cultura Científica (UCC), Oficina de Gestión de la Comunicación, [email protected][email protected], UNIVERSIDAD DE GRANADA, ESPAÑA Investigadores de la Universidad de Granada...

Joven de la CDMX gana plata en Olimpiada europea de matemáticas

22 abril, 2017

22 abril, 2017

Fuente: Mónica Mateos-Vega, La Jornada en línea, www.jornada.unam.mx Ciudad de México. La estudiante de tercero de secundaria Ana Paula Jiménez,...