27 April, 2025 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Institutos públicos requieren expertos en Propiedad Industrial

25 noviembre, 2015

25 noviembre, 2015

Por Antimio Cruz El Instituto de Investigaciones Eléctricas (IIE), de la Secretaría de Energía, presentó en 2015 seis solicitudes de...

La tecnología aborda el Metro de CDMX

28 marzo, 2018

28 marzo, 2018

Por Hugo Valencia Juliao Hace cuatro años que a mi novia perdí en esas muchedumbres que se forman aquí. La...

inMateriis, bastión de innovación y ciencia

20 agosto, 2018

20 agosto, 2018

Por Pablo Miranda  Guadalajara, Jalisco.  (Agencia Informativa Conacyt).- Dentro de inMateriis hay científicos trabajando tranquilamente. En un cuarto, hay quienes...

El mejor biocombustible está en el aire

14 septiembre, 2017

14 septiembre, 2017

Por Israel Pérez Valencia Santiago de Querétaro, Querétaro. (Agencia Informativa Conacyt).- Investigadores del grupo de Procesos Sustentables de Producción de...

¿Cómo vigila la NASA la evolución del calentamiento global desde el espacio?

23 octubre, 2016

23 octubre, 2016

Ciudad de México.  (Agencia Informativa Conacyt).- Seis integrantes de la Administración Nacional de Aeronáutica y del Espacio (NASA, por sus siglas...

Diseña Cinvestav refugios artificiales para langostas en la costa de Yucatán

17 diciembre, 2016

17 diciembre, 2016

Mérida, Yucatán.  (Agencia Informativa Conacyt).- La captura de langosta (Panulirus argus) en la península de Yucatán data de principios de la...

La cuna que simula el movimiento del coche

19 abril, 2017

19 abril, 2017

¿Tienes un bebé que no deja de llorar? Ponlo en un coche en marcha. Automáticamente el movimiento del coche logrará...

Culmina ciclo de detector sinaloense en el LHC; comienza nuevo reto

21 diciembre, 2018

21 diciembre, 2018

Por Janneth Aldecoa Culiacán, Sinaloa.  (Agencia Informativa Conacyt).- La mañana del 10 de diciembre culminó el ciclo de dos detectores sinaloenses,...

¿Existe relación entre contaminación ambiental y cáncer de mama?

1 septiembre, 2018

1 septiembre, 2018

Por Génesis Gatica  Ciudad de México.  (Agencia Informativa Conacyt).- En el Centro de Ciencias de la Atmósfera (CCA) y en...

Crea IPN película comestible a partir de desechos de café

26 agosto, 2017

26 agosto, 2017

INSTITUTO POLÍTECNICO NACIONAL Ciudad de México, a 7 de agosto de 2017 COMUNICADO DE PRENSA C-598   La pectina es...

Genes de resistencia a antibióticos: peligro en cada diente

18 agosto, 2017

18 agosto, 2017

Por Israel Pérez Valencia Santiago de Querétaro, Querétaro.  (Agencia Informativa Conacyt).- La odontóloga con especialidad en endodoncia por la Universidad...

Telemonitorización de pacientes con app

16 junio, 2016

16 junio, 2016

AUTOR: Lizbeth Barojas FUENTE:  AGENCIA INFORMATIVA CONACYT Veracruz, Veracruz. (Agencia Informativa Conacyt).- Con la intención de optimizar la calidad de vida de...

Conacyt y el INEE lanzan convocatoria de Investigación para la Evaluación de la Educación

21 enero, 2017

21 enero, 2017

Ciudad de México. (Agencia Informativa Conacyt).- El Consejo Nacional de Ciencia y Tecnología (Conacyt) y el Instituto Nacional para la Evaluación...

Estudiantes mexicanos crean parche para evitar infecciones en quemaduras

13 enero, 2017

13 enero, 2017

La investigación ayudará a contrarrestar las muertes por lesiones en la piel. Participaron en el concurso internacional iGEM Biología sintética...

Abierta la convocatoria Plataforma Transatlántica de Ciencias Sociales y Humanidades

14 abril, 2016

14 abril, 2016

AUTOR: Mercedes López   FUENTE:  AGENCIA INFORMATIVA CONACYT   Ciudad de México. 11 de abril de 2016 (Agencia Informativa Conacyt).- La Plataforma...