Por Armando Bonilla
Ciudad de México. (Agencia Informativa Conacyt).- Científicos del Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI) de la Universidad Nacional Autónoma de México (UNAM) desarrollan una nueva metodología para estandarizar la información contenida en la web y optimizar su uso.
La propuesta radica en clasificar la información por bloques de interés, definir una estructura de metadatos óptima para esos bloques y determinar las características descriptivas para que todos los documentos contengan los mismos elementos.
En entrevista con la Agencia Informativa Conacyt, Ariel Alejandro Rodríguez García, investigador de tiempo completo y secretario académico del instituto, explicó que la gran cantidad de información contenida en Internet, así como la velocidad con que se generan nuevos documentos, ha vuelto ineficiente su gestión.
Es por ello que con miras a organizar la información y el conocimiento, emprendió un esfuerzo de clasificación, catalogación y análisis documental a través del uso de metadatos, trabajo que derivará en un proceso de estandarización para los documentos existentes y los que se produzcan en adelante.
“Yo en particular estudio los procesos de normalización y estandarización, es decir, todo lo relacionado con las normas que se generan a nivel local, nacional e internacional que se aplican a los sistemas de información, principalmente los bibliotecológicos, archivísticos o museográficos”.
El objetivo de este trabajo es definir metodologías para registrar, administrar, buscar y reutilizar la información —principalmente académica— que se genera y se almacena en la web. Para ello, los metadatos, es decir, la parte donde se describen las características virtuales del documento, son fundamentales.
En ese contexto, el trabajo realizado se encuentra en una etapa de clasificación de sistemas bibliográficos con tecnología web para agrupar los documentos de acuerdo con temáticas o puntos de interés que puedan tener; asimismo, se desarrollarán sistemas de recuperación de información, como los catálogos o inventarios en las bibliotecas, con la finalidad de preservar, de manera ordenada, el registro de los documentos en el acervo digital o físico existente.
La ruta de selección y clasificación de documentos
De acuerdo con el investigador, el primer paso que se da es identificar aquellas instituciones poseedoras de documentos que deban ser estandarizados y que tengan la intención de hacerlo —bibliotecas, museos, universidades, centros de investigación—, a quienes se acercan para que les compartan su información.
Es relevante precisar que los documentos digitales tienen características propias, con herramientas técnicas e intertecnológicas como los metadatos, es decir, las codificaciones que traen los documentos digitales que son extraídas por los sistemas de información para acceder a las características descriptivas del documento.
“Es ahí donde estamos trabajando, el análisis que hacemos del documento, del tema, del autor, lo agregamos en la descripción contenida en los metadatos y lo que proponemos es que los parámetros clasificatorios sean uniformes. Apenas tenemos un año trabajando en este proyecto; no obstante, presentaremos los primeros resultados en nuestro próximo Congreso Internacional sobre Metadatos”.
Al referir la importancia de la estandarización de la información, dijo que actualmente se corre el riesgo de que se siga multiplicando de manera desordenada, es decir, se duplique, triplique y hasta cuatriplique un mismo archivo. “Se pide dentro de la normativa de estructuras de metadatos que generemos registros con elementos mínimos de identificación, por ejemplo, nosotros podemos tener tres datos mínimos que son autor, título y año de publicación del documento”.
El problema para esa norma radica en que otros sistemas podrían tener una descripción del contenido, o se cuente con una imagen asociada o reseña del documento. “La solución inmediata es contar con un sistema que sea capaz de identificar esa información y combinar la descripción contenida en los metadatos para dejar disponible solo un documento”.
Y para evitar que el problema se siga replicando para otros documentos, es vital estandarizar la información de identificación.
“Toda esta estandarización de los metadatos representa un verdadero reto, es todo un universo, existen aproximadamente 150 estructuras diferentes de metadatos, pero no todos son aplicables a nuestras áreas de interés, esto quiere decir que no son los mismos metadatos los que se usan para describir archivos museográficos o los generados en los hospitales”.
De acuerdo con el investigador, la intención del proyecto es agrupar la información por bloques, por ejemplo, educación, definir una estructura óptima de metadatos y proponer las características descriptivas básicas y replicar el modelo para diferentes áreas hasta optimizar el flujo de información digital.