En artículos que hemos publicados con anterioridad se menciona cómo los medios de comunicación han evolucionado a través del tiempo y la importancia que tienen para comunicarnos de manera cada vez más rápida y eficiente. También se introdujo el concepto de industria 4.0 como la sinergia de diversas tecnologías que hacen que un sistema de manufactura cuente con una mejor comunicación entre los diversos usuarios, interfaces y máquinas, reduciendo así los tiempos de espera, de procesamiento y de logística. Las cadenas de suministros son cada vez más inteligentes, dando como resultado una colaboración más cercana basada en la High-Tech, que a su vez es fomentada por la obtención de diversas fuentes de información en tiempo real, que son exponenciales y dependientes del tiempo.
El Big-Data BD (datos masivos), es el término que se le otorga a la acción de almacenar una gran cantidad de datos provenientes de diferentes fuentes, así como su proceso detallado de análisis mediante modelos y técnicas estadísticas, aplicados para identificar patrones repetitivos dentro de los datos almacenados con el objetivo de establecer las causas y los efectos interrelacionados en los datos analizados con la finalidad de implementar soluciones en tiempo real, creando así nuevos servicios comerciales, tendencias macroeconómicas, estrategias de marketing, etc.
En la actualidad las tecnologías de la información son el sector encargado de generar los recursos necesarios para el almacenamiento y análisis de los datos adquiridos. El almacenamiento de los datos es un tarea no tan simple como se puede imaginar, ya que se requiere de una gran cantidad de dispositivos de almacenamiento, sistemas de cableado estructurado, dispositivos de conexión, etc., los cuales deben de estar resguardados en habitaciones fabricadas especialmente para controlar la temperatura, humedad y seguridad.
Las nuevas estrategias de almacenamiento y análisis de datos permiten un desarrollo tecnológico considerable, ya que la asimilación de datos es de manera exponencial dependiente del tiempo, cada dos días se produce una cantidad de información igual a la información generada desde el inicio de la civilización a hoy en día (Banfi, 2016) necesitando así de dispositivos de almacenamiento que permitan guardar un mayor contenido de datos en espacios cada vez más reducidos, que sean más estables y que procesen la información a una velocidad cada vez mayor. Gracias a éste tipo de tendencias, se permite un desarrollo tecnológico considerable para mejorar y desarrollar nuevos materiales semiconductores, así como componentes electrónicos e informáticos para solventar las necesidades actuales.
Con base a la definición de Doug Laney, hay al menos tres factores que tienen que considerarse cuando se habla de BD: Volumen, Velocidad y Variedad; el volumen hace referencia a la cantidad de datos que son procesados y que provienen de fuentes diversas entre las cuales destacan las fuentes públicas, el Social Media, y el Streaming Data; la velocidad hace hincapié a la cantidad de información generada a través del tiempo, así como la velocidad en la que los datos son almacenados e identificados, un ejemplo son las etiquetas de radiofrecuencia RFID, finalmente la variedad nos habla sobre los diferentes tipos de formatos en los cuales los datos se encuentran disponibles, ejemplo, videos, fotos, archivos de texto, etc.
Las técnicas de análisis estadístico, así como los modelos de inteligencia aplicados para la asimilación de los datos debe tener en consideración que los datos son complejos, ya que provienen de fuentes diversas, Streaming Data (Datos que se generan constantemente a través de una n’ cantidad de fuentes de datos), Internet of things (Interconexión digital de los objetos en internet) y los sistemas conectados (Industria 4.0), haciendo que el procesamiento y análisis de los datos adquiridos no sea una tarea sencilla, en respuesta a este problema se están desarrollando sistemas de aprendizaje, como son las redes neuronales (modelo matemáticos compuestos de neuronas artificiales) que implementan una seria de algoritmos que generan conocimientos partiendo de los datos recibidos en tiempo real.
El BD es una tendencia merecedora de numerosas investigaciones, debido a que se cuenta con una gran cantidad de datos, pero de limitadas técnicas para analizarlos de manera eficiente y generar indicadores y patrones que le den un sentido de pertinencia a los mismos.
La comunidad científica está trabajando constantemente en el desarrollo de nuevos modelos que permita implementar de forma correcta la información disponible. En Venecia, Italia se llevó a cabo el evento: The future of science 2016: tutto sulla rivoluzione digitale (Todo sobre la revolución digital), donde se hablaron de los nuevos clusters en el mundo digital, de ciudades inteligentes, sociedad digital, mundo digital en la medicina, etc., teniendo en común que cada sector tiene la peculiaridad de generar una gran cantidad de datos. Tomando como ejemplo en el campo de la medicina, el análisis de los datos generados que permitirá desarrollar diversos tipos de software que tengan la capacidad de evaluar la posibilidad de prevenir el brote de una nueva epidemia; también será posible reducir los tiempos para el desarrollo de nuevos tratamientos médicos y sobre todo identificar cómo prevenir enfermedades y mejorar la calidad de vida de un paciente (Borghi, 2016).
El BD permitirá también hacer eficientes los procesos de manufactura, ya que consentirá una interconectividad entre cada uno de los sistemas que integren una cadena de producción, teniendo la capacidad de tomar decisiones en tiempo real con base a un análisis de las causas de fallo más comunes, buscar la forma de eliminar cuellos de botella y reducir la cantidad de productos fuera de norma. En las ciudades inteligentes será posible identificar problemas y eficientar las formas de solución, identificar riesgos naturales y comunes para evitar que sucedan, mejorar la conectividad de posicionamiento global identificando las vías más idóneas para llegar al nivel deseado, disminuyendo el consumo de combustibles y evitando la generación de tránsito vehicular.
Como se puede apreciar la tendencia del BD tendrá una gran cantidad de ventajas, pero también presenta algunos inconvenientes; por lo cual los expertos en informática y análisis de datos tendrán la tarea de buscar nuevas formas de eficientar el proceso, integrando nuevas formas de asimilar y comprender la gran cantidad de datos que se disponen cada día en su diversa cantidad de formatos, ya que hoy en día sólo un muy bajo porcentaje de los datos es utilizado. Otro problema que se debe que tomar en cuenta es la privacidad, la cual puede ser solventada por programas cada vez más fidedignos para la protección de los datos, así como la creación de políticas públicas que garanticen el buen uso de los mismos. Esta tendencia ha llegado a nosotros como una buena oportunidad para mejorar nuestra calidad de vida con base a un análisis histórico de los hábitos cotidianos de una población, modelando sistemas inteligentes y una mejor conectividad de las cosas y de las personas.
Fuente: ADRIANNI ZANATTA ALARCÓN and SAID ROBLES CASOLCO, Politecnico di Milano–Universidad Autónoma del Estado de Morelos, [email protected], [email protected]