Por Mónica Alba
Cancún, Quintana Roo. (Agencia Informativa Conacyt).- Las analíticas del aprendizaje, junto con la minería de datos, conforman dos de las metodologías más innovadoras en el campo de la ciencia de datos para el análisis de información sobre los usuarios de un determinado sistema. Entre los ámbitos de aplicación de mayor demanda se encuentran recientemente los sistemas de aprendizaje, en su mayoría de nivel superior y posgrado, ya que permiten la recopilación, medición, análisis, interpretación y proyección de datos inherentes a los ambientes educativos, lo que favorece su optimización y un conocimiento real del desempeño académico de sus estudiantes.
Dentro del área de las tecnologías de la información, la ciencia de datos es un campo ampliamente explorado en los últimos años. El manejo de información masiva disponible actualmente en interfaces digitales permite obtener datos únicos sobre el comportamiento, intereses y tendencias de sus usuarios. De tal forma, la ciencia de datos ha desarrollado metodologías y herramientas de valiosa utilidad para áreas de publicidad y mercadotecnia, desarrollo de nuevos productos y servicios, turismo, medicina, Internet y redes sociales, entre otras.
En el ámbito de la educación, en 1995 los investigadores de la Universidad de Carnegie Mellon, en Estados Unidos, Albert T. Corbett y John R. Anderson, publicaron un modelo logarítmico, basado en las corrientes de ciencia de datos, que cambiaría la forma en que se diseñan, implementan y evalúan los procesos educativos. Dicho modelo se basó en lo que ellos llamaron registro del conocimiento —knowledge tracing— que permitía registrar el desempeño académico de estudiantes durante un proceso de aprendizaje y predecir estadísticamente su desempeño en exámenes finales.
Para 2005, se introdujo el concepto de minería de datos educativos —educational data mining— a partir del cual se desarrollaron varias corrientes de investigación para el manejo de datos que pretendían mejorar los procesos educativos y comprender, mediante modelos cuantitativos, la ciencia del aprendizaje. De acuerdo con Ryan Joazeiro de Baker y Paul Inventado, investigadores de la Universidad de Columbia, para 2022 todos los procesos de investigación educativa estarán basados en el uso de analíticas del aprendizaje y minería de datos.
Las analíticas del aprendizaje permiten brindar información precisa sobre evaluaciones diagnósticas y de desempeño de los estudiantes, la adaptabilidad y relevancia de recursos didácticos, la viabilidad sobre modalidades de estudio (presencial o virtual), así como la generación de modelos asociados a competencias de aprendizaje. De tal forma, todos estos datos cuantitativos se pueden combinar con datos cualitativos, psicométricos y sociodemográficos para una adecuada toma de decisiones durante el diseño de los planes de estudio.
Formación de expertos en ingeniería de datos
En respuesta a la tendencia mundial del desarrollo de metodologías aplicables dentro del campo de la ciencia de datos, la Universidad del Caribe, en Cancún, Quintana Roo, cuenta con un programa de estudios de licenciatura enfocado en la formación de profesionistas que se especialicen en la ingeniería de datos e inteligencia organizacional.
A partir del análisis del perfil de egreso de los estudiantes del Departamento de Ciencias Básicas e Ingenierías, de la Universidad del Caribe, se identificó la necesidad de ajustar la oferta educativa que cubriera la demanda creciente de especialistas requeridos en metodologías relacionadas con la ciencia de datos. Para lograrlo, se propusieron aplicar una metodología de analítica del aprendizaje para el propio proceso de planeación y diseño de la nueva licenciatura en ingeniería de datos e inteligencia organizacional.
En entrevista para la Agencia Informativa Conacyt, José Enrique Álvarez Estrada, profesor investigador asociado del Departamento de Ciencias Básicas e Ingenierías de la Universidad del Caribe, comentó sobre la importancia de utilizar métodos de analíticas del aprendizaje como herramientas de descubrimiento que pueden dar como resultado modelos de fenómenos más comprensibles, a diferencia de los protocolos de minería de datos educativos, en donde los métodos automatizados para el descubrimiento se limitan a lograr la mejor predicción posible del sistema, dejando fuera variables del comportamiento y dinámica de los usuarios.
“El proyecto que estamos desarrollando trata de encontrar variables que permitan predecir, con la mayor precisión posible, el éxito o fracaso académico de los estudiantes del Departamento de Ciencias Básicas e Ingenierías de la Universidad del Caribe, a partir de los datos que se registran durante su proceso de admisión —datos demográficos, resultados académicos, resultados del Examen Nacional de Ingreso a la Educación Media Superior (EXANI) y resultados psicométricos—”, comentó Álvarez Estrada.
A su vez, todas las herramientas aplicadas para el diseño de la oferta educativa forman parte del plan de estudios de esta nueva licenciatura, lo que está permitiendo diseñar, aplicar y evaluar en tiempo real una metodología que favorece el entorno de aprendizaje de los estudiantes, su desempeño y preparación académica, así como la calidad en contenidos del programa de estudios.
“A diferencia de los estudios de mercadeo, a nosotros no nos interesa el individuo en particular mientras hacemos el estudio, lo que nos interesa es cómo se comportan los individuos como grupo, lo que nos permite caracterizarlos en tribus o clústeres para poder identificar la tendencia del comportamiento de un nuevo individuo y poder agruparlo en la tribu que mejor se ajuste a sus necesidades y capacidades de aprendizaje”, agregó.
Indicadores tempranos de desempeño
“Aplicando metodologías de analíticas de aprendizaje, nos interesa saber si existen variables que correlacionen con el éxito o fracaso escolar, posibles de detectar desde pruebas tempranas. Una variable ya identificada es la cantidad de horas semanales que trabajan los estudiantes, en promedio 10 a 20 horas a la semana, lo que está por arriba de la media nacional. En lugar de ser estudiantes que trabajan, son trabajadores que estudian, lo que se refleja en un alto índice de reprobación en el primer semestre. Estos son datos que siempre han estado allí pero que nadie ha transformado en información y conocimiento para tomar decisiones para el óptimo rendimiento escolar de los estudiantes, generando perfiles a la medida que les permitan tener un mejor desempeño dentro de sus capacidades”, explicó Álvarez Estrada.
Curiosamente, los resultados han arrojado que el peor predictor del desempeño del estudiante es el promedio de bachillerato. No han encontrado una correlación entre el desempeño en el examen de ingreso y el promedio previo de los estudiantes. Una de las interpretaciones que ofrecen es que los estudiantes aptos para carreras de ingeniería, con un alto grado de pensamiento matemático y creatividad organizacional, se comportan como una tribu de individuos inquietos que podrían estar siendo penalizados en sus calificaciones debido a su conducta, lo cual agrega variables sociales que deben ser consideradas desde la formación previa de los estudiantes.
Para el análisis de datos, se han basado en software abierto. En particular, utilizan R y Python como lenguajes base, que a veces combinan con Weka o Hadoop, dependiendo de la magnitud y naturaleza de los datos que se pretenden analizar.
De acuerdo con Álvarez Estrada, parte esencial en la implementación de analíticas del aprendizaje es identificar los vicios regulares en la utilización de métodos cuantitativos. “No permitimos que los números hablen por sí mismos, sin asignar causalidades; queremos que los números sustenten las hipótesis que hemos elaborado. Las metodologías cuantitativas te arrojan qué y cómo, pero no el porqué, ya que este es cualitativo y debe estar analizado desde el contexto particular a cada sistema de estudio”.
La tendencia a corto plazo es lograr que las metodologías implementadas para las analíticas del aprendizaje favorezcan la toma de decisiones para el desempeño académico de los estudiantes. “Queremos lograr una toma de decisiones de cada estudiante y programa académico a partir de datos duros que reflejen el comportamiento real de los individuos y no de lo que se hace habitualmente con teorías y percepciones psicológicas, que necesitan un respaldo cuantitativo”, explicó.