Ingeniería de Características Basada en Ontologías para Mejorar el Rendimiento de Modelos de Machine Learning
Autor: Daniela Anaí Jiménez Gómez
Tutor: Ricardo Flores Moyano, Ph.D.
Carrera: Ingeniería en Ciencias de la Computación
Año: 2025
Este repositorio forma parte del proyecto de titulación titulado "Ingeniería de características basada en ontologías para mejorar el rendimiento de modelos de machine learning". La propuesta busca optimizar el proceso de ingeniería de características mediante el uso de ontologías como herramienta para enriquecer semánticamente los datos, facilitando su interpretación, organización y análisis.
El enfoque se aplica al contexto educativo, específicamente al problema de predicción del rendimiento académico de estudiantes. Comprender y anticipar el desempeño estudiantil permite a las instituciones educativas implementar intervenciones tempranas y personalizadas. Sin embargo, los datos educativos suelen ser heterogéneos y difíciles de estructurar, lo que afecta la calidad de los modelos predictivos.
La solución propuesta integra una ontología en el ámbito eduactivo que agrupa y define conceptos clave del entorno académico (como hábitos de estudio, condiciones familiares y salud del estudiante), mejorando así la representación semántica del conjunto de datos y aportando un marco estructurado para la generación de atributos utilizados en modelos de machine learning como:
✔ Modelos de predicción de calificaciones finales (G3).
✔ Clasificación de estudiantes según su desempeño.
✔ Detección de anomalías en el rendimiento educativo..