Este repositorio contiene el trabajo final para la materia Fundamentos para la Ciencia de Datos de la Especialización en Ciencia de Datos (UNLaM), bajo la cátedra de la Prof. Silvia N. Pérez.
Este proyecto fue desarrollado en R para análisis exploratorio, visualización de datos y modelado predictivo. A continuación se listan las principales librerías utilizadas, agrupadas por su funcionalidad:
Construir y comparar modelos estadísticos para predecir la presencia de miopía en niños, utilizando variables biométricas y de estilo de vida. El análisis se llevó a cabo sobre un dataset clínico real de 618 niños.
- Análisis Exploratorio de Datos (EDA)
- Regresión Logística (con selección automática
stepwise) - Clasificación Naive Bayes
- Evaluación de modelos mediante métricas como AUC, sensibilidad, especificidad y exactitud
TP_miopia_infantil.pdf: Informe final del trabajo prácticoTP_Final_miopia_infantil_scripts.R: Código completo del análisis en RTP_Final_miopia_infantil_scripts.Rmd: Documento RMarkdown con visualizaciones interactivas y vistas en HTML
- El modelo de regresión logística con selección
stepwisemostró el mejor rendimiento (AUC = 0.873) - Las variables más significativas fueron:
med_spheq(equivalente esférico)hs_mes_deporte(horas mensuales de deporte)padre_miopia(antecedente familiar)
- La sensibilidad y especificidad varían según el umbral elegido, lo cual es clave según el objetivo clínico.
| Yesica Fica Millán | Florencia Miranda Charca | Franco Petraroia |
|---|---|---|
Este proyecto se comparte con fines académicos y educativos.