Este repositorio contiene un proyecto que integra análisis de datos basado en la evaluación de perfiles OCEAN (Big Five) y la preferencia musical. Utilizamos herramientas de Python y Google Sheets para analizar respuestas de formularios, generar perfiles de personalidad y evaluar su alineación con calificaciones de melodías propuestas.
El objetivo es enseñar a los asistentes a:
- 🖥️ Procesar datos en tiempo real desde Google Sheets utilizando APIs.
- 📊 Realizar análisis exploratorio y modelamiento para asignar perfiles basados en rasgos OCEAN.
- 🎶 Evaluar la concordancia entre los perfiles de personalidad y las calificaciones musicales.
- 🛠️ Aplicar un pipeline analítico utilizando Python, fomentando las buenas prácticas en ciencia de datos.
| 🧩 Etapa | 🔍 Descripción | 🛠️ Herramientas |
|---|---|---|
| 1. Sources | Obtención de datos desde Google Sheets mediante Google Cloud Console. | API Google Sheets, Python |
| 2. Procesamiento | Limpieza y transformación de datos en un DataFrame. | Pandas |
| 3. Modelamiento | Cálculo de puntajes OCEAN, asignación de perfiles y clustering (K-Means). | Scikit-learn, Numpy |
| 4. Evaluación | Análisis de la alineación entre perfiles y melodías calificadas, y sugerencias de mejora. | Python, DataFrames |
| 5. Exportación | Exportación de los resultados finales a Excel y publicación en un entorno compartido. | Pandas, Google Drive |
| 6. Visualización | (Opcional) Generación de visualizaciones para explorar los resultados obtenidos. | Matplotlib, Seaborn |
- Google Cloud Console configurado para la API de Google Sheets.
- Acceso a una cuenta de Google Drive.
- Librerías de Python:
pandasnumpyscikit-learngoogle-authgoogle-auth-oauthlibopenpyxl
-
Google Cloud Console:
- 🔐 Configura una cuenta de servicio y genera un archivo JSON con las credenciales.
- ✅ Habilita la API de Google Sheets.
- 📄 Comparte el archivo Google Sheet con el correo de la cuenta de servicio.
-
Google Colab o Jupyter Notebook:
- 📂 Monta tu Google Drive.
- 📦 Instala las dependencias necesarias.
Asegúrate de cargar las librerías y autenticar tu cuenta con el archivo JSON de credenciales.
- 📥 Lee el archivo desde Google Sheets y genera un DataFrame.
- 🔢 Calcula puntajes OCEAN y asigna perfiles.
- 🎯 Relaciona las calificaciones de melodías con los rasgos de personalidad.
- 📈 Genera métricas de concordancia y sugiere mejoras en los prompts.
Guarda los resultados en un archivo Excel compartido.
Genera gráficos que resalten insights clave, como la distribución de perfiles o la concordancia entre melodías y perfiles.
| 🚦 Semana | 📅 Actividad |
|---|---|
| 1 | Configuración inicial y procesamiento de datos. |
| 2 | Cálculo de puntajes y asignación de perfiles. |
| 3 | Evaluación de melodías y ajuste de prompts. |
| 4 | Exportación de resultados y preparación para el workshop. |
Este pipeline permite:
- 🤖 Automatizar el análisis de datos de formularios.
- ✅ Validar la alineación entre perfiles de personalidad y preferencias musicales.
- 🔄 Iterar sobre prompts para mejorar la experiencia de personalización.
Si tienes sugerencias o encuentras algún problema, no dudes en abrir un issue o hacer un pull request.
Este proyecto está disponible bajo la Licencia MIT.
🎉 ¡Gracias por participar en el Workshop! 🎉