Skip to content

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos

Repository files navigation

Bienvenidos al repositorio de la materia Análisis de Datos! Aquí encontrarán los materiales de clase, notebooks, datasets y recursos adicionales.


📂 Estructura del Repositorio

  • notebooks/ → Contiene las notebooks con los ejemplos y ejercicios de cada clase.
  • datasets/ → Conjunto de datos utilizados en los ejemplos y prácticas.
  • recursos/ → Ejericios, reportes y otros materiales útiles.
  • scripts/ → One-offs / no reutilizable.
  • utils/ → Funciones auxiliares utilizadas en las notebooks.

⚠️ Recordá que las diapositivas de las clases y los enunciados de los TPs se encuentran en el Campus posgrado de la FIUBA.


🎓 ¿Sos alumno de una cohorte anterior? Encontrá aquí las instrucciones para descargar los contenidos correspondientes a tu curso y bimestre.


📝 Contenido del Curso

Atención! Las notebooks se agregan antes de cada clase

Clase Tema Notebooks
1️⃣ Introducción al Análisis de Datos notebook_clase_1
2️⃣ Análisis exploratorio de datos (EDA).
Análisis de datos faltantes y outliers.
notebook_clase_2_EDA
notebook_clase_2_faltantes_outliers
notebook_clase_2_caso_practico

📚 Bibliografía recomendada aquí.


📅 Fechas importantes

  • Presentación del trabajo práctico final:
    • Sesión 1: miércoles 22 de abril de 2026.
    • Sesión 2: sábado 25 de abril de 2026.


⚙️ Instalación y Configuración del Entorno

En esta sección se explican los pasos para utilizar este repositorio.

➡️ Opción 1: Usar un env de Conda

Prerrequisitos

  • Anaconda o miniconda
  • Git

1. Clonar el repositorio:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

2. Crear y activar el environment:

conda env create -f environment.yml
conda activate add-env

3. Abrir Jupyter:

jupyter notebook

➡️ Opción 2: Usar un env de Poetry o UV

Este proyecto también permite usar Poetry o UV para manejo de dependencias. Seguir los pasos detallados a continuación para crear un environment a partir del archivo pyproject.toml proporcionado.

Prerrequisitos

A1/B1. Clonar el repo:

git clone https://github.com/FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos.git
cd CEIA_Analisis_de_datos

Opción A - Poetry

A2. Crear el environment (ejemplo con Python 3.11, ajustar a 3.12 de ser necesario):

  • macOS/Linux
poetry env use python3.11  
  • Windows
poetry env use py -3.11 

A3. Instalar dependencias (Linux/MacOS/Windows):

poetry install --no-root

A4. Verificar que el environment se instaló correctamente:

poetry env list

Este comando devuelve todos los environments asociados al proyecto (verificar que ceia-analisis-de-datos-xxxxxxx-py3.11 aparece en la lista)

poetry env info

Este comando muestra detalles tales como la versión de Python y el path (ej., /Users/<username>/Library/Caches/pypoetry/virtualenvs/... en macOS o C:\Users\<username>\AppData\Local\pypoetry\... en Windows).

A5. Activar el environment:

  • macOS/Linux (zsh/bash) y Windows (PowerShell/CMD):
poetry shell 

Después de ejecutar el comando, el nombre del environment debería aparecer en el prompt de la terminal entre paréntesis (ej., ceia-analisis-de-datos-py3.11).

A6. Verificar activación:

python --version

Debería mostrar Python 3.11.X o 3.12.X.

Luego, ejecutar:

which python  # macOS/Linux
where python  # Windows

Debería apuntar al Pyhton del env. de Poetry (ej., /Users//Library/Caches/pypoetry/virtualenvs/ceia-analisis-de-datos-xxxxx-py3.11/bin/python o C:\Users<username>\AppData\Local\pypoetry\Cache\virtualenvs\ceia-analisis-de-datos-xxxxx-py3.11\Scripts\python.exe).

Saltar al paso A7/B6 para registrar el environment en Jupyter.


Opción B - UV

B2. Crear el environment (ejemplo con Python 3.11, ajustar a 3.12 de ser necesario):

  • macOS/Linux/Windows
uv venv --python 3.11 

B3. Activar el environment:

  • macOS/Linux (zsh/bash):
source .venv/bin/activate 
  • Windows (PowerShell):
.venv\Scripts\activate
  • Windows (CMD):
.venv\Scripts\activate.bat

B4. Instalar dependencias (Linux/MacOS/Windows):

uv pip install -e .

B5. Verificar activación:

python --version

Debería mostrar Python 3.11.X o 3.12.X.

Luego, ejecutar:

which python  # macOS/Linux
where python  # Windows

Debería apuntar al Pyhton del env. de UV (ej., /path/to/CEIA_Analisis_de_datos/.venv/bin/python en macOS/Linux o C: C:\path\to\CEIA_Analisis_de_datos.venv\Scripts\python.exe en Windows).

Continuar al paso A7/B6 para registrar el environment en Jupyter.


A7/B6. Registrar el environment en Jupyter:

python -m ipykernel install --user --name=ceia-analisis-de-datos --display-name "Python (CEIA)"

A8/B7. Abrir Jupyter y seleccionar el kernel correcto:

jupyter notebook

Una vez abierto Jupyter, ir a KernelChange Kernel y seleccionar "Python (CEIA)".


➡️ Opción 3: Usar Google Colab

Al momento de la actualización de este repositorio (Marzo 2025) Colab utiliza Python 3.11 y no debería haber inconvenientes para ejecutar las notebooks de la materia con esta herramienta. Pasos a seguir:

  1. Desde Colab, ir al menú File y hacer click en Open Notebook.

  2. En la nueva ventana que se abre, ir a la opción GitHub (en el menú de la derecha).

  3. En la barra buscadora, copiar el nombre del repo:

FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos
  1. Asegurarse que en Repository aparezca el nombre correcto (FIUBA-Posgrado-Inteligencia-Artificial/CEIA_Analisis_de_datos) y la branch sea main. Hacer click en la notebook deseada para abrir.

📫 Contacto