Ateliers Data & ML 2025-2026

Rémy SIAHAAN--GENSOLLEN

Ce dépôt contient quelques ressources relatives aux ateliers que j'ai organisés pour l'association Tuxae durant l'année scolaire 2025-2026 à l'ENSAE Paris. Il est loin d'être complet, mais comprend notamment les jeux de données utilisés, des slides ainsi que quelques extraits de code. Ces ressources s'adressent principalement aux premières et deuxièmes années, la technicité des sujets abordés évoluant progressivement.

Les outils utilisés sont principalement des jeux de données publics (Kaggle, UC Irvine Machine Learning Repository, etc.), souvent accompagnés de slides en support, avec une démonstration de code en direct dans un environnement Jupyter hébergé sur le SSPCloud (Onyxia).

Ci-dessous un sommaire résumant très succinctement les ateliers :

0 - Introduction

Introduction à l'IA. Premier atelier pratique sur la classification avec kNN.

1 - Prédire le cancer du sein ?

Brève présentation historique du problème de la détection du cancer du sein, apport de la data. Introduction aux concepts de validation croisée (train-test-split, K-Fold, stratification...). Introduction au concept d'hyper-paramètre et hyper-parameter tunning (pas encore de grid search quelconque, juste une boucle). Autres métriques classiques pour la classification binaire (précision, rappel, f1). Standardisation / Recalibrage. Introduction à la régression logistique, mention des questions d'interprétabilité.

2 - Modèles linéaires généralisés

Retour sur les notions abordées. Introduction plus formelle à la notion de modèle supervisé. Régression linéaire, pénalisations Ridge, Lasso.

Atelier 3 - Prédire les décès du Titanic ?

Atelier d'introduction à Kaggle. Implémentation en python brut de premières solutions naïves.

Atelier 4 - Prédire les décès du Titanic ? #2

Atelier 5 - Introduction au Deep Learning

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
.idea		.idea
2024		2024
atelier-0		atelier-0
atelier-1		atelier-1
atelier-2		atelier-2
atelier-4		atelier-4
atelier-5		atelier-5
.python-version		.python-version
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Ateliers Data & ML 2025-2026

0 - Introduction

1 - Prédire le cancer du sein ?

2 - Modèles linéaires généralisés

Atelier 3 - Prédire les décès du Titanic ?

Atelier 4 - Prédire les décès du Titanic ? #2

Atelier 5 - Introduction au Deep Learning

About

Uh oh!

Releases

Packages

Languages

Tuxae/ateliers-data-2025-2026

Folders and files

Latest commit

History

Repository files navigation

Ateliers Data & ML 2025-2026

0 - Introduction

1 - Prédire le cancer du sein ?

2 - Modèles linéaires généralisés

Atelier 3 - Prédire les décès du Titanic ?

Atelier 4 - Prédire les décès du Titanic ? #2

Atelier 5 - Introduction au Deep Learning

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages