Bonjour et bienvenue sur mon portfolio ! Je suis Grégoire Mureau, et ce dépôt rassemble l'intégralité des projets que j'ai réalisés dans le cadre de mon parcours Ingénieur IA chez OpenClassrooms.
Ces 11 projets m'ont permis de développer une expertise complète sur l'ensemble de la chaîne de valeur de la data science : de l'analyse exploratoire et la préparation de données, au développement de modèles de Machine Learning et Deep Learning (NLP, Vision), jusqu'à leur mise en production (MLOps, API, Cloud) et le cadrage de projets.
Le "Projet 2" est le premier projet technique du parcours, le P1 étant une initiation.
Ce parcours m'a permis d'acquérir et de mettre en pratique un large éventail de compétences :
- Analyse de Données & Data Cleaning : Analyse exploratoire (EDA), nettoyage de datasets (valeurs manquantes, aberrantes), tests statistiques (ANOVA, Khi²), feature engineering.
- Machine Learning (Supervisé & Non-Supervisé) : Modèles de scoring (Régression Logistique, Gradient Boosting), gestion du déséquilibre de classe, clustering (K-means, RFM), réduction de dimensionnalité (ACP).
- Interprétabilité des Modèles : Utilisation de SHAP et LIME pour expliquer les décisions des modèles.
- Deep Learning & NLP : Traitement de texte (TF-IDF, Word2Vec), analyse de sentiments, modèles d'embedding (BERT, USE), réseaux de neurones (LSTM, DistilBERT).
- Deep Learning & Computer Vision : Classification d'images (CNN, Transfer Learning), segmentation sémantique (U-Net, FPN), Vision Transformers (SegFormer).
- MLOps & Déploiement : Versionning (MLFlow), déploiement d'API (FastAPI, Streamlit), containerisation (Docker, Nginx), CI/CD (GitHub Actions), stockage (MinIO).
- Cloud & Big Data : Traitement distribué (PySpark), écosystème AWS (EMR, S3), architectures serverless (Azure Functions).
- Gestion de Projet IA & Éthique : Cadrage de projet (SCRUM), analyse de rentabilité (ROI), chiffrage (Cloud Azure), conformité RGPD, analyse des risques et des biais éthiques.
Voici la liste des 11 projets réalisés, chacun avec ses propres objectifs et défis techniques.
- Description : Analyse exploratoire et nettoyage d'un jeu de données sur le patrimoine arboré de Paris pour la Mairie.
- Compétences : Analyse de données, Nettoyage (Pandas), Gestion des anomalies, Visualisation (Matplotlib, Seaborn, Folium).
- Explorer le projet ➔
- Description : Nettoyage et préparation d'un dataset volumineux et imparfait pour une application de santé publique.
- Compétences : Data cleaning (large dataset), Feature engineering, Analyses statistiques (ACP, ANOVA), RGPD.
- Explorer le projet ➔
- Description : Développement d'un modèle de scoring pour évaluer le risque de défaut de paiement, avec un focus sur l'interprétabilité et l'optimisation métier.
- Compétences : Modélisation (LightGBM), Gestion des données déséquilibrées, Interprétabilité (SHAP, LIME), Métriques métier.
- Explorer le projet ➔
- Description : Création d'une segmentation client (RFM) à l'aide de SQL et d'algorithmes de clustering non-supervisé pour l'équipe marketing.
- Compétences : SQL, Clustering (K-means), Segmentation (RFM), Analyse de stabilité (ARI).
- Explorer le projet ➔
- Description : Étude de faisabilité pour classifier des produits e-commerce en utilisant leurs descriptions (NLP) et leurs images (Vision).
- Compétences : NLP (TF-IDF, BERT, USE), Computer Vision (SIFT, ORB, CNN, Transfer Learning), Classification multimodale.
- Explorer le projet ➔
- Description : Développement et déploiement MLOps complet (CI/CD, MLFlow) d'une API d'analyse de sentiments sur des tweets.
- Compétences : NLP (LSTM, Word2Vec, DistilBERT), MLOps (MLFlow, CI/CD), API (FastAPI), Déploiement.
- Explorer le projet ➔
- Description : Création d'un système de segmentation sémantique d'images de rue (U-Net, FPN) et déploiement via une API Dockerisée.
- Compétences : Computer Vision, Deep Learning (U-Net, FPN), MLOps (MLFlow, MinIO), API (FastAPI), Docker, Nginx.
- Explorer le projet ➔
- Description : Preuve de concept comparant les performances des CNN (FPN) et des Transformers (SegFormer) pour la segmentation urbaine.
- Compétences : Deep Learning, Vision Transformers (SegFormer), Benchmarking de modèles, Computer Vision.
- Explorer le projet ➔
- Description : Développement d'un système de recommandation de contenu (Content-Based) déployé sur une architecture serverless Azure Functions.
- Compétences : Système de recommandation, Content-Based Filtering, Cloud (Azure Functions), Streamlit, Serverless.
- Explorer le projet ➔
- Description : Pipeline d'extraction de features à grande échelle (Transfer Learning + PCA) sur un cluster Big Data AWS EMR.
- Compétences : Big Data (PySpark), Cloud (AWS EMR, S3), PCA distribuée, Transfer Learning (MobileNetV2).
- Explorer le projet ➔
- Description : Cadrage complet (Backlog, Coûts, RGPD, Risques) d'un projet d'application de recommandation de mode pour présentation au COMEX.
- Compétences : Gestion de projet IA, Product Management, Agile (SCRUM), Chiffrage (Azure), Analyse de risques, Éthique IA, RGPD.
- Explorer le projet ➔