Skip to content
View JosueAfouda's full-sized avatar
🏠
Working from home
🏠
Working from home

Block or report JosueAfouda

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
JosueAfouda/README.md

Data Science Banner

👋 Bonjour, je suis Josué AFOUDA

Expert Data Scientist • Machine Learning Engineer • Data Engineer


💫 About Me:

  • Data Scientist | ML Engineer | Data Engineer avec 7+ ans d’expérience en solutions data de bout en bout.
  • Spécialiste R Shiny, Python, SQL, PySpark, Databricks, Azure, GCP.
  • Réalisations :

    • Pipelines Big Data (2M+ transactions/jour)
    • Apps interactives R Shiny & dashboards Power BI (40+ utilisateurs)
    • Intégration ML (+12% précision) & automatisation (8h → 15 min)
  • Disponible pour missions freelance Data Science / ML / Data Eng.

💻 Tech Stack:

Python R Bash Script Azure Google Cloud Git GitHub GitLab PyTorch MySQL SQLite Postgres scikit-learn Power Bi Apache Spark FastAPI Apache Airflow Streamlit Docker Snowflake


Langages & Frameworks

  • Python | R | SQL | PySpark | Sparklyr
  • Pandas | Tidyverse | Scikit-Learn | TensorFlow | PyTorch | XGBoost
  • R Shiny | Streamlit | FastAPI

Cloud & BI

  • Azure | GCP | BigQuery | Snowflake | Power BI | Posit Connect

DevOps & MLOps

  • Docker | GitHub Actions | Azure DevOps | OpenShift | Jenkins
  • CI/CD | Airflow | Google Cloud Composer

📊 Réalisations marquantes

  • 2M+ transactions/jour traitées dans des pipelines PySpark & Databricks
  • Intégration de modèles ML (LSTM, AutoEncoder) en production, +12% de précision
  • Développement de 6 applications R Shiny et 4 dashboards Power BI adoptés par 40+ managers
  • Automatisation de 1 200+ fichiers Excel/mois : gain de temps 8h → 15 min
  • Formation de 50+ utilisateurs métiers et adoption pérenne des outils data

🌟 Ce que je peux apporter

✅ Expertise technique solide & approche orientée business
✅ Solutions scalables et maintenables
✅ Communication fluide avec les équipes métiers
✅ Livraison rapide avec haute qualité


📊 GitHub Stats:



🔝 Top Contributed Repo


📫 Me contacter


📢 Disponible pour des missions freelance en Data Science, Machine Learning et Data Engineering.

Pinned Loading

  1. movielens-project movielens-project Public

    Python 1 1

  2. databricks-end-to-end-nyc-taxi-pipeline databricks-end-to-end-nyc-taxi-pipeline Public

    1 1

  3. delta-live-tables-databricks delta-live-tables-databricks Public

    Découverte de DLT et Projet pratique

    Python

  4. datascience-on-gcp datascience-on-gcp Public

    Data Science on the Google Cloud Platform (GCP)

    Python

  5. Credit-Risk-Modeling Credit-Risk-Modeling Public

    Python 3 6

  6. Reporting-with-Python Reporting-with-Python Public

    Jupyter Notebook