-
Docker Desktop + Docker Compose installés.
-
Git cloné en local :
git clone https://github.com/aithassouelias/data-gouvernance.git
- Créer le dossier data à la racine (copie des fichiers de données CSV fournit au format zip) :
mkdir data
docker compose -f docker-compose.yml -f docker-compose-openmetadata.yml up -d
Cette commande lance :
- l’instance Postgres (dq_db),
- le conteneur d’exploration,
- Superset,
- OpenMetadata (serveur + DB + ingestion).
docker compose up -d postgres
docker compose up exploration
Rapports générés dans ./exploration/html/*.html
docker compose up validation
Livrables générés :
- /results/validation_history.csv,
- /results/superset_validation_metrics.csv,
- /data/validation_history.csv (dupliqué),
- /data/superset_validation_metrics.csv (dupliqué),
- /reports/gx_data_docs/rapport_validation_qualite.html.
docker compose up -d superset
docker compose -f docker-compose.yml -f docker-compose-openmetadata.yml up -d openmetadata
-
PostgreSQL (couche 1)
- Host : localhost
- Port : 5433
-
Profiling des données (couche 2) :
- Les fichiers HTML de profiling automatique sont dans le dossier :
exploration/html
- Les fichiers HTML de profiling automatique sont dans le dossier :
-
Apache Superset (couche 4)
- URL :
http://localhost:8088 - Identifiants par défaut :
admin / admin - Connexion PostgreSQL (Settings → Databases → + Database → SQLAlchemy URI) :
postgresql://dq_user:dq_pass@postgres:5432/dq_db
- Cette connexion permet à Superset d’accéder à la base
dq_dbdu conteneurpostgres. - Import du dashboard de data quality :
- Télécharger
Dashboard-export.zipdepuis le dépôt GitHub - Aller dans Dashboards → Import Dashboard
- Cliquer sur Select file et choisir
Dashboard-export.zip - Valider pour recréer le tableau de bord
- Télécharger
- Les captures d’écran du dashboard sont disponibles dans le répertoire
Captures_Dashboarddu dépôt.
- URL :
-
OpenMetadata (couche 5) :
- URL : http://localhost:9000
- Login: Ces informations ont été fournies par email au professeur, sinon créer un nouveau compte OpenMetadata.
- Les métadonnées de la base de données sont exportées dans le fichier
openmetadata/db_data_catalog.csv, celles-ci peuvent être importées dans l'outil si besoin
- Abdeljebbar ABID
- Yousra BOUHANNA
- Elias AIT HASSOU