Webinaire organisé par la communauté Data221 (https://www.facebook.com/Data-221-100661041401188/) qui est une communauté de passionnés de la data avec des profils assez diversifiés de Data Scientists, Staticiens, Data Engineer ...
Mes interventions sont disponibles sur youtube via les liens suivants
1- Introduction à Scala ==> https://www.youtube.com/watch?v=q0RVrtfWMbg&ab_channel=Data221
2- Introduction à Spark ==> https://www.youtube.com/watch?v=hWONikk2jLE&ab_channel=Data221
Prérequis pour utiliser les notebooks présents dans le dossier Notebooks dans la plateforme Databricks
-
Importer le fichier Data/titanic.csv dans DBFS (dans la plateforme databricks)
1- Cliquer sur le logo de Databricks, pour aller dans la page d'acceuil de Databricks
2- Drag et Drop directement le fichier à importer sur la page ou cliquer sur "click to browse" et choisissez le fichier
-
Importer les notebooks
1- Cliquer sur l'icone Notebook (1) puis sur la petite flêche à droite de Workspace (2) et finalement appuyer sur importer (3)
2- Choisir et importer le fichier
-
Créer un cluster
1- Se rendre dans la page de création de cluster
2- Choisir un nom puis créer un cluster, je vous conseille de conserver les valeurs par défauts