Skip to content

KhalilFall/Introduction-to-spark_Data221

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Introduction-to-spark_Data221

Webinaire organisé par la communauté Data221 (https://www.facebook.com/Data-221-100661041401188/) qui est une communauté de passionnés de la data avec des profils assez diversifiés de Data Scientists, Staticiens, Data Engineer ...

Mes interventions sont disponibles sur youtube via les liens suivants

1- Introduction à Scala ==> https://www.youtube.com/watch?v=q0RVrtfWMbg&ab_channel=Data221

2- Introduction à Spark ==> https://www.youtube.com/watch?v=hWONikk2jLE&ab_channel=Data221

Prérequis pour utiliser les notebooks présents dans le dossier Notebooks dans la plateforme Databricks

  • Importer le fichier Data/titanic.csv dans DBFS (dans la plateforme databricks)

    1- Cliquer sur le logo de Databricks, pour aller dans la page d'acceuil de Databricks

    drawing

    2- Drag et Drop directement le fichier à importer sur la page ou cliquer sur "click to browse" et choisissez le fichier

  • Importer les notebooks

    1- Cliquer sur l'icone Notebook (1) puis sur la petite flêche à droite de Workspace (2) et finalement appuyer sur importer (3)

    drawing

    2- Choisir et importer le fichier

    drawing
  • Créer un cluster

    1- Se rendre dans la page de création de cluster

drawing

2- Choisir un nom puis créer un cluster, je vous conseille de conserver les valeurs par défauts

drawing

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages