@@ -118,3 +118,47 @@ Excel avec un graphe automatiquement depuis Python.
118118* :ref: `l-example-serialization `
119119* :ref: `l-example-plot-groupby `
120120* :ref: `Manipulation de données avec pandas <nbl-c_data-nb_pandas >`
121+
122+ Journée 3 (3/3)
123+ ===============
124+
125+ **Partie 1 **
126+
127+ * retour sur la syntaxe du langage python, boucle, test, fonctions et classes
128+ * exceptions
129+ * expressions régulières
130+ * pickle, fichiers pickle
131+ * tests unitaires
132+ * récupération des fichiers préparés pour la formation avec pandas
133+ * utilisation de skrub pour avoir un premier aperçu
134+
135+ **Partie 2 **
136+
137+ * rappel pandas: group by, jointure, inner, outer, left, right, pivot
138+ * gestion des doublons
139+ * une fois la base complète obtenue, analyse de nouveau
140+ * même opérations en SQL
141+ * identification des valeurs aberrantes
142+ * valeurs manquantes, remplacement simple (moyenne), corrélations (KNNImputer)
143+ * premières impressions
144+
145+ Journée 4 (4/3)
146+ ===============
147+
148+ **Partie 1 **
149+
150+ * retour sur les graphes matplotlib, seaborn, plotly, skrub
151+ * cartographie, cartopy, folium encore
152+ * corrélations, pairplots
153+ * gestion des dates
154+ * cubes de données avec pandas, passer un indice à droite, à gauche
155+ * on reprend chaque colonne
156+
157+ **Partie 2 **
158+
159+ * notion d'itérateur en python
160+ * application à pandas read_csv version itérateur pour manipuler des gros dataframes
161+ * utilisation de sqlite3 (extension sqlite3 vscode)
162+ * découpage d'une base en deux, apprentissage, respecter le temps et les identifiants
163+ * calcul du prix d'un contrat d'assurance pour un an en fonction de
164+ variables choisies
0 commit comments