You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: w7/w7-s10-x2-coronavirus.md
+6-81Lines changed: 6 additions & 81 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -9,11 +9,12 @@ jupytext:
9
9
extension: .md
10
10
format_name: myst
11
11
kernelspec:
12
-
display_name: Python 3
12
+
display_name: Python 3 (ipykernel)
13
13
language: python
14
14
name: python3
15
15
language_info:
16
16
name: python
17
+
nbconvert_exporter: python
17
18
pygments_lexer: ipython3
18
19
nbhosting:
19
20
title: 'Exercice: coronavirus'
@@ -233,97 +234,21 @@ df1.plot();
233
234
234
235
## Exercice 2: idem mais à partir d'un autre jeu de données
235
236
236
-
+++
237
-
238
237
Je vous signale une autre source de données, dans ce repo git <https://github.com/owid/covid-19-data/tree/master/public/data>; les données cette fois-ci sont au format excel, et publiées à cette adresse
Dans ces cas-là il faut avoir le réflexe d'utiliser pandas; voici un aperçu (ayez de la patience pour le chargement)
245
-
246
-
```{code-cell} ipython3
247
-
import pandas as pd
243
+
```{admonition} mise à jour oct. 2025
244
+
:class: danger
248
245
249
-
df = pd.read_csv(alt_url)
246
+
il semble que cette URL est à présent inaccessible
247
+
je supprime donc le deuxième exercice de ce notebook
250
248
```
251
249
252
-
```{code-cell} ipython3
253
-
df.head(2)
254
-
```
255
-
256
-
### Un sujet possible (#2)
257
-
258
-
+++
259
-
260
-
Le sujet à la base est le même bien entendu, essayer de visualiser ces données sous une forme où on y perçoit quelque chose :)
261
-
262
-
Les données sont bien entendu beaucoup plus riches, *a contrario* cela va demander davantage de mise en forme avant de pouvoir visualiser quoi que ce soit.
263
-
264
-
Je vous propose ce second point de vue si vous souhaitez vous entraîner avec `pandas`, puisqu'ici on a déjà une dataframe (ce qui ne veut pas dire qu'on ne peut pas traiter le premier exercice en utilisant `pandas`).
265
-
266
-
+++
267
-
268
-
### Explorons un peu
269
-
270
250
+++
271
251
272
-
Voici quelques éléments sur la stucture de ces données :
273
-
274
-
```{code-cell} ipython3
275
-
# beaucoup plus de détails
276
-
df.columns
277
-
```
278
-
279
-
```{code-cell} ipython3
280
-
# la colonne iso_code représente le pays :
281
-
df.iso_code.unique()[:5]
282
-
```
283
-
284
-
```{code-cell} ipython3
285
-
# rien que sur la france, on a ce nombre d'enregistrements
286
-
df_france = df[df.iso_code == 'FRA']
287
-
len(df_france)
288
-
```
289
-
290
-
```{code-cell} ipython3
291
-
# manifestement c'est un par jour
292
-
df_france.head(2)
293
-
```
294
-
295
-
```{code-cell} ipython3
296
-
df_france.tail(2)
297
-
```
298
-
299
-
Pour afficher, disons les décès par jour en France depuis le début de la pandémie, on pourrait faire :
300
-
301
-
```{code-cell} ipython3
302
-
df_france.plot(x='date', y='new_deaths');
303
-
```
304
-
305
-
```{code-cell} ipython3
306
-
# n'hésitez pas à installer des packages
307
-
# supplémentaires au besoin
308
-
!pip install plotly-express
309
-
```
310
-
311
-
```{code-cell} ipython3
312
-
# plusieurs courbes en une
313
-
# avec plotly express, pour changer un peu
314
-
import plotly.express as px
315
-
316
-
selection = ['USA', 'FRA']
317
-
318
-
start = '2020-03-15'
319
-
date_start = start
320
-
#date_start = pd.to_datetime(start)
321
-
sel = df[(df.iso_code.isin(selection)) & (df.date > date_start)]
0 commit comments