You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: episodes/clean-data.Rmd
+18-7Lines changed: 18 additions & 7 deletions
Original file line number
Diff line number
Diff line change
@@ -232,10 +232,13 @@ Les données constantes se réfèrent principalement aux lignes et colonnes vide
232
232
cleaned_df <- df %>%
233
233
cleanepi::remove_constants() %>%
234
234
cleanepi::remove_duplicates()
235
+
```
235
236
236
-
#print_report(cleaned_df, "constant_data")
237
+
```r
238
+
print_report(cleaned_df, "constant_data")
237
239
```
238
240
241
+
239
242
- indices des doublon : aucun
240
243
- colonnes vides :
241
244
- premiere itération: col5
@@ -250,9 +253,12 @@ Faites remarquer aux apprenants qu'ils peuvent obtenir des résultats différent
250
253
```{r}
251
254
cleaned_df <- df %>%
252
255
cleanepi::remove_constants(cutoff = 0.5)
256
+
```
253
257
254
-
#print_report(cleaned_df, "constant_data")
258
+
```r
259
+
print_report(cleaned_df, "constant_data")
255
260
```
261
+
256
262
:::::::::::::::
257
263
258
264
### Remplacer les valeurs manquantes
@@ -276,7 +282,8 @@ Chaque entrée du jeu de données représente un individu (par exemple, un patie
276
282
La librairie `{cleanepi}` propose la fonction `check_subject_ids()` permettant de vérifier si les identifiants des individus sont uniques et s'ils satisfont aux critères établis par l'utilisateur.
277
283
278
284
```{r}
279
-
# vérifier si les identifiants des individus comportent des nombres variant entre 0 et 15000
285
+
# vérifier si les identifiants des individus comportent des nombres
286
+
# variant entre 0 et 15000
280
287
sim_ebola_data <- cleanepi::check_subject_ids(
281
288
data = sim_ebola_data,
282
289
target_columns = "case_id",
@@ -425,15 +432,17 @@ Pour simplifier la correction des valeurs mals orthographiées, nous avons intro
425
432
orthographiées seront ainsi substituées par les vraies valeurs qui leurs sont orthographiquement plus proches.
426
433
427
434
```{r}
428
-
# remplacer automatiquement les valeurs mals orthographiées de la colonne 'status' avec les vraies
435
+
# remplacer automatiquement les valeurs mals orthographiées de la
0 commit comments