Skip to content

Commit f42fc1b

Browse files
authored
Update datatable-intro.Rmd #7220 realign
based on $ git diff 2f49a0d HEAD ./vignettes/datatable-intro.Rmd diff --git a/vignettes/datatable-intro.Rmd b/vignettes/datatable-intro.Rmd index a0ce8bf..cc8ffca 100644
1 parent fae27ca commit f42fc1b

File tree

1 file changed

+30
-5
lines changed

1 file changed

+30
-5
lines changed

vignettes/fr/datatable-intro.Rmd

Lines changed: 30 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -11,7 +11,7 @@ vignette: >
1111

1212
```{r echo=FALSE, file='../_translation_links.R'}
1313
```
14-
`r .write.translation.links("Translations of this document are available in: %s")`
14+
`r .write.translation.links("Une traduction de ce document est disponible en : %s")`
1515

1616
```{r, echo = FALSE, message = FALSE}
1717
require(data.table)
@@ -101,7 +101,7 @@ Vous pouvez aussi convertir des objets existants en une `data.table` en utilisan
101101
getOption("datatable.print.nrows")
102102
```
103103
104-
* `data.table` ne définit ni n'utilise jamais de *nom de ligne*. Nous verrons pourquoi dans la vignette *"Sous-ensemble basé sur des clés et recherche binaire rapide"*.
104+
* `data.table` ne définit ni n'utilise jamais de *nom de ligne*. Nous verrons pourquoi dans la [`vignette("datatable-keys-fast-subset", package="data.table")`](datatable-keys-fast-subset.html).
105105
106106
### b) Forme générale - dans quel sens la 'data.table' est-elle *étendue* ? {#enhanced-1b}
107107
@@ -479,7 +479,7 @@ ans
479479

480480
**Clés :** actuellement `keyby` en fait un peu plus que *simplement trier*. Il *définit une clé* également après le tri en initialisant un `attribute` appelé `sorted`.
481481

482-
Nous en apprendrons plus au sujet des `clés` dans la vignette *Clés et sous-ensembles basés sur la recherche binaire rapide*; pour l'instant, tout ce que vous devez savoir est que vous pouvez utiliser `keyby` pour trier automatiquement le résultat selon les colonnes spécifiées dans `by`.
482+
Nous en apprendrons plus au sujet des `clés` dans la [`vignette("datatable-keys-fast-subset", package="data.table")`](datatable-keys-fast-subset.html); pour l'instant, tout ce que vous devez savoir est que vous pouvez utiliser `keyby` pour trier automatiquement le résultat selon les colonnes spécifiées dans `by`.
483483

484484
### c) Chaînage
485485

@@ -643,6 +643,31 @@ DT[, print(list(c(a,b))), by = ID] # (2)
643643

644644
Dans (1), pour chaque groupe, un vecteur est renvoyé, de longueur = 6,4,2 ici. Néanmoins, (2) renvoie une liste de longueur 1 pour chaque groupe, dont chaque premier élément contient des vecteurs de longueur 6,4,2. C'est pourquoi, (1) a pour longueur totale `6+4+2 =`r 6+4+2``, alors que (2) renvoie `1+1+1=`r 1+1+1``.
645645

646+
La flexibilité de j nous permet de ranger toute liste d'objets comme un élément de data.table. Par exemple lorsque des modèles statistiques sont adaptés aux groupes, ils peuvent être placés dans un data.table. Le code est concis et facile à comprendre.
647+
648+
```{r}
649+
## les vols long courrier couvrent-ils les retards au départ davantage que les vols à courte distance ?
650+
## la couverture varie-t-elle selon les mois ?
651+
flights[, `:=`(makeup = dep_delay - arr_delay)]
652+
653+
makeup.models <- flights[, .(fit = list(lm(makeup ~ distance))), by = .(month)]
654+
makeup.models[, .(coefdist = coef(fit[[1]])[2], rsq = summary(fit[[1]])$r.squared), by = .(month)]
655+
```
656+
657+
Avec les data.frames il nous faut un code plus complexe pour obtenir le même résultat.
658+
659+
```{r}
660+
setDF(flights)
661+
flights.split <- split(flights, f = flights$month)
662+
makeup.models.list <- lapply(flights.split, function(df) c(month = df$month[1], fit = list(lm(makeup ~ distance, data = df))))
663+
makeup.models.df <- do.call(rbind, makeup.models.list)
664+
data.frame(t(sapply(
665+
makeup.models.df[, "fit"],
666+
function(model) c(coefdist = coef(model)[2L], rsq = summary(model)$r.squared)
667+
)))
668+
setDT(flights)
669+
```
670+
646671
## Résumé
647672

648673
La forme générale de la syntaxe de `data.table` est :
@@ -659,7 +684,7 @@ Jusqu'ici nous avons vu que,
659684

660685
* Nous pouvons également trier un `data.table` en utilisant `order()`, qui utilise en interne l’algorithme de tri rapide de data.table pour de meilleures performances.
661686

662-
Nous pouvons faire beaucoup plus dans `i` en créant une `data.table` avec clés, ce qui permet de réaliser rapidement les sous-ensembles et les jointures. Nous verrons cela dans les vignettes *"Clés et sous-ensembles basés sur la recherche binaire rapide"* et *"Jointures et jointures liées au temps"*.
687+
Nous pouvons faire beaucoup plus dans `i` en créant une `data.table` avec clés, ce qui permet de réaliser rapidement les sous-ensembles et les jointures. Nous verrons cela dans les [`vignette("datatable-keys-fast-subset", package="data.table")`](datatable-keys-fast-subset.html) et [`vignette("datatable-joins", package="data.table")`](datatable-joins.html).
663688

664689
#### En utilisant `j` :
665690

@@ -693,7 +718,7 @@ Nous pouvons faire beaucoup plus dans `i` en créant une `data.table` avec clés
693718

694719
Tant que `j` renvoie un objet `list`, chaque élément de la liste va devenir une colonne du `data.table` résultant.
695720

696-
Nous verrons dans la vignette suivante comment *ajouter / mettre à jour / supprimer* des colonnes *par référence* et comment les combiner avec `i` et `by` .
721+
Nous verrons dans la prochaine [(`vignette("datatable-reference-semantics", package="data.table")`)](datatable-reference-semantics.html) comment *ajouter / mettre à jour / supprimer* des colonnes *par référence* et comment les combiner avec `i` et `by` .
697722

698723
***
699724

0 commit comments

Comments
 (0)