Skip to content

Commit b535ccf

Browse files
Merge pull request #30 from pierre-lamarche/modifs-pierre
modif formation manageurs
2 parents 97e5175 + dd22061 commit b535ccf

File tree

1 file changed

+20
-19
lines changed

1 file changed

+20
-19
lines changed

slides/formation_manageurs.qmd

Lines changed: 20 additions & 19 deletions
Original file line numberDiff line numberDiff line change
@@ -36,7 +36,7 @@ from: markdown+emoji
3636
## Introduction
3737

3838
* Version pour les _manageurs_ de la formation
39-
aux bonnes pratiques avec `R` et `Git`
39+
aux bonnes pratiques avec {{< fa brands r-project >}} et {{< fa brands git >}}
4040

4141
![](https://inseefrlab.github.io/formation-bonnes-pratiques-git-R/cards/version-boss/falcon.png){fig-align="center"}
4242

@@ -61,7 +61,7 @@ conventionnellement acceptées comme produisant des logiciels [**fiables**]{.ora
6161

6262
<br>
6363

64-
L'activité du statisticien / *datascientist* tend à se rapprocher de celle du développeur :
64+
L'activité du statisticien / *datascientist* tend à se rapprocher de celle du développeur (notion de [*citizen developpers*]{.orange }) :
6565

6666
- projets [**intenses en code**]{.orange}
6767

@@ -86,7 +86,7 @@ L'activité du statisticien / *datascientist* tend à se rapprocher de celle du
8686

8787
. . .
8888

89-
- Bonnes pratiques (`Git` et `R`): manière de réduire le [__poids de la maintenance__]{.orange}
89+
- Bonnes pratiques ({{< fa brands git >}} et {{< fa brands r-project >}}): manière de réduire le [__poids de la maintenance__]{.orange}
9090
- Sans brider la phase d'expérimentation
9191

9292
. . .
@@ -160,28 +160,28 @@ Une structuration de projet plus viable
160160
## Ressources communautaires {.smaller}
161161

162162
- [**Canaux de discussion**]{.orange}
163-
- A l'Insee
163+
- À l'Insee
164164
- Pour toute question sur [**Git**]{.blue2} : [Insee-Git-Gitlab](https://tchap.gouv.fr/#/room/#InseeGitGitlablPtu8f1Frns:agent.finances.tchap.gouv.fr)
165165
- Pour toute question [**stat/self**]{.blue2} : [Insee - Outils Stats v2](https://tchap.gouv.fr/#/room/#InseeOutilsStatsv2wtxSdth:agent.finances.tchap.gouv.fr)
166166
- Pour toute question spécifique à [**AUS/LS3**]{.blue2} : [Insee-DSI-Plateformes-Internes-Datascience](https://matrix.to/#/!bxlTbQgAEcLkRjoNPi:agent.finances.tchap.gouv.fr?via=agent.finances.tchap.gouv.fr&via=agent.agriculture.tchap.gouv.fr&via=agent.interieur.tchap.gouv.fr)
167-
- Plus largement sur [**R**]{.blue2}
167+
- Plus largement sur {{< fa brands r-project >}}
168168
- Sur `Tchap` : [Langage R (Tchap)](https://tchap.gouv.fr/#/room/#RdIezwNF:agent.finances.tchap.gouv.fr)
169169
- Sur `Slack` : [r-grrr](https://r-grrr.slack.com)
170170

171171
- [**Documentation**]{.orange}
172172
- [Service datascience Insee](https://datascience.gitlab-pages.insee.fr/site-documentaire/accueil/)
173173
- [UtilitR](https://book.utilitr.org/)
174174

175-
- [**Formation**]{.orange}: [Espace formation du SSP Cloud](https://www.sspcloud.fr/formation)
175+
- [**Formation**]{.orange} : [Espace formation du SSP Cloud](https://www.sspcloud.fr/formation)
176176

177-
- [**Réseau data science**]{.orange}: [`SSPHub`](https://ssphub.netlify.app/)
177+
- [**Réseau data science**]{.orange} : [`SSPHub`](https://ssphub.netlify.app/)
178178

179179

180180
## Plan
181181

182182
1. Présentation des enjeux avec des exemples concrets
183183
2. Qualité et structure des projets
184-
3. Pourquoi et comment faire du bon `Git` ?
184+
3. Pourquoi et comment faire du bon {{< fa brands git >}} ?
185185
4. Format et sécurité des données
186186
5. Ouverture à l'_open source_
187187

@@ -195,12 +195,13 @@ Il faut distinguer deux types de processus de production :
195195
- celui qui est [**entièrement automatisé**]{.orange}, et où l'intervention humaine est limitée ;
196196

197197

198-
- celui qui nécessite du [__travail humain postérieur__]{.orange} de la part du statisticien, et donc fait l'objet de tâtonnements
198+
- celui qui nécessite du [__travail humain__]{.orange} (vérifications _ex post_ non automatisables, etc.) de la part du statisticien, et donc fait l'objet de tâtonnements :
199+
199200
+ calcul du taux de pauvreté avec [__ERFS et SRCV__]{.blue2} ;
200201
+ micro-simulation avec le [__modèle INES__]{.blue2} ;
201202
+ des processus de [__suivi conjoncturels__]{.blue2}...
202203

203-
## Pourquoi `Git` répond-il bien aux enjeux de la production ? {.smaller}
204+
## Pourquoi {{< fa brands git >}} répond-il bien aux enjeux de la production ? {.smaller}
204205

205206
::: {h4}
206207
__Exemple avec calcul du taux de pauvreté dans [SRCV]{.blue2}__
@@ -223,7 +224,7 @@ Les tâtonnements supposent des allers et retours sur différentes hypothèses :
223224
- les [__variantes__]{.orange} peuvent se décliner sous la notion de [__branches__]{.orange} ;
224225

225226

226-
- en traçant l'ensemble des modifications du code, `Git` facilite la complète [__reproductibilité__]{.orange} des tâtonnements ;
227+
- en traçant l'ensemble des modifications du code, {{< fa brands git >}} facilite la complète [__reproductibilité__]{.orange} des tâtonnements ;
227228

228229

229230
- au travers de l'[__historique__]{.orange}, il permet de retracer l'ensemble du cheminement ;
@@ -232,7 +233,7 @@ Les tâtonnements supposent des allers et retours sur différentes hypothèses :
232233
- le `git blame` permet de voir qui a fait quoi ;
233234

234235

235-
- mais cela nécessite une [__discipline__]{.orange} sur l'usage de `Git`.
236+
- mais cela nécessite une [__discipline__]{.orange} sur l'usage de {{< fa brands git >}}.
236237

237238
:::
238239

@@ -241,7 +242,7 @@ Les tâtonnements supposent des allers et retours sur différentes hypothèses :
241242
## Gestion du cycle de vie d'un projet
242243

243244
- [__Changement de paradigme__]{.blue2} : [**le code _self_ doit être maintenu**]{.orange}
244-
* Changement de version de `R` et des _packages_ ;
245+
* Changement de version de {{< fa brands r-project >}} et des _packages_ ;
245246
* Quelles solutions connaissez-vous ?
246247

247248

@@ -319,7 +320,7 @@ Deux outils pratiques aident à respecter les standards :
319320
+ modifie directement le code
320321

321322
::: {.callout-note}
322-
Il existe un **guide de référence** pour bien coder en `R` : le [Tidyverse style guide](https://style.tidyverse.org/index.html).
323+
Il existe un **guide de référence** pour bien coder en {{< fa brands r-project >}} : le [Tidyverse style guide](https://style.tidyverse.org/index.html).
323324
:::
324325

325326

@@ -406,7 +407,7 @@ Source : [ThinkR](https://thinkr.fr/travailler-avec-git-via-rstudio-et-versionne
406407

407408
#### `Git`, `GitHub`, `GitLab`... quelles différences ?
408409

409-
- `Git` est un **logiciel** ;
410+
- {{< fa brands git >}} est un **logiciel** ;
410411
- Utilisation en ligne de commandes
411412
- Différentes [__interfaces graphiques__]{.blue2} (`RStudio`, `VS Code`...)
412413

@@ -527,7 +528,7 @@ Nous nous sommes concentrés sur la brique:
527528
- Mot de passe et jetons d'accès à des API
528529
[**pas de mot de passe ni de jeton d'accès écrits dans le code**]{.orange}
529530
- Risques sur les données :
530-
* **pas de données dans `Git`**
531+
* **pas de données dans {{< fa brands git >}}**
531532
* **pas de compte d'accès commun à des bases de données**
532533
* **pas de données sensibles en dehors des environnements protégés**
533534

@@ -585,7 +586,7 @@ connexion_clone <- do.call(dbConnect, args = c(connexion_details$clone[2:4],
585586
## Stockage des données
586587

587588
- Données sous forme de fichier :
588-
* ne pas les mettre sous `Git` (utiliser le fichier `.gitignore`)
589+
* ne pas les mettre sous {{< fa brands git >}} (utiliser le fichier `.gitignore`)
589590
* veiller à ce que les données sensibles ne prolifèrent pas.
590591
- Données dans des bases de données :
591592
* toujours se poser la question de l'opportunité de les dupliquer sous forme de fichier
@@ -598,7 +599,7 @@ On préférera toujours avoir des données stockées dans un unique espace pour
598599

599600
- Pour limiter les risques de sécurité, vaut-il mieux cacher son code à ses collègues ?
600601
- Quelle est la nature juridique des codes sources réalisés à l'Insee ?
601-
- `R`, `Python` et leurs _packages_ sont gratuits, comment est-ce possible ?
602+
- {{< fa brands r-project >}}, {{< fa brands python >}} et leurs _packages_ sont gratuits, comment est-ce possible ?
602603
- Connaissez-vous la science ouverte et ses standards ?
603604

604605
## La sécurité par l'obscurité
@@ -625,7 +626,7 @@ On préférera toujours avoir des données stockées dans un unique espace pour
625626
## Différents niveaux d'ouverture possibles
626627

627628
- Au-delà, la publication de certains projets en _open source_ permet de valoriser le savoir-faire de l'Insee :
628-
- _Packages_ `R` : `disaggR`, `btb`, `RJDemetra`...
629+
- _Packages_ {{< fa brands r-project >}} : `disaggR`, `btb`, `RJDemetra`...
629630
- Eurostat systématise l'open source pour les travaux européens
630631
- une nécessité pour ne pas passer pour un passager clandestin vis-à-vis des communautés open source
631632
- un moyen d'assurer la transparence de nos méthodes (cf. code des bonnes pratiques et les standards de la science ouverte)

0 commit comments

Comments
 (0)