Skip to content

Commit b735c5c

Browse files
Merge pull request #23 from QCBSRworkshops/acf-pacf-content-fr
Adds detailed explanation of autocorrelation, ACF and pACF to the French version of the presentation and the book by Pedro H. Braga
2 parents a3c61da + cf356ad commit b735c5c

File tree

2 files changed

+66
-12
lines changed

2 files changed

+66
-12
lines changed

book-fr/08-GAMMs.Rmd

Lines changed: 41 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -3,18 +3,52 @@
33
Lorsque les observations ne sont pas indépendantes, les GAMs peuvent
44
être utilisés soit pour incorporer:
55

6-
- une structure de corrélation pour modéliser les résidus autocorrélés
7-
(autorégressif (AR), moyenne mobile (MA), ou une combinaison des
8-
deux (ARMA))
9-
- des effets aléatoires qui modélisent l'indépendance entre les
10-
observations d'un même site.
6+
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
7+
- le modèle autorégressif (AR, en anglais _autoregressive_);
8+
- le modèle avec moyenne mobile (MA, en anglais _moving average_); ou,
9+
- une combinaison des deux modèles (ARMA, en anglais, _autoregressive moving average_).
10+
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
1111

1212
En plus de changer la fonction de base, nous pouvons aussi complexifier
1313
le modèle en intégrant une structure d'auto-corrélation (ou même des
1414
effets mixtes) en utilisant les fonctions `gamm()` dans la librairie `mgcv`. Bien que nous ne l'utilisions pas ici, la librairie [`gamm4`](https://cran.r-project.org/web/packages/gamm4/gamm4.pdf) peut également être utilisé pour estimer des modèles GAMMs dans R.
1515

1616
## L'autocorrelation des résidus
1717

18+
**L'autocorrélation des résidus** désigne le degré de corrélation entre les résidus (les différences entre les valeurs réelles et les valeurs prédites) d'un modèle de série temporelle.
19+
20+
En d'autres termes, s'il y a autocorrélation des résidus dans un modèle de série temporelle, cela signifie qu'il existe un modèle ou une relation entre les résidus à un moment donné et les résidus à d'autres moments.
21+
22+
L'autocorrélation des résidus est généralement mesurée à l'aide des graphiques **ACF (fonction d'autocorrélation)** et **pACF (fonction d'autocorrélation partielle)**, qui montrent la corrélation entre les résidus à différents retards.
23+
24+
#### La fonction d'autocorrélation
25+
26+
La fonction d'autocorrélation (ACF) d'une série temporelle stationnaire peut être définie à l'aide de l'équation suivante :
27+
28+
$$ACF(k) = Corr(Y_t, Y_{t-k})$$
29+
où $Y_t$ est la valeur de la série temporelle au temps $t$, $Y_{t-k}$ est la valeur de la série temporelle au temps $t-k$, et $Corr()$ est le coefficient de corrélation entre deux variables aléatoires.
30+
31+
En d'autres termes, l'ACF($k$) est la corrélation entre les valeurs de la série temporelle $Y_t$ et $Y_{t-k}$, où $k$ est le décalage entre les deux points dans le temps. L'ACF est une mesure de l'intensité de la corrélation entre chaque valeur de la série temporelle et ses valeurs décalées à différents moments.
32+
33+
#### La fonction d'autocorrélation partielle
34+
35+
La fonction d'autocorrélation partielle (pACF) d'une série temporelle stationnaire peut être définie à l'aide de la formule récursive suivante :
36+
37+
$$pACF(1) = Corr(Y_1, Y_2)$$
38+
39+
$$pACF(k) = [ Corr(Y_k, Y_{k+1} - \hat{\phi}{k,1}Y{k}) ] / [ Corr(Y_1, Y_2 - \hat{\phi}_{1,1}Y_1) ]$$
40+
41+
pour $k > 1$
42+
43+
où $Y_t$ est la valeur de la série temporelle au temps $t$, $\hat{\phi}{k,1}$, $\hat{\phi}{1,1}$, $...$ $\hat{\phi}{k-1,k-1}$ sont les coefficients du modèle autorégressif d'ordre $k-1$ ajusté à la série temporelle, et $Corr()$ est le coefficient de corrélation entre deux variables aléatoires.
44+
45+
En d'autres termes, le pACF($k$) est la corrélation entre les valeurs des séries temporelles $Y_k$ et $Y_{k+j}$ après suppression de l'influence des décalages intermédiaires $Y_{k+1}, Y_{k+2}, ..., Y_{k+j-1}$ à l'aide d'un modèle autorégressif d'ordre $k-1$.
46+
Le pACF mesure la corrélation entre $Y_k$ et $Y_{k+j}$ après avoir éliminé l'effet de tout délai intermédiaire plus court.
47+
48+
Si les graphiques **ACF** ou **pACF** montrent des corrélations significatives à des retards non nuls, il y a des preuves d'autocorrélation des résidus et le modèle peut devoir être modifié ou amélioré pour mieux capturer les modèles sous-jacents dans les données.
49+
50+
Voyons comment cela fonctionne avec notre modèle `year_gam`!
51+
1852
Pour commencer, nous allons jeter un coup d'œil à un modèle avec de l'autocorrélation temporelle dans les résidus. Revenons au modèle
1953
de la température de Nottingham pour vérifier si les résidus sont corrélés en faisant appel à la fonction (partielle) d'autocorrélation.
2054

@@ -24,6 +58,8 @@ acf(resid(year_gam), lag.max = 36, main = "ACF")
2458
pacf(resid(year_gam), lag.max = 36, main = "pACF")
2559
```
2660

61+
Dans le graphique ACF, la région ombrée en bleu représente l'intervalle de confiance et les lignes rouges en pointillé représentent les limites de la signification statistique.
62+
2763
La __fonction d'autocorrelaton__ (ACF; première figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages (donc, la similarité entre observations progressivement décalés).
2864

2965
En contraste, la __fonction partielle d'autocorrelation__ (PACF: deuxième figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages, après avoir contrôlé les valeurs de la série temporelle à tous les décalages plus courts.
@@ -56,7 +92,6 @@ AIC(year_gam$lme, year_gam_AR1$lme, year_gam_AR2$lme)
5692

5793
Le modèle avec la structure AR(1) donne un meilleur ajustement comparé au premier modèle (`year_gam`), il y a très peu d'amélioration en passant au `AR(2)`. Il est donc préférable d'inclure uniquement la structure `AR(1)` dans notre modèle.
5894

59-
6095
## Modélisation avec effets mixtes
6196

6297
Comme nous l'avons vu dans la section précédente, `bs` spécifie la

pres-fr/workshop08-pres-fr.Rmd

Lines changed: 25 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -1804,11 +1804,26 @@ class: inverse, center, middle
18041804
Lorsque les observations ne sont pas indépendantes, les GAMs peuvent
18051805
être utilisés soit pour incorporer:
18061806

1807-
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
1808-
- autorégressif (AR, en anglais _auto-regressive_);
1809-
- moyenne mobile (MA, en anglais _moving average_); ou,
1810-
- une combinaison des deux (ARMA, en anglais, _auto regressive moving averages_).
1811-
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
1807+
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
1808+
- le modèle autorégressif (AR, en anglais _autoregressive_);
1809+
- le modèle avec moyenne mobile (MA, en anglais _moving average_); ou,
1810+
- une combinaison des deux modèles (ARMA, en anglais, _autoregressive moving average_).
1811+
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
1812+
1813+
---
1814+
# L'autocorrelation des résidus
1815+
1816+
**L'autocorrélation des résidus** désigne le degré de corrélation entre les résidus (les différences entre les valeurs réelles et les valeurs prédites) d'un modèle de série temporelle.
1817+
1818+
En d'autres termes, s'il y a autocorrélation des résidus dans un modèle de série temporelle, cela signifie qu'il existe un modèle ou une relation entre les résidus à un moment donné et les résidus à d'autres moments.
1819+
1820+
--
1821+
1822+
L'autocorrélation des résidus est généralement mesurée à l'aide des graphiques **ACF (fonction d'autocorrélation)** et **pACF (fonction d'autocorrélation partielle)**, qui montrent la corrélation entre les résidus à différents retards.
1823+
1824+
Si les graphiques **ACF** ou **pACF** montrent des corrélations significatives à des retards non nuls, il y a des preuves d'autocorrélation des résidus et le modèle peut devoir être modifié ou amélioré pour mieux capturer les modèles sous-jacents dans les données.
1825+
1826+
Voyons comment cela fonctionne avec notre modèle `year_gam`!
18121827

18131828
---
18141829
# L'autocorrelation des résidus
@@ -1819,11 +1834,13 @@ Revenons au modèle de la température de Nottingham pour vérifier si les rési
18191834

18201835
```{r, eval = F, fig.width=9, fig.height=4.5}
18211836
par(mfrow = c(1,2))
1837+
18221838
acf(resid(year_gam), lag.max = 36, main = "ACF")
1839+
18231840
pacf(resid(year_gam), lag.max = 36, main = "pACF")
18241841
```
18251842

1826-
`acf` signifie _auto correlation function_, et `pacf` signifie _partial auto correlation function_.
1843+
Souvenez vous que: `acf` signifie _autocorrelation function_, et `pacf` signifie _partial autocorrelation function_.
18271844

18281845
---
18291846
# L'autocorrelation des résidus
@@ -1848,6 +1865,8 @@ La __fonction d'autocorrelaton__ (ACF; première figure) évalue la corrélation
18481865

18491866
En contraste, la __fonction partielle d'autocorrelation__ (PACF: deuxième figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages, après avoir contrôlé les valeurs de la série temporelle à tous les décalages plus courts.
18501867

1868+
Dans le graphique ACF, la région ombrée en bleu représente l'intervalle de confiance et les lignes rouges en pointillé représentent les limites de la signification statistique.
1869+
18511870
---
18521871
# L'autocorrelation des résidus
18531872

0 commit comments

Comments
 (0)