You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: book-fr/08-GAMMs.Rmd
+41-6Lines changed: 41 additions & 6 deletions
Original file line number
Diff line number
Diff line change
@@ -3,18 +3,52 @@
3
3
Lorsque les observations ne sont pas indépendantes, les GAMs peuvent
4
4
être utilisés soit pour incorporer:
5
5
6
-
-une structure de corrélation pour modéliser les résidus autocorrélés
7
-
(autorégressif (AR), moyenne mobile (MA), ou une combinaison des
8
-
deux (ARMA))
9
-
- des effets aléatoires qui modélisent l'indépendance entre les
10
-
observations d'un même site.
6
+
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
7
+
- le modèle autorégressif (AR, en anglais _autoregressive_);
8
+
- le modèle avec moyenne mobile (MA, en anglais _moving average_); ou,
9
+
- une combinaison des deux modèles (ARMA, en anglais, _autoregressive moving average_).
10
+
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
11
11
12
12
En plus de changer la fonction de base, nous pouvons aussi complexifier
13
13
le modèle en intégrant une structure d'auto-corrélation (ou même des
14
14
effets mixtes) en utilisant les fonctions `gamm()` dans la librairie `mgcv`. Bien que nous ne l'utilisions pas ici, la librairie [`gamm4`](https://cran.r-project.org/web/packages/gamm4/gamm4.pdf) peut également être utilisé pour estimer des modèles GAMMs dans R.
15
15
16
16
## L'autocorrelation des résidus
17
17
18
+
**L'autocorrélation des résidus** désigne le degré de corrélation entre les résidus (les différences entre les valeurs réelles et les valeurs prédites) d'un modèle de série temporelle.
19
+
20
+
En d'autres termes, s'il y a autocorrélation des résidus dans un modèle de série temporelle, cela signifie qu'il existe un modèle ou une relation entre les résidus à un moment donné et les résidus à d'autres moments.
21
+
22
+
L'autocorrélation des résidus est généralement mesurée à l'aide des graphiques **ACF (fonction d'autocorrélation)** et **pACF (fonction d'autocorrélation partielle)**, qui montrent la corrélation entre les résidus à différents retards.
23
+
24
+
#### La fonction d'autocorrélation
25
+
26
+
La fonction d'autocorrélation (ACF) d'une série temporelle stationnaire peut être définie à l'aide de l'équation suivante :
27
+
28
+
$$ACF(k) = Corr(Y_t, Y_{t-k})$$
29
+
où $Y_t$ est la valeur de la série temporelle au temps $t$, $Y_{t-k}$ est la valeur de la série temporelle au temps $t-k$, et $Corr()$ est le coefficient de corrélation entre deux variables aléatoires.
30
+
31
+
En d'autres termes, l'ACF($k$) est la corrélation entre les valeurs de la série temporelle $Y_t$ et $Y_{t-k}$, où $k$ est le décalage entre les deux points dans le temps. L'ACF est une mesure de l'intensité de la corrélation entre chaque valeur de la série temporelle et ses valeurs décalées à différents moments.
32
+
33
+
#### La fonction d'autocorrélation partielle
34
+
35
+
La fonction d'autocorrélation partielle (pACF) d'une série temporelle stationnaire peut être définie à l'aide de la formule récursive suivante :
où $Y_t$ est la valeur de la série temporelle au temps $t$, $\hat{\phi}{k,1}$, $\hat{\phi}{1,1}$, $...$ $\hat{\phi}{k-1,k-1}$ sont les coefficients du modèle autorégressif d'ordre $k-1$ ajusté à la série temporelle, et $Corr()$ est le coefficient de corrélation entre deux variables aléatoires.
44
+
45
+
En d'autres termes, le pACF($k$) est la corrélation entre les valeurs des séries temporelles $Y_k$ et $Y_{k+j}$ après suppression de l'influence des décalages intermédiaires $Y_{k+1}, Y_{k+2}, ..., Y_{k+j-1}$ à l'aide d'un modèle autorégressif d'ordre $k-1$.
46
+
Le pACF mesure la corrélation entre $Y_k$ et $Y_{k+j}$ après avoir éliminé l'effet de tout délai intermédiaire plus court.
47
+
48
+
Si les graphiques **ACF** ou **pACF** montrent des corrélations significatives à des retards non nuls, il y a des preuves d'autocorrélation des résidus et le modèle peut devoir être modifié ou amélioré pour mieux capturer les modèles sous-jacents dans les données.
49
+
50
+
Voyons comment cela fonctionne avec notre modèle `year_gam`!
51
+
18
52
Pour commencer, nous allons jeter un coup d'œil à un modèle avec de l'autocorrélation temporelle dans les résidus. Revenons au modèle
19
53
de la température de Nottingham pour vérifier si les résidus sont corrélés en faisant appel à la fonction (partielle) d'autocorrélation.
pacf(resid(year_gam), lag.max = 36, main = "pACF")
25
59
```
26
60
61
+
Dans le graphique ACF, la région ombrée en bleu représente l'intervalle de confiance et les lignes rouges en pointillé représentent les limites de la signification statistique.
62
+
27
63
La __fonction d'autocorrelaton__ (ACF; première figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages (donc, la similarité entre observations progressivement décalés).
28
64
29
65
En contraste, la __fonction partielle d'autocorrelation__ (PACF: deuxième figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages, après avoir contrôlé les valeurs de la série temporelle à tous les décalages plus courts.
Le modèle avec la structure AR(1) donne un meilleur ajustement comparé au premier modèle (`year_gam`), il y a très peu d'amélioration en passant au `AR(2)`. Il est donc préférable d'inclure uniquement la structure `AR(1)` dans notre modèle.
58
94
59
-
60
95
## Modélisation avec effets mixtes
61
96
62
97
Comme nous l'avons vu dans la section précédente, `bs` spécifie la
Copy file name to clipboardExpand all lines: pres-fr/workshop08-pres-fr.Rmd
+25-6Lines changed: 25 additions & 6 deletions
Original file line number
Diff line number
Diff line change
@@ -1804,11 +1804,26 @@ class: inverse, center, middle
1804
1804
Lorsque les observations ne sont pas indépendantes, les GAMs peuvent
1805
1805
être utilisés soit pour incorporer:
1806
1806
1807
-
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
1808
-
- autorégressif (AR, en anglais _auto-regressive_);
1809
-
- moyenne mobile (MA, en anglais _moving average_); ou,
1810
-
- une combinaison des deux (ARMA, en anglais, _auto regressive moving averages_).
1811
-
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
1807
+
- une structure de corrélation pour modéliser les résidus autocorrélés, comme:
1808
+
- le modèle autorégressif (AR, en anglais _autoregressive_);
1809
+
- le modèle avec moyenne mobile (MA, en anglais _moving average_); ou,
1810
+
- une combinaison des deux modèles (ARMA, en anglais, _autoregressive moving average_).
1811
+
- des effets aléatoires qui modélisent l'indépendance entre les observations d'un même site.
1812
+
1813
+
---
1814
+
# L'autocorrelation des résidus
1815
+
1816
+
**L'autocorrélation des résidus** désigne le degré de corrélation entre les résidus (les différences entre les valeurs réelles et les valeurs prédites) d'un modèle de série temporelle.
1817
+
1818
+
En d'autres termes, s'il y a autocorrélation des résidus dans un modèle de série temporelle, cela signifie qu'il existe un modèle ou une relation entre les résidus à un moment donné et les résidus à d'autres moments.
1819
+
1820
+
--
1821
+
1822
+
L'autocorrélation des résidus est généralement mesurée à l'aide des graphiques **ACF (fonction d'autocorrélation)** et **pACF (fonction d'autocorrélation partielle)**, qui montrent la corrélation entre les résidus à différents retards.
1823
+
1824
+
Si les graphiques **ACF** ou **pACF** montrent des corrélations significatives à des retards non nuls, il y a des preuves d'autocorrélation des résidus et le modèle peut devoir être modifié ou amélioré pour mieux capturer les modèles sous-jacents dans les données.
1825
+
1826
+
Voyons comment cela fonctionne avec notre modèle `year_gam`!
1812
1827
1813
1828
---
1814
1829
# L'autocorrelation des résidus
@@ -1819,11 +1834,13 @@ Revenons au modèle de la température de Nottingham pour vérifier si les rési
1819
1834
1820
1835
```{r, eval = F, fig.width=9, fig.height=4.5}
1821
1836
par(mfrow = c(1,2))
1837
+
1822
1838
acf(resid(year_gam), lag.max = 36, main = "ACF")
1839
+
1823
1840
pacf(resid(year_gam), lag.max = 36, main = "pACF")
1824
1841
```
1825
1842
1826
-
`acf` signifie _auto correlation function_, et `pacf` signifie _partial auto correlation function_.
@@ -1848,6 +1865,8 @@ La __fonction d'autocorrelaton__ (ACF; première figure) évalue la corrélation
1848
1865
1849
1866
En contraste, la __fonction partielle d'autocorrelation__ (PACF: deuxième figure) évalue la corrélation croisée d'une série temporelle entre points à différents décalages, après avoir contrôlé les valeurs de la série temporelle à tous les décalages plus courts.
1850
1867
1868
+
Dans le graphique ACF, la région ombrée en bleu représente l'intervalle de confiance et les lignes rouges en pointillé représentent les limites de la signification statistique.
0 commit comments