11# 6 统计量及其分布
22
3+ ## 概念与符号约定
4+
5+ 研究一个** 总体** ,该总体是一个随机变量 $X$,$X$ 的分布称为** 总体分布** 。
6+
7+ 从总体中抽取 $n$ 个个体,称为** 样本** ,记作 $(X_1,X_2,\cdots,X_n)$。$n$ 称为** 样本容量** 或** 样本大小** 。
8+
9+ 抽样得到的 $n$ 个数据 $x_1,x_2,\cdots,x_n$ 称为** 样本观测值** 。
10+
311## 统计量
412
5- 对于样本的函数 $h(X_1,X_2,\cdots,X_n)$,只要不包含位置参数 ,均称为** 统计量** 。
13+ 对于样本的函数 $h(X_1,X_2,\cdots,X_n)$,只要不包含未知参数(即可以根据样本观测值直接求出) ,均称为** 统计量** 。
614
715- 样本均值 $\bar X=\dfrac1n\sum\limits_ {i=1}^nX_i$
816- 样本 $k$ 阶原点矩 $A_k=\dfrac1n\sum\limits_ {i=1}^nX_i^k$,$k=1,2,\cdots$
917- 样本 $k$ 阶中心矩 $B_k=\dfrac1n\sum\limits_ {i=1}^n(X_i-\bar X)^k$
10- - ==样本 $2$ 阶中心矩== $S_n^2=\dfrac1{\color{orange}n}\sum\limits_ {i=1}^n(X_i-\bar X)^k $
18+ - ==样本 $2$ 阶中心矩== $S_n^2=\dfrac1{\color{orange}n}\sum\limits_ {i=1}^n(X_i-\bar X)^2 $
1119- ==样本方差== $S^2=\dfrac1{\color{orange}{n-1}}\sum\limits_ {i=1}^n(X_i-\bar X)^2$
20+ - 最小次序统计量 $X_ {(1)}=\min\limits_ {1\le i\le n}X_i$
21+ - 最大次序统计量 $X_ {(n)}=\max\limits_ {1\le i\le n}X_i$
1222
1323** 定理** 对于任意常数 $c$ 有
1424
@@ -53,7 +63,7 @@ $\chi^2$ 分布的密度函数和分布函数均不能用初等函数表示。
5363
5464<<< ./images/chi-squared.ggb#suite
5565
56- ### t 分布(学生分布)
66+ ### t 分布
5767
5868** 定义** 设随机变量 $X\sim N(0,1),Y\sim\chi^2(n)$ 且 $X,Y$ 相互独立,称随机变量 $T=\dfrac{X}{\sqrt{Y/n}}$ 所服从的分布为自由度 $n$ 的 t 分布,记为 $T\sim t(n)$。
5969
@@ -63,8 +73,54 @@ $\chi^2$ 分布的密度函数和分布函数均不能用初等函数表示。
6373
6474<<< ./images/student.ggb#suite
6575
76+ > t 分布也称学生分布。
77+
6678### F 分布
6779
6880** 定义** 设随机变量 $U\sim\chi^2(m),V\sim\chi^2(n)$ 且 $U,V$ 相互独立,则称随机变量 $F=\dfrac{U/m}{V/n}$ 服从自由度为 $(m,n)$ 的 F 分布,记为 $F\sim F(m,n)$。
6981
7082<<< ./images/F.ggb#suite
83+
84+ ## 正态分布抽样定理
85+
86+ 设 $(X_1,\cdots,X_n)$ 是取自正态总体 $N(\mu,\sigma^2)$ 的一个样本,有
87+
88+ 1 . $\bar X\sim N\left(\mu,\dfrac{\sigma^2}n\right)$,即 $\sqrt n\dfrac{\bar X-\mu}\sigma\sim N(0,1)$;
89+ 2 . $\dfrac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)$;
90+ 3 . $\bar X$ 与 $S^2$ 相互独立。
91+
92+ > [ !note]
93+ > ** 对 2 的理解**
94+ >
95+ > $$
96+ > \dfrac{(n-1)S^2}{\sigma^2}
97+ > =\sum_{i=1}^n\left(\dfrac{X_i-\bar X}\sigma \right)^2
98+ > =\sum_{i=1}^n(X_i^*)^2
99+ > \sim\chi^2(n-1)
100+ > $$
101+ >
102+ > $(X^* _ 1,\cdots,X_n^* )$ 相比原本的 $(X_1,\cdots,X_n)$ 少了一个自由度,是因为标准化之后 $\bar X$ 这一信息抹掉了,多了限制条件 $\sum X_i^* =0$。
103+
104+ ## 次序统计量的分布
105+
106+ 一般地,$X_ {(1)},X_ {(n)}$ ==不==相互独立。
107+
108+ ### 最大次序统计量
109+
110+ $$
111+ \begin{align}
112+ X_{(n)}&=\max_{1\le i\le n}X_i \\
113+ \Rightarrow F_{X_{(n)}}(x)&=[F(x)]^n \\
114+ \Rightarrow f_{X_{(n)}}(x)&=\frac{\mathrm d}{\mathrm dx}F_{X_{(n)}}(x)=n[F(x)]^{n-1}f(x)\\
115+ \end{align}
116+ $$
117+
118+ ### 最小次序统计量
119+
120+ $$
121+ \begin{align}
122+ X_{(1)}&=\min_{1\le i\le n}X_i \\
123+ \Rightarrow F_{X_{(1)}}(x)&=1-[1-F(x)]^n \\
124+ \Rightarrow f_{X_{(1)}}(x)&=\frac{\mathrm d}{\mathrm dx}F_{X_{(1)}}(x)=n[1-F(x)]^{n-1}f(x)\\
125+ \end{align}
126+ $$
0 commit comments