|
1 | 1 | --- |
2 | | -created: "2025-12-31" |
3 | | -updated: "2025-12-31" |
| 2 | +created: 2025-12-31 |
| 3 | +updated: 2026-01-02 |
4 | 4 | --- |
5 | 5 | ## 基本 |
6 | 6 |
|
@@ -103,3 +103,169 @@ $F(x,-\infty)=0,\quad F(-\infty,y)=0,\quad F(+\infty, +\infty)=1$ |
103 | 103 |
|
104 | 104 | ## 随机变量的数字特征 |
105 | 105 |
|
| 106 | +### 一维分布的数字特征 |
| 107 | + |
| 108 | +#### 期望 |
| 109 | + |
| 110 | +$离散:E(X)=\sum x_{i}p_{i}\quad 连续:E(X)=\int xf(x)dx$ |
| 111 | + |
| 112 | +性质:$E(c)=c \quad E(aX+b)=aE(x)+b$ |
| 113 | + |
| 114 | +$E(X^{k})$也称为 $k$ 阶矩 |
| 115 | + |
| 116 | +#### 方差 |
| 117 | + |
| 118 | +$Var(X)=E[X-E(X)]^2=E(X^2)-[E(X)]^2$ |
| 119 | + |
| 120 | +性质 |
| 121 | + - $Var(c)=0$ |
| 122 | + - $Var(aX+b)=a^2Var(X)$ |
| 123 | + |
| 124 | +注:方差的算术平方根称为 **标准差** $\sigma(X)$,标准差与期望的比称为 **变异系数 C** |
| 125 | + |
| 126 | +#### 切比雪夫不等式 |
| 127 | + |
| 128 | +$P(|X-E(X)|\geq \epsilon)\leq \frac{Var(X)}{\epsilon^{2}}$ |
| 129 | + |
| 130 | +#### 常用分布期望和方差 |
| 131 | + |
| 132 | +![[Pasted image 20260102172710.png]] |
| 133 | + |
| 134 | +### 二维分布特征数 |
| 135 | + |
| 136 | +#### 方差 |
| 137 | + |
| 138 | +$$\begin{align} |
| 139 | +& 离散: E[g(X,Y)]=\sum \sum g(x_{i},y_{i})p_{ij} \\ |
| 140 | +& 连续: E[g(X,Y)]=\int dy\int g(x,y)f(x,y)dx |
| 141 | +\end{align}$$ |
| 142 | + |
| 143 | +性质: |
| 144 | +- 无论 X, Y 是否独立,都有 $E(aX+bY)=aE(X)+bE(Y)$ |
| 145 | +- 如何 XY 相互独立则有 $E(XY)=E(X)E(Y),\quad Var(X\pm Y)=Var(X)+Var(Y)$ |
| 146 | +- 如果独立变量$X\sim N(\mu_{1},\sigma^{2}_{1}),Y\sim N(\mu_{2},\sigma_{2}^{2}),\quad 则X\pm Y\sim N(\mu_{1}\pm \mu_{2},\sigma_{1}^{2}+\sigma_{2}^{2})$ |
| 147 | + |
| 148 | +#### 协方差 |
| 149 | + |
| 150 | +$Cov(X,Y)=E[X-E(X)][Y-E(Y)]=E(XY)-E(X)E(Y)$ |
| 151 | + |
| 152 | +相关系数 |
| 153 | + |
| 154 | +$$\rho_{XY}= \frac{Cov(X,Y)}{\sigma_{X}\sigma_{Y}}$$ |
| 155 | + |
| 156 | +- Cov > 0 则 X,Y 正相关 |
| 157 | +- Cov = 0 则 X, Y 不相关 -> 不一定独立,但是独立一定不相关 |
| 158 | +- Cov < 0 则 X, Y 负相关 |
| 159 | + |
| 160 | +性质 |
| 161 | +- $Cov(X,c)=Var(0)$ |
| 162 | +- $Cov(X,X)=Var(X)$ |
| 163 | +- $Cov(X,Y)=Cov(Y,X)$ |
| 164 | +- 线性性:$Cov(aX,bY)=abCov(X,Y)\quad Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)$ |
| 165 | +- 不独立变量之和的方差、协方差,与整式乘法相似: |
| 166 | + - $Var(X\pm Y)=Var(X)\pm 2Cov(X,Y)+Var(Y)$ |
| 167 | + - $Cov(aX+bY,cX+dY)=acVar(X)+(ad+bc)Cov(X,Y)+bdVar(Y)$ |
| 168 | + |
| 169 | +## 大数定律 |
| 170 | + |
| 171 | +在一定条件下,随机变量的均值$\overline{X}$趋近于期望的均值$\overline{E(X)}$ |
| 172 | + |
| 173 | +$$\forall \epsilon>0,\quad\lim_{ n \to \infty }P\left( \left| \frac{1}{n}\sum X_{i}-\frac{1}{n}\sum E(X_{i}) \right| < \epsilon \right) = 1$$ |
| 174 | + |
| 175 | +- 伯努利大数定律:服从二项分布 |
| 176 | +- 切比雪夫大数定律:方差存在上界 |
| 177 | +- 辛钦大数定律:独立同分布 |
| 178 | + |
| 179 | +## 中心极限定理 |
| 180 | + |
| 181 | +独立同分布变量的和,近似服从于正态分布,期望和方差不变 |
| 182 | + |
| 183 | +$n较大时,近似有\sum X\sim N(n\mu,n\sigma^{2})或\overline{X}\sim N\left( \mu, \frac{\sigma^{2}}{n} \right)$ |
| 184 | + |
| 185 | +$由上面的可知,n较大时二项分布X\sim B(n,p)可以近似为X\sim N(np,npq)$ |
| 186 | + |
| 187 | +## 统计量及其分布 |
| 188 | + |
| 189 | +统计量:不含位置参数的函数称为统计量 |
| 190 | + |
| 191 | +样本均值:$\overline{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}$ |
| 192 | +样本方差:$s ^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(x-\overline{x})^{2}$ |
| 193 | + |
| 194 | +性质 |
| 195 | +$$E(\overline{x})=\mu,\quad Var(\overline{x})=\frac{\sigma^{2}}{n},\quad E(s^{2})=\sigma^{2}$$ |
| 196 | + |
| 197 | +### 卡方分布 |
| 198 | + |
| 199 | +若$X_{i}\sim N(0,1)$相互独立,则$Y=X_{1}^{2}+X_{2}^{2}+X_{3}^{2}+\dots+X_{n}^{2}$服从自由度为$n$的卡方分布$\chi^{2}(n)$ |
| 200 | + |
| 201 | +性质: |
| 202 | +- 可加性 $Y_{1}\sim \chi^{2}(m),\quad Y_{2}\sim \chi^{2}(n),\quad则Y_{1}+Y_{2}\sim \chi^{2}(m+n)$ |
| 203 | +- 若 $Y\sim \chi^{2}(n),\quad则E(Y)=n,Var(Y)=2n$ |
| 204 | +- 特别地,若$X\sim N(0,1),则X^{2}\sim \chi^{2}(1)$ |
| 205 | + |
| 206 | +### t 分布 |
| 207 | + |
| 208 | +$$\begin{align} |
| 209 | +& 若X\sim N(0,1), Y\sim \chi^{2}(n)且相互独立, \\ |
| 210 | +& \quad则Z=\frac{X}{\sqrt{ \frac{Y}{n}}} 服从自由度为n的t分布t(n) \\ |
| 211 | +\end{align}$$ |
| 212 | + |
| 213 | +当 $n>30$ 时,t分布可以近似认为是标准正态分布 |
| 214 | + |
| 215 | +### F 分布 |
| 216 | + |
| 217 | +$$\begin{align} |
| 218 | +& 若 X \sim \chi^{2}(m),\quad Y\sim \chi^{2}(n)且相互独立 \\ |
| 219 | +& Z= \frac{\frac{X}{m}}{\frac{Y}{n}}服从自由度为m,n的F分布F(m,n) |
| 220 | +\end{align}$$ |
| 221 | + |
| 222 | +### 正态总体的抽样分布 |
| 223 | + |
| 224 | +$$\begin{align} |
| 225 | + & 若 X_{i}\sim N(\mu,\sigma^{2})且相互独立, 则样本均值\overline{x},s^{2} 相互独立,且 \\ |
| 226 | + & \frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{ n }}}\sim N(0,1)\qquad \frac{\overline{x}-\mu}{\frac{s}{\sqrt{ n }}}\sim t(n-1)\qquad \frac{(n-1)s^{2}}{\sigma^{2}}\sim \chi^{2}(n-1) |
| 227 | +\end{align}$$ |
| 228 | + |
| 229 | +*我的天啊,太长了。* |
| 230 | + |
| 231 | +*第一个是标准化,分子标准化期望,分母标准化方差.* |
| 232 | + |
| 233 | +*用s替换sigma就服从t(n-1)分布* |
| 234 | + |
| 235 | +**唉。** |
| 236 | + |
| 237 | +## 参数估计 |
| 238 | + |
| 239 | +### 点估计 |
| 240 | + |
| 241 | +矩估计。用样本矩代替总体矩,尽量选择阶数低的。 |
| 242 | + |
| 243 | +- 如果只有一个未知量,令$E(X)=\overline{x}$ |
| 244 | +- 如果有两个未知量,就再令$Var(X)=s^{2}$ |
| 245 | + |
| 246 | +### 最大似然估计 |
| 247 | + |
| 248 | +求使得联合密度函数 $L=\prod f(x_{i}; \theta)$ 最大的参数 |
| 249 | +1. 写出联合密度函数 |
| 250 | +2. 求对数 $\ln L=\sum \ln f(x_{i}\cdot \theta)$ |
| 251 | +3. 令偏导为0并求解$\frac{\partial L}{\partial \theta}=0$ |
| 252 | + |
| 253 | +### 估计优良性标准 |
| 254 | + |
| 255 | +- 无偏性:估计量的期望等于实际值 |
| 256 | +- 有效性:估计量的方差尽可能小 |
| 257 | +- 相合性:样本趋于无穷时,估计量趋于实际值 |
| 258 | + |
| 259 | +可以证明,样本均值、方差是无偏估计量。 |
| 260 | + |
| 261 | +矩估计和最大估计给出的方差不是无偏估计量。 |
| 262 | + |
| 263 | +### 区间估计 |
| 264 | + |
| 265 | +区间估计问题:$给定置信度1-\alpha,找一个区间[L,R],使P(L\leq \theta \leq R)\geq 1-\alpha$ |
| 266 | + |
| 267 | +步骤 |
| 268 | +- 选择统计量 $G$ |
| 269 | +- 找到区间使得 $P(a\leq G \leq b)\geq 1-\alpha$ |
| 270 | +- 化简得出答案 |
| 271 | + |
0 commit comments