|
| 1 | +# 7 参数估计 |
| 2 | + |
| 3 | +## 概念 |
| 4 | + |
| 5 | +- 参数:总体 $X$ 的未知的数字特征,记为 $\theta$,可以是一个数,也可以是一个向量(若干个数) |
| 6 | +- 参数空间:$\theta$ 的取值范围,记为 $\varTheta$ |
| 7 | +- 参数估计 |
| 8 | + - 点估计:构造统计量 $\hat\theta(X_1,\cdots,X_n)$ 来估计 $\theta$。称 $\hat\theta(X_1,\cdots,X_n)$ 为 $\theta$ 的估计量,$\hat\theta(x_1,\cdots,x_n)$ 为 $\theta$ 的估计值。 |
| 9 | + - 区间估计:构造两个统计量 $\underline\theta(X_1,\cdots,X_n)$ 和 $\overline\theta(X_1,\cdots,X_n)$,用 $[\underline\theta,\overline\theta]$ 来估计 $\theta$ 的范围 |
| 10 | + |
| 11 | +## 点估计 |
| 12 | + |
| 13 | +### 矩估计法 |
| 14 | + |
| 15 | +记总体 $k$ 阶原点矩 $\mu_k=E(X^k)$,样本 $k$ 阶原点矩 $A_k=\dfrac1n\sum\limits_{i=1}^nX_i^k$,若未知参数 $\theta=\varphi(\mu_1,\cdots,\mu_m)$,称估计量 $\hat\theta=\varphi(A_1,\cdots,A_m)$ 为矩估计量。 |
| 16 | + |
| 17 | +**定理** 设 $(X_1,\cdots,X_n)$ 为取自总体 $X$ 的一个样本,$E(X)=\mu$,$\operatorname {Var}(x)=\sigma^2$,$\mu$ 与 $\sigma$ 均未知。则:$\bar X$ 是未知参数 $\mu$ 的矩估计,$S_n^2$ 是未知参数 $\sigma^2$ 的矩估计。 |
| 18 | + |
| 19 | +> [!important] |
| 20 | +> |
| 21 | +> 核心:样本 $k$ 阶原点矩替换总体 $k$ 阶原点矩。 |
| 22 | +
|
| 23 | +若 $\hat\theta$ 是 $\theta$ 的矩估计量,则 $g(\hat\theta)$ 为 $g(\theta)$ 的矩估计量。 |
| 24 | + |
| 25 | +::: example |
| 26 | + |
| 27 | +- 总体 $X\sim P(\lambda)$,$\lambda>0$,$\lambda$ 未知。则 $\hat\lambda_矩=\bar X$ |
| 28 | +- 总体 $X\sim E(\lambda)$,$\lambda>0$,$\lambda$ 未知。则 $\hat\lambda_矩=\dfrac1{\bar X}$ |
| 29 | +- 总体 $X\sim U(0,\theta)$,$\theta>0$,$\theta$ 未知。则 $\hat\theta_矩=2\bar X$ |
| 30 | +- 总体 $X\sim U(-\theta,\theta)$,$\theta>0$,$\theta$ 未知。则 |
| 31 | + - $E(X)=0$ 无法用于估计 |
| 32 | + - $E(X^2)=\operatorname{Var}(x)+[E(X)]^2=\dfrac{(2\theta)^2}{12}+0^2=\dfrac{\theta^2}3$,则 $\theta=\sqrt{3E(X^2)}$,有 $\hat\theta_矩=\sqrt{3A_2}=\sqrt{\dfrac3n\sum\limits_{i=1}^nX_i^2}$ |
| 33 | + |
| 34 | +::: |
| 35 | + |
| 36 | +::: example |
| 37 | + |
| 38 | +总体 $X\sim U(\theta_1,\theta_2)$,$\theta_1<\theta_2$,$\theta_1,\theta_2$ 均未知。 |
| 39 | + |
| 40 | +--- |
| 41 | + |
| 42 | +$$ |
| 43 | +\begin{align} |
| 44 | +\begin{cases} |
| 45 | +E(X)=\dfrac{\theta_1+\theta_2}2 \\ |
| 46 | +\operatorname{Var}(X)=\dfrac{\theta_2-\theta_1}{12} |
| 47 | +\end{cases} |
| 48 | +&\Rightarrow |
| 49 | +\begin{cases} |
| 50 | +\theta_1=E(X)-\sqrt{3\operatorname{Var(X)}} \\ |
| 51 | +\theta_2=E(X)+\sqrt{3\operatorname{Var(X)}} |
| 52 | +\end{cases} \\ |
| 53 | +&\Rightarrow |
| 54 | +\begin{cases} |
| 55 | +\hat\theta_1=\bar X-\sqrt{3S_n^2} \\ |
| 56 | +\hat\theta_2=\bar X+\sqrt{3S_n^2} |
| 57 | +\end{cases} |
| 58 | +\end{align} |
| 59 | +$$ |
| 60 | + |
| 61 | +::: |
| 62 | + |
| 63 | +::: example |
| 64 | + |
| 65 | +设总体 $X$ 的密度函数为 |
| 66 | + |
| 67 | +$$ |
| 68 | +f(x;\theta)=\begin{cases} |
| 69 | +\dfrac1\theta,& 0<x<\dfrac\theta2 \\ |
| 70 | +\dfrac1{2-\theta},& \dfrac\theta2<x<1 \\ |
| 71 | +0, & 其他 |
| 72 | +\end{cases} |
| 73 | +$$ |
| 74 | + |
| 75 | +其中 $0<\theta<2$,$\theta$ 未知。$(X_1,\cdots,X_n)$ 是取自这个总体的样本,球 $\theta$ 的矩估计 $\hat\theta$? |
| 76 | + |
| 77 | +--- |
| 78 | + |
| 79 | +$$ |
| 80 | +\begin{align} |
| 81 | +E(X)&=\int_{-\infty}^{+\infty}xf(x)\mathrm dx \\ |
| 82 | +&=\int_0^{\theta/2}\frac x\theta\mathrm dx+\int_{\theta/2}^1\frac x{2-\theta}\mathrm dx \\ |
| 83 | +&=\frac{1+\theta}4 \\ |
| 84 | +\Rightarrow \theta&=4E(X)-1 \\ |
| 85 | +\Rightarrow \hat\theta&=4\bar X-1 \\ |
| 86 | +\end{align} |
| 87 | +$$ |
| 88 | + |
| 89 | +::: |
| 90 | + |
| 91 | +### 最大似然估计 |
| 92 | + |
| 93 | +设 $(X_1,\cdots,X_n)$ 为取自总体 $X$ 的一个样本,总体 $X$ 的密度函数为 $f(x;\theta)$,其中 $\theta$ 为未知参数,$\varTheta$ 为参数空间,称 |
| 94 | + |
| 95 | +$$ |
| 96 | +L(\theta;x_1,x_2,\cdots,x_n)=\prod_{i=1}^nf(x_i;\theta),\quad\theta\in\varTheta |
| 97 | +$$ |
| 98 | + |
| 99 | +为似然函数。若存在 $\hat\theta=\hat\theta(x_1,\cdots,x_n)$,使得 |
| 100 | + |
| 101 | +$$ |
| 102 | +L(\hat\theta)=\max_{\theta\in\varTheta}L(\theta) |
| 103 | +$$ |
| 104 | + |
| 105 | +则称 $\hat\theta(x_1,\cdots,x_n)$ 为 $\theta$ 的最大似然估计值,称相应的 $\hat\theta(X_1,\cdots,X_n)$ 为 $\theta$ 的最大似然估计量。 |
| 106 | + |
| 107 | +求最大似然估计量的常用方法是通过取对数,将连乘转换为求和。即有最大似然方程: |
| 108 | + |
| 109 | +$$ |
| 110 | +\frac{\mathrm d}{\mathrm d\theta}\ln L(\theta)=0 |
| 111 | +$$ |
| 112 | + |
| 113 | +::: example |
| 114 | + |
| 115 | +用最大似然估计 $\mu$ 未知、$\sigma$ 已知的正态分布总体抽样下 $\mu$ 的估计值。 |
| 116 | + |
| 117 | +--- |
| 118 | + |
| 119 | +$$ |
| 120 | +\begin{gathered} |
| 121 | +\begin{align} |
| 122 | +L(\mu)&=\prod_{i=1}^nf(x;\mu) \\ |
| 123 | +&=\prod_{i=1}^n\frac1{\sqrt{2\pi}\sigma}\exp\left[{-\frac{(x_i-\mu)^2}{2\sigma^2}} \right] \\ |
| 124 | +&= \left(\frac1{\sqrt{2\pi}\sigma} \right)^n\exp\left[-\frac{\sum(x_i-\mu)^2}{2\sigma^2} \right]\\ |
| 125 | +\ln L(\mu)&=-\frac n2\ln(2\pi\sigma^2)-\frac{\sum(x_i-\mu)^2}{2\sigma^2} \\ |
| 126 | +\frac{\mathrm d\ln L(\mu)}{\mathrm d\mu}&=\frac{2\sum(x_i-\mu)}{2\sigma^2}=0 |
| 127 | +\end{align} \\ |
| 128 | +\Rightarrow \sum_{i=1}^n(x_i-\mu)=\left(\sum_{i=1}^nx_i \right)-n\mu=0\\ |
| 129 | +\Rightarrow\mu=\frac1n\sum_{i=1}^nx_i \Rightarrow\hat\mu_最=\frac1n\sum_{i=1}^nX_i=\bar X |
| 130 | +\end{gathered} |
| 131 | +$$ |
| 132 | + |
| 133 | +::: |
| 134 | + |
| 135 | +::: example |
| 136 | + |
| 137 | +用最大似然估计 $\mu$ 已知、$\sigma$ 未知的正态分布总体抽样下 $\sigma^2$ 的估计值。 |
| 138 | + |
| 139 | +--- |
| 140 | + |
| 141 | +$$ |
| 142 | +\begin{gathered} |
| 143 | +\begin{align} |
| 144 | +L(\sigma^2)&=\prod_{i=1}^nf(x;\sigma^2) \\ |
| 145 | +&=\prod_{i=1}^n\frac1{\sqrt{2\pi}\sigma}\exp\left[{-\frac{(x_i-\mu)^2}{2\sigma^2}} \right] \\ |
| 146 | +&=\left(\frac1{\sqrt{2\pi}\sigma} \right)^n\exp\left[-\frac{\sum(x_i-\mu)^2}{2\sigma^2} \right]\\ |
| 147 | +\ln L(\sigma^2)&=-\frac n2\ln(2\pi)-\frac n2\ln\sigma^2-\frac{\sum(x_i-\mu)^2}{2\sigma^2} \\ |
| 148 | +\frac{\mathrm d\ln L(\sigma^2)}{\mathrm d(\sigma^2)}&= -\frac n2\cdot\frac1{\sigma^2}+\frac{\sum(x_i-\mu)^2}{2\sigma^4}=0 |
| 149 | +\end{align} \\ |
| 150 | +\Rightarrow \frac n2\cdot\frac1{\sigma^2} = \frac{\sum(x_i-\mu)^2}{2\sigma^4} |
| 151 | +\Rightarrow n = \frac{\sum(x_i-\mu)^2}{\sigma^2} \\ |
| 152 | +\Rightarrow \sigma^2 = \frac1n{\sum_{i=1}^n(x_i-\mu)^2} \\ |
| 153 | +\Rightarrow \hat\sigma_最^2 =\frac1n\sum_{i=1}^n(X_i-\bar X)^2= S_n^2 \\ |
| 154 | +\end{gathered} |
| 155 | +$$ |
| 156 | + |
| 157 | +::: |
| 158 | + |
| 159 | +::: example |
| 160 | + |
| 161 | +设总体 $X\sim U(0,\theta)$,$\theta>0$,$\theta$ 未知。求 $\theta$ 的最大似然估计量 $\hat\theta$。 |
| 162 | + |
| 163 | +--- |
| 164 | + |
| 165 | +最大似然函数 |
| 166 | + |
| 167 | +$$ |
| 168 | +L(\theta)=\begin{cases} |
| 169 | +\displaystyle\prod_{i=1}^nf(x,\theta)=\left(\frac1\theta \right)^n=\theta^{-n},& 0\le x_1,\cdots,x_n\le \theta \\ |
| 170 | +0,&其他 |
| 171 | +\end{cases} |
| 172 | +$$ |
| 173 | + |
| 174 | +考虑 $0\le x_1,\cdots,x_n\le \theta$ 时 |
| 175 | + |
| 176 | +$$ |
| 177 | +\begin{align} |
| 178 | +\frac{\mathrm d}{\mathrm d\theta}\ln L(\theta)=-n\frac{\mathrm d}{\mathrm d\theta}\ln\theta=-\frac n\theta=0 |
| 179 | +\end{align} |
| 180 | +$$ |
| 181 | + |
| 182 | +无解。考虑回归定义: |
| 183 | + |
| 184 | +$$ |
| 185 | +L(\hat\theta)=\max_{\theta\in\varTheta}L(\theta)=\max_{\theta>0}\theta^{-n} |
| 186 | +$$ |
| 187 | + |
| 188 | +注意到 $\theta=\max\{x\}$ 时有 $\max L(\theta)$,因此有 $\hat\theta=X_{(n)}$ |
| 189 | + |
| 190 | +::: |
| 191 | + |
| 192 | +上例子说明 |
| 193 | + |
| 194 | +- 不同估计手段得到的估计量不一定相同 |
| 195 | +- 对数解不了的情况下考虑回归定义。 |
| 196 | + |
| 197 | +推广,若有多维参数,寻找 $\hat\theta_1,\cdots,\hat\theta_k$ 要求解似然方程组 |
| 198 | + |
| 199 | +$$ |
| 200 | +\left\{\begin{align} |
| 201 | +&\frac\partial {\partial \theta_1}\ln L(\theta_1,\cdots,\theta_k)=0\\ |
| 202 | +&\frac\partial {\partial \theta_2}\ln L(\theta_1,\cdots,\theta_k)=0\\ |
| 203 | +&\cdots\cdots \\ |
| 204 | +&\frac\partial {\partial \theta_k}\ln L(\theta_1,\cdots,\theta_k)=0\\ |
| 205 | +\end{align}\right. |
| 206 | +$$ |
0 commit comments