Skip to content

Commit f8977fc

Browse files
authored
Add files via upload
1 parent 4fc22b8 commit f8977fc

File tree

1 file changed

+59
-46
lines changed

1 file changed

+59
-46
lines changed

lectures/prob_meaning.md

Lines changed: 59 additions & 46 deletions
Original file line numberDiff line numberDiff line change
@@ -17,9 +17,9 @@ kernelspec:
1717

1818
本讲座说明了**概率分布**的两种不同解释
1919

20-
* 频率主义解释:预期在大规模独立同分布样本中出现的**相对频率**
20+
* 频率主义解释:在大型独立同分布样本中,概率表示预期出现的**相对频率**
2121

22-
* 贝叶斯解释:在观察一系列数据后对参数或参数列表的**个人观点**
22+
* 贝叶斯解释:概率是在观察一系列数据后对参数或参数列表的**个人观点**
2323

2424
我们建议观看这个关于频率主义方法中**假设检验**的视频
2525

@@ -31,7 +31,15 @@ kernelspec:
3131
```{youtube} Pahyv9i_X2k
3232
```
3333

34-
在您熟悉这些视频中的内容后,本讲座将使用苏格拉底方法来帮助巩固您对以下两种方法所回答的不同问题的理解:
34+
<!--
35+
假设检验:
36+
【【统计推断】假设检验基础】 https://www.bilibili.com/video/BV1ra411N7fx
37+
贝叶斯统计:
38+
【【贝叶斯统计】贝叶斯参数估计基础】 https://www.bilibili.com/video/BV1BK411X7mu
39+
【【贝叶斯统计】Bayes区间估计】 https://www.bilibili.com/video/BV1CM411B74c
40+
-->
41+
42+
在您熟悉这些视频中的内容后,本讲座将使用苏格拉底提问法来帮助巩固您对以下两种方法所回答的不同问题的理解:
3543

3644
* 频率主义置信区间
3745

@@ -76,9 +84,9 @@ $$
7684
\left(\frac{n!}{k! (n-k)!} \right) \theta^k (1-\theta)^{n-k}
7785
$$
7886

79-
其中固定参数 $\theta \in (0,1)$。
87+
其中 $\theta \in (0,1)$ 是一个固定参数
8088

81-
这被称为__二项分布__
89+
这被称为*二项分布*
8290

8391
这里
8492

@@ -96,11 +104,11 @@ $$
96104

97105
* 我们用它来描述从参数为 $\theta$ 的**伯努利**分布中进行 $n$ 次独立抽样,从而得到一个参数为 $\theta,n$ 的**二项**分布的一次抽样。
98106

99-
* 我们再次使用它来描述我们进行 $I$ 次这样的 $n$ 次投币序列
107+
* 我们再次使用它来描述我们进行 $I$ 次这样的 $n$ 次硬币投掷序列
100108

101109
令 $y_h^i \in \{0, 1\}$ 表示第 $i$ 次序列中第 $h$ 次投掷的 $Y$ 的实际值。
102110

103-
令 $\sum_{h=1}^n y_h^i$ 表示第 $i$ $n$ 次独立投币序列中出现正面的总次数
111+
令 $\sum_{h=1}^n y_h^i$ 表示第 $i$ 次序列的 $n$ 次独立硬币投掷中出现正面的总次数
104112

105113
令 $f_k$ 记录长度为 $n$ 的样本中满足 $\sum_{h=1}^n y_h^i = k$ 的比例:
106114

@@ -123,7 +131,7 @@ $$
123131
2. 请使用你的代码计算 $f_k^I, k = 0, \ldots , n$ 并将其与不同 $\theta, n$ 和 $I$ 值下的
124132
$\textrm{Prob}(X = k | \theta)$ 进行比较
125133
126-
3. 结合大数定律,用你的代码说明一些现象
134+
3. 结合大数定律,运行你的代码并说明观察到的结论
127135
```
128136

129137
```{solution-start} pm_ex1
@@ -308,41 +316,40 @@ plt.legend()
308316
plt.show()
309317
```
310318

311-
从上面的图表中,我们可以看到**$I$,即独立序列的数量,**起着重要作用。
319+
从上面的图表中,我们可以看到 $I$,**独立序列的数量**起着重要作用。
312320

313-
$I$变大时,理论概率和频率估计之间的差异变小
321+
随着 $I$ 变大,理论概率和频率估计之间的差距变小
314322

315-
而且,只要$I$足够大,改变$\theta$$n$都不会实质性地改变观察到的分数作为$\theta$的近似值的准确性。
323+
而且,只要 $I$ 足够大,改变 $\theta$$n$ 都不会实质性地改变观察到的分数作为 $\theta$ 的近似值的准确性。
316324

317-
这里体现了大数定律
325+
这正是大数定律在起作用
318326

319-
对于每个独立序列的抽取,$\textrm{Prob}(X_i = k | \theta)$都是相同的,所以所有抽取的聚合形成了一个二元随机变量$\rho_{k,i},i=1,2,...I$的独立同分布序列,其均值为$\textrm{Prob}(X = k | \theta)$,方差为
327+
对于每个独立序列的抽取,$\textrm{Prob}(X_i = k | \theta)$ 都是相同的,所以所有抽取的聚合形成了一个二元随机变量 $\rho_{k,i},i=1,2,...I$ 的独立同分布序列,其均值为$\textrm{Prob}(X = k | \theta)$,方差为
320328

321329
$$
322330
n \cdot \textrm{Prob}(X = k | \theta) \cdot (1-\textrm{Prob}(X = k | \theta)).
323331
$$
324332

325-
因此,根据大数定律,$P_{k,i}$的平均值收敛于:
333+
因此,根据大数定律,当$I$趋向于无穷时,$P_{k,i}$ 的平均值收敛于:
326334

327335
$$
328336
E[\rho_{k,i}] = \textrm{Prob}(X = k | \theta) = \left(\frac{n!}{k! (n-k)!} \right) \theta^k (1-\theta)^{n-k}
329337
$$
330338

331-
当$I$趋向于无穷时。
332339

333340
## 贝叶斯解释
334341

335-
我们再次使用二项分布
342+
我们仍然使用二项分布
336343

337-
但现在我们不把$\theta$看作是一个固定的数。
344+
但现在我们不把 $\theta$ 看作是一个固定的数。
338345

339346
相反,我们把它看作是一个**随机变量**
340347

341-
$\theta$由一个概率分布来描述。
348+
$\theta$ 由一个概率分布来描述。
342349

343350
但现在这个概率分布的含义与我们在大规模独立同分布样本中能预期出现的相对频率不同。
344351

345-
相反,$\theta$的概率分布现在是我们对$\theta$可能值的看法的总结,这些看法要么是
352+
相反,$\theta$ 的概率分布现在是我们对 $\theta$ 可能值的看法的总结,这些看法要么是
346353

347354
* 在我们**完全没有看到**任何数据之前,或者
348355
* 在我们已经看到**一些**数据之后,但在看到**更多**数据之前
@@ -353,24 +360,24 @@ $$
353360
P(\theta) = \frac{\theta^{\alpha-1}(1-\theta)^{\beta -1}}{B(\alpha, \beta)}
354361
$$
355362

356-
其中$B(\alpha, \beta)$是一个**贝塔函数**,所以$P(\theta)$是一个带参数$\alpha, \beta$的**贝塔分布**
363+
其中 $B(\alpha, \beta)$ 是一个**贝塔函数**,所以 $P(\theta)$ 是一个带参数 $\alpha, \beta$ **贝塔分布**
357364

358365
```{exercise}
359366
:label: pm_ex2
360367
361-
**a)** 请写出从参数为$\theta$的二项分布中抽取长度为$n$的样本的**似然函数**。
368+
**a)** 请写出从参数为 $\theta$ 的二项分布中抽取长度为 $n$ 的样本的**似然函数**。
362369
363-
**b)** 请写出观察到一次硬币翻转后$\theta$的**后验**分布。
370+
**b)** 请写出观察到一次硬币翻转后 $\theta$ 的**后验**分布。
364371
365-
**c)** 现在假设$\theta$的真实值为$.4$,而某个不知道这一点的人有一个参数为$\beta = \alpha = .5$的贝塔先验分布。请编写一个Python类来模拟这个人对于一个长度为$n$的_单个_序列的$\theta$的个人后验分布。
372+
**c)** 现在假设 $\theta$ 的真实值为 $.4$,而某个不知道这一点的人有一个参数为 $\beta = \alpha = .5$ 的贝塔先验分布。请编写一个Python类来模拟这个人对于一个长度为 $n$ 的*单个*序列的 $\theta$ 的个人后验分布。
366373
367-
**d)** 请绘制当$n$增长为$1, 2, \ldots$时,$\theta$的后验分布关于$\theta$的函数图。
374+
**d)** 请绘制当 $n$ 增长为 $1, 2, \ldots$ 时,$\theta$ 的后验分布关于 $\theta$ 的函数图。
368375
369-
**e)** 对于不同的$n$值,请描述并计算区间$[.45, .55]$的贝叶斯覆盖区间。
376+
**e)** 对于不同的 $n$ 值,请描述并计算区间 $[.45, .55]$ 的贝叶斯覆盖区间。
370377
371378
**f)** 请说明贝叶斯覆盖区间回答了什么问题。
372379
373-
**g)** 请计算对于不同的样本大小$n$,后验概率$P(\theta \in [.45, .55])$的值。
380+
**g)** 请计算对于不同的样本大小$n$,后验概率 $P(\theta \in [.45, .55])$ 的值。
374381
375382
**h)** 请使用您的Python类来研究当 $n \rightarrow + \infty$ 时后验分布会发生什么变化,同样假设 $\theta$ 的真实值为 $.4$,尽管对于通过贝叶斯定律进行更新的人来说这是未知的。
376383
```
@@ -379,9 +386,9 @@ $$
379386
:class: dropdown
380387
```
381388

382-
**a)** 请写出观察到一次硬币翻转后 $\theta$ **似然函数****后验**分布
389+
**a)** 请写出从参数为 $\theta$ 的二项分布中抽取长度为 $n$ 的样本的**似然函数**
383390

384-
假设结果为 __Y__
391+
假设结果为 $Y$
385392

386393
似然函数为:
387394

@@ -400,12 +407,14 @@ $$
400407

401408
我们可以通过以下方式推导 $\theta$ 的后验分布:
402409

403-
\begin{align*}
410+
$$
411+
\begin{aligned}
404412
\textrm{Prob}(\theta | Y) &= \frac{\textrm{Prob}(Y | \theta) \textrm{Prob}(\theta)}{\textrm{Prob}(Y)} \\
405413
&=\frac{\textrm{Prob}(Y | \theta) \textrm{Prob}(\theta)}{\int_{0}^{1} \textrm{Prob}(Y | \theta) \textrm{Prob}(\theta) d \theta }\\
406414
&= \frac{\theta^Y (1-\theta)^{1-Y}\frac{\theta^{\alpha - 1} (1 - \theta)^{\beta - 1}}{B(\alpha, \beta)}}{\int_{0}^{1}\theta^Y (1-\theta)^{1-Y}\frac{\theta^{\alpha - 1} (1 - \theta)^{\beta - 1}}{B(\alpha, \beta)} d \theta } \\
407415
&= \frac{ \theta^{Y+\alpha - 1} (1 - \theta)^{1-Y+\beta - 1}}{\int_{0}^{1}\theta^{Y+\alpha - 1} (1 - \theta)^{1-Y+\beta - 1} d \theta}
408-
\end{align*}
416+
\end{aligned}
417+
$$
409418

410419
这意味着
411420

@@ -415,7 +424,7 @@ $$
415424

416425
现在假设 $\theta$ 的真实值为 $.4$,并且有一个不知道这一点的人,他有一个 $\beta = \alpha = .5$ 的beta先验分布。
417426

418-
**c)** 现在假设 $\theta$ 的真实值为 $.4$,并且有一个不知道这一点的人,他有一个参数为 $\beta = \alpha = .5$ 的beta先验分布。请编写一个Python类来模拟这个人对于_单个_长度为 $n$ 的序列的 $\theta$ 的个人后验分布。
427+
**c)** 现在假设 $\theta$ 的真实值为 $.4$,而某个不知道这一点的人有一个参数为 $\beta = \alpha = .5$ 的贝塔先验分布。请编写一个Python类来模拟这个人对于一个长度为 $n$ *单个*序列的 $\theta$ 的个人后验分布。
419428

420429
```{code-cell} ipython3
421430
class Bayesian:
@@ -479,7 +488,8 @@ class Bayesian:
479488
self.posterior_list.append(self.form_single_posterior(num))
480489
```
481490

482-
**d)** 请绘制$\theta$的后验分布随着$n$从$1, 2, \ldots$增长时的函数图。
491+
492+
**d)** 请绘制当 $n$ 增长为 $1, 2, \ldots$ 时,$\theta$ 的后验分布关于 $\theta$ 的函数图。
483493

484494
```{code-cell} ipython3
485495
Bay_stat = Bayesian()
@@ -506,7 +516,8 @@ ax.legend(fontsize=11)
506516
plt.show()
507517
```
508518

509-
**e)** 对于不同的 $n$ 值,请描述并计算后验概率的 $.05$ 和 $.95$ 分位数。
519+
520+
**e)** 对于不同的 $n$ 值,请描述并计算区间 $[.45, .55]$ 的贝叶斯覆盖区间。
510521

511522
```{code-cell} ipython3
512523
upper_bound = [ii.ppf(0.05) for ii in Bay_stat.posterior_list[:14]]
@@ -522,19 +533,21 @@ interval_df
522533

523534
随着$n$的增加,我们可以看到贝叶斯覆盖区间变窄并趋向于$0.4$。
524535

536+
525537
**f)** 请说明贝叶斯覆盖区间回答了什么问题。
526538

527-
贝叶斯覆盖区间表示后验分布的累积概率分布(CDF)中[$p_1$, $p_2$]分位数对应的$\theta$的范围。
539+
贝叶斯覆盖区间表示后验分布的累积概率分布(CDF)中 $[p_1, p_2]$ 分位数对应的$\theta$的范围。
528540

529541
要构建覆盖区间,我们首先计算未知参数$\theta$的后验分布。
530542

531-
如果CDF为$F(\theta)$,那么区间$[p_1,p_2]$的贝叶斯覆盖区间$[a,b]$由以下等式描述:
543+
如果CDF为$F(\theta)$,那么区间 $[p_1,p_2]$ 的贝叶斯覆盖区间 $[a,b]$ 由以下等式描述:
532544

533545
$$
534546
F(a)=p_1,F(b)=p_2
535547
$$
536548

537-
**g)** 请计算不同样本量$n$下$\theta \in [.45, .55]$的后验概率。
549+
550+
**g)** 请计算对于不同的样本大小$n$,后验概率 $P(\theta \in [.45, .55])$ 的值。
538551

539552
```{code-cell} ipython3
540553
left_value, right_value = 0.45, 0.55
@@ -556,7 +569,7 @@ plt.show()
556569

557570
这里有两种相互对立的力量在起作用。
558571

559-
第一种力量是,个体在观察到新的结果时会调整他的信念,使他的后验概率分布变得越来越符合实际,这解释了后验概率的上升。
572+
第一种力量是,个体在观察到新的结果时会调整他的信念,使他的后验概率分布变得越来越符合真实值,这解释了后验概率的上升。
560573

561574
然而,$[.45, .55]$ 实际上排除了生成数据的真实 $\theta =.4$。
562575

@@ -568,7 +581,7 @@ plt.show()
568581

569582
这就是为什么当观测数量超过500时,我们看到一条几乎水平的线。
570583

571-
**h)** 请使用你的Python类来研究当 $n \rightarrow + \infty$ 时后验分布会发生什么,同样假设 $\theta = .4$ 是真实值,尽管对于通过贝叶斯法则进行更新的人来说这是未知的
584+
**h)** 请使用您的Python类来研究当 $n \rightarrow + \infty$ 时后验分布会发生什么变化,同样假设 $\theta$ 的真实值为 $.4$,尽管对于通过贝叶斯定律进行更新的人来说这是未知的
572585

573586
使用我们上面创建的Python类,我们可以看到后验分布随着 $n$ 趋向于无穷大时的演变。
574587

@@ -588,7 +601,7 @@ ax.legend(fontsize=11)
588601
plt.show()
589602
```
590603

591-
随着 $n$ 的增加,我们可以看到概率密度函数在 $0.4$(即 $\theta$ 的真实值)处_集中_
604+
随着 $n$ 的增加,我们可以看到概率密度函数在 $0.4$(即 $\theta$ 的真实值)*集中*
592605

593606
这里后验均值收敛于 $0.4$,而后验标准差从上方收敛于 $0$。
594607

@@ -622,7 +635,7 @@ plt.show()
622635

623636
答案就在贝叶斯更新公式中。
624637

625-
将单步贝叶斯更新自然延伸到 n 步贝叶斯更新是很合理的。
638+
将单步贝叶斯更新自然延伸到 $n$ 步贝叶斯更新是很合理的。
626639

627640
$$
628641
\textrm{Prob}(\theta|k) = \frac{\textrm{Prob}(\theta,k)}{\textrm{Prob}(k)}=\frac{\textrm{Prob}(k|\theta)*\textrm{Prob}(\theta)}{\textrm{Prob}(k)}=\frac{\textrm{Prob}(k|\theta)*\textrm{Prob}(\theta)}{\int_0^1 \textrm{Prob}(k|\theta)*\textrm{Prob}(\theta) d\theta}
@@ -677,32 +690,32 @@ plt.show()
677690

678691
在观察了大量结果后,后验分布收敛在$0.4$周围。
679692

680-
因此,贝叶斯统计学家认为$\theta$接近$.4$。
693+
因此,贝叶斯统计学家认为 $\theta$ 接近 $.4$。
681694

682-
如上图所示,随着观测数量的增加,贝叶斯置信区间(BCIs)在$0.4$周围变得越来越窄。
695+
如上图所示,随着观测数量的增加,贝叶斯覆盖区间(BCIs)在 $0.4$ 周围变得越来越窄。
683696

684697
然而,如果仔细观察,你会发现BCIs的中心并不完全是$0.4$,这是由于先验分布的持续影响和模拟路径的随机性造成的。
685698

686699
## 共轭先验的作用
687700

688-
我们做出了一些假设,将似然函数和先验的函数形式联系起来,这大大简化了我们的计算。
701+
在上述分析中,我们做出了一些假设,将似然函数和先验的函数形式联系起来,这大大简化了我们的计算。
689702

690703
特别是,我们假设似然函数是**二项分布**,而先验分布是**beta分布**,这导致贝叶斯定律推导出的后验分布也是**beta分布**
691704

692705
所以后验和先验都是beta分布,只是它们的参数不同。
693706

694707
当似然函数和先验像手和手套一样完美匹配时,我们可以说先验和后验是**共轭分布**
695708

696-
在这种情况下,我们有时也说我们有似然函数$\textrm{Prob}(X | \theta)$的**共轭先验**
709+
在这种情况下,我们有时也说我们有似然函数 $\textrm{Prob}(X | \theta)$ **共轭先验**
697710

698711
通常,似然函数的函数形式决定了**共轭先验**的函数形式。
699712

700713

701-
一个自然的问题是,为什么一个人对参数$\theta$的个人先验必须局限于共轭先验的形式?
714+
一个自然的问题是,为什么一个人对参数 $\theta$ 的个人先验必须局限于共轭先验的形式?
702715

703716
为什么不能是其他更真实地描述个人信念的函数形式?
704717

705-
从争辩的角度来说,人们可以问,为什么似然函数的形式应该对我关于$\theta$的个人信念有*任何*影响?
718+
从争辩的角度来说,人们可以问,为什么似然函数的形式应该对我关于 $\theta$ 的个人信念有*任何*影响?
706719

707720
对这个问题的一个得体回答是,确实不应该有影响,但如果你想要轻松地计算后验分布,使用与似然函数共轭的先验会让你更愉快。
708721

0 commit comments

Comments
 (0)