|
2 | 2 | datetime: 2025-01-10 21:09:58 |
3 | 3 | dlink: |
4 | 4 | - "[[R03ist]]" |
| 5 | + - "[[-信息论与编码理论-]]" |
5 | 6 | --- |
6 | 7 | # 問2 |
7 | | -定常無記憶情報源 $X_1X_2 \dots$ を考える。この情報源のアルファベットを有限集合 $X$ とし、各 $X_i$ は確率分布 $p(x)$ に従うものとする。任意に固定された $\epsilon > 0$ に対し、系列 $(x_1, x_2, \dots, x_n) \in X^n$ が |
| 8 | +定常無記憶情報源 $X_1X_2 \dots$ を考える。この情報源のアルファベットを有限集合 $\chi$ とし、各 $X_i$ は確率分布 $p(x)$ に従うものとする。任意に固定された $\varepsilon > 0$ に対し、系列 $(x_1, x_2, \dots, x_n) \in \chi^n$ が |
8 | 9 | $$ |
9 | | -2^{-n(H(X_1)+\epsilon)} \leq p(x_1, x_2, \dots, x_n) \leq 2^{-n(H(X_1)-\epsilon)} |
| 10 | +2^{-n(H(X_1)+\varepsilon)} \leq p(x_1, x_2, \dots, x_n) \leq 2^{-n(H(X_1)-\varepsilon)} |
10 | 11 | $$ |
11 | | -を満たすとき、この系列を $p(x)$ に関する典型系列であると言う。ここで、$H(X_1)$ は $X_1$ のエントロピーを表し、$p(x_1, x_2, \dots, x_n)$ は同時確率分布を表す。全ての典型系列からなる集合を $A_\epsilon^{(n)}$ と表記する。次の各問いに答えよ。ただし、$X = \{0, 1\}, p(0) = 1 - \alpha, p(1) = \alpha$ とする。ここで $\alpha \in (0, 1)$ は定数である。 |
| 12 | +を満たすとき、この系列を $p(x)$ に関する典型系列であると言う。ここで、$H(X_1)$ は $X_1$ のエントロピーを表し、$p(x_1, x_2, \dots, x_n)$ は同時確率分布を表す。全ての典型系列からなる集合を $A_\varepsilon^{(n)}$ と表記する。次の各問いに答えよ。ただし、$X = \{0, 1\}, p(0) = 1 - \alpha, p(1) = \alpha$ とする。ここで $\alpha \in (0, 1)$ は定数である。 |
12 | 13 |
|
13 | 14 | 1. $(x_1, x_2, \dots, x_{10}) = (0, 1, 1, 0, 0, 0, 0, 1, 0, 0)$ に対し、$p(x_1, x_2, \dots, x_{10})$ を求めよ。 |
14 | 15 | 2. $H(X_i)$ ($i = 1, 2, \dots, n$) および $H(X_1, X_2, \dots, X_n)$ を求めよ。 |
15 | | -3. $x = (x_1, x_2, \dots, x_n)$ に対し、$S(x) = \sum_{i=1}^n x_i$ とおく。$\alpha = 0.2, n = 200, \epsilon = 0.01$ とする。$A_\epsilon^{(n)}$ に属する系列 $x$ に対する $S(x)$ の範囲を求めよ。 |
| 16 | +3. $x = (x_1, x_2, \dots, x_n)$ に対し、$S(x) = \sum_{i=1}^n x_i$ とおく。$\alpha = 0.2, n = 200, \varepsilon = 0.01$ とする。$A_\varepsilon^{(n)}$ に属する系列 $x$ に対する $S(x)$ の範囲を求めよ。 |
16 | 17 |
|
17 | 18 | # 中文翻译 |
18 | | -设定常无记忆信息源 $X_1X_2 \dots$,其字母表为有限集合 $X$,各 $X_i$ 遵循概率分布 $p(x)$。对任意固定的 $\epsilon > 0$,若序列 $(x_1, x_2, \dots, x_n) \in X^n$ 满足: |
| 19 | +设定常无记忆信息源 $X_1X_2 \dots$,其字母表为有限集合 $\chi$,各 $X_i$ 遵循概率分布 $p(x)$。对任意固定的 $\varepsilon > 0$,若序列 $(x_1, x_2, \dots, x_n) \in \chi^n$ 满足: |
19 | 20 | $$ |
20 | | -2^{-n(H(X_1)+\epsilon)} \leq p(x_1, x_2, \dots, x_n) \leq 2^{-n(H(X_1)-\epsilon)} |
| 21 | +2^{-n(H(X_1)+\varepsilon)} \leq p(x_1, x_2, \dots, x_n) \leq 2^{-n(H(X_1)-\varepsilon)} |
21 | 22 | $$ |
22 | | -则称此序列为 $p(x)$ 的典型序列,其中 $H(X_1)$ 表示 $X_1$ 的熵,$p(x_1, x_2, \dots, x_n)$ 表示联合概率分布。所有典型序列的集合记为 $A_\epsilon^{(n)}$。回答以下问题: |
| 23 | +则称此序列为 $p(x)$ 的典型序列,其中 $H(X_1)$ 表示 $X_1$ 的熵,$p(x_1, x_2, \dots, x_n)$ 表示联合概率分布。所有典型序列的集合记为 $A_\varepsilon^{(n)}$。回答以下问题: |
23 | 24 | 1. 对序列 $(x_1, x_2, \dots, x_{10}) = (0, 1, 1, 0, 0, 0, 0, 1, 0, 0)$,求其 $p(x_1, x_2, \dots, x_{10})$。 |
24 | 25 | 2. 求 $H(X_i)$ 和联合熵 $H(X_1, X_2, \dots, X_n)$。 |
25 | | -3. 对于 $x = (x_1, x_2, \dots, x_n)$,令 $S(x) = \sum_{i=1}^n x_i$,已知 $\alpha = 0.2, n = 200, \epsilon = 0.01$,求属于 $A_\epsilon^{(n)}$ 的序列 $x$ 的 $S(x)$ 的范围。 |
| 26 | +3. 对于 $x = (x_1, x_2, \dots, x_n)$,令 $S(x) = \sum_{i=1}^n x_i$,已知 $\alpha = 0.2, n = 200, \varepsilon = 0.01$,求属于 $A_\varepsilon^{(n)}$ 的序列 $x$ 的 $S(x)$ 的范围。 |
26 | 27 |
|
| 28 | +--- |
| 29 | +# o1 |
| 30 | + |
| 31 | +以下的推导中,默认对数均为以 2 为底(即 $\log \equiv \log_2$)。若题目中未特别指定底数,信息论中常用 $\log_2$ 计算熵。 |
| 32 | + |
| 33 | +--- |
| 34 | + |
| 35 | +## 1. 求 $\displaystyle p(x_1, x_2, \dots, x_{10})$ |
| 36 | + |
| 37 | +给定: |
| 38 | +$$ |
| 39 | +X = \{0,1\},\quad p(0) = 1 - \alpha,\quad p(1) = \alpha. |
| 40 | +$$ |
| 41 | +并且 $\{X_i\}$ 独立同分布(i.i.d.)。 |
| 42 | +题目中的具体序列是 |
| 43 | +$$ |
| 44 | +(x_1, x_2, \dots, x_{10}) |
| 45 | += (0,\,1,\,1,\,0,\,0,\,0,\,0,\,1,\,0,\,0). |
| 46 | +$$ |
| 47 | +数一数其中“1”的个数与“0”的个数: |
| 48 | + |
| 49 | +- “1”的个数 = 3 |
| 50 | +- “0”的个数 = 7 |
| 51 | + |
| 52 | +由于 $X_i$ 相互独立,故该序列的概率为 |
| 53 | +$$ |
| 54 | +p(x_1,x_2,\dots,x_{10}) |
| 55 | += (1-\alpha)^{\text{(“0”的个数)}} \,\alpha^{\text{(“1”的个数)}} |
| 56 | += (1-\alpha)^{7} \,\alpha^{3}. |
| 57 | +$$ |
| 58 | + |
| 59 | +--- |
| 60 | + |
| 61 | +## 2. 求 $H(X_i)$ 与 $H(X_1, X_2, \dots, X_n)$ |
| 62 | + |
| 63 | +1. **单个符号的熵 $H(X_i)$** |
| 64 | + |
| 65 | + 对伯努利随机变量 $X_i$(取值 0 或 1),其熵为 |
| 66 | + $$ |
| 67 | + H(X_i) |
| 68 | + = -\bigl((1-\alpha)\log(1-\alpha) + \alpha\log(\alpha)\bigr). |
| 69 | + $$ |
| 70 | + 这是标准的 Bernoulli($\alpha$) 熵公式。 |
| 71 | + |
| 72 | +2. **联合熵 $H(X_1, X_2, \dots, X_n)$** |
| 73 | + |
| 74 | + 由于 $X_1, X_2, \dots, X_n$ 独立同分布(i.i.d.),故其联合熵为 |
| 75 | + $$ |
| 76 | + H(X_1, X_2, \dots, X_n) |
| 77 | + = \sum_{i=1}^n H(X_i) |
| 78 | + = n \, H(X_1). |
| 79 | + $$ |
| 80 | + |
| 81 | +--- |
| 82 | + |
| 83 | +## 3. 对典型集合中序列的 $S(x)$ 取值范围 |
| 84 | + |
| 85 | +题目给定: |
| 86 | +$$ |
| 87 | +\alpha = 0.2,\quad n = 200,\quad \varepsilon = 0.01. |
| 88 | +$$ |
| 89 | +并定义 |
| 90 | +$$ |
| 91 | +S(x) \;=\; \sum_{i=1}^n x_i,\quad |
| 92 | +x_i \in \{0,1\}. |
| 93 | +$$ |
| 94 | +典型集合 $A_\varepsilon^{(n)}$ 的定义是: |
| 95 | +$$ |
| 96 | +2^{-n\bigl(H(X_1)+\varepsilon\bigr)} |
| 97 | +\;\;\le\;\; p(x_1,\dots,x_n) |
| 98 | +\;\;\le\;\; 2^{-n\bigl(H(X_1)-\varepsilon\bigr)}, |
| 99 | +$$ |
| 100 | +其中 |
| 101 | +$$ |
| 102 | +p(x_1,\dots,x_n) |
| 103 | += \alpha^{\sum x_i}\,(1-\alpha)^{\,n-\sum x_i} |
| 104 | += \alpha^{S(x)}\,(1-\alpha)^{\,n - S(x)}. |
| 105 | +$$ |
| 106 | + |
| 107 | +--- |
| 108 | +### 3.1 将不等式转化为“经验分布”形式 |
| 109 | + |
| 110 | +令 $\displaystyle \theta = \frac{S(x)}{n}$。则 |
| 111 | +$$ |
| 112 | +p(x) |
| 113 | += \alpha^{n\theta}\,(1-\alpha)^{\,n(1-\theta)}, |
| 114 | +\quad |
| 115 | +-\frac1n \log p(x) |
| 116 | += -\Bigl(\,\theta\log\alpha + (1-\theta)\log(1-\alpha)\Bigr). |
| 117 | +$$ |
| 118 | +记伯努利($\alpha$) 的熵为 |
| 119 | +$$ |
| 120 | +H(\alpha) |
| 121 | += -\bigl(\alpha\log \alpha + (1-\alpha)\log(1-\alpha)\bigr). |
| 122 | +$$ |
| 123 | +则典型集合的条件可写为 |
| 124 | +$$ |
| 125 | +H(\alpha) - \varepsilon |
| 126 | +\;\;\le\; |
| 127 | +-\frac1n\log p(x) |
| 128 | +\;\;\le\; |
| 129 | +H(\alpha) + \varepsilon, |
| 130 | +$$ |
| 131 | +即 |
| 132 | +$$ |
| 133 | +H(\alpha) - \varepsilon |
| 134 | +\;\;\le\; |
| 135 | +-\Bigl(\theta\log\alpha + (1-\theta)\log(1-\alpha)\Bigr) |
| 136 | +\;\;\le\; |
| 137 | +H(\alpha) + \varepsilon. |
| 138 | +$$ |
| 139 | +从而得到 |
| 140 | +$$ |
| 141 | +\bigl|\, -(\theta\log\alpha + (1-\theta)\log(1-\alpha)) \;-\; H(\alpha)\bigr| |
| 142 | +\;\le\; |
| 143 | +\varepsilon. |
| 144 | +$$ |
| 145 | +也就是说,**只有当** $\theta$ 使得该式在 $\pm \varepsilon$ 的范围内成立,$x$ 才会落在典型集合里。 |
| 146 | + |
| 147 | +--- |
| 148 | + |
| 149 | +### 3.2 在 $\alpha = 0.2$ 时的线性化简 |
| 150 | + |
| 151 | +对 $\alpha = 0.2$ 来说, |
| 152 | +$$ |
| 153 | +H(\alpha) |
| 154 | += -\bigl(0.2\log 0.2 + 0.8\log 0.8\bigr). |
| 155 | +$$ |
| 156 | +用 $\log_2$ 来算,可得到大约 |
| 157 | +$$ |
| 158 | +H(0.2) \approx 0.7219\quad (\text{比特}). |
| 159 | +$$ |
| 160 | +另一方面, |
| 161 | +$$ |
| 162 | +-\bigl(\theta\log 0.2 + (1-\theta)\log 0.8\bigr) |
| 163 | +$$ |
| 164 | +在 $\log_2$ 下其实是一个关于 $\theta$ 的**线性函数**(可由数值代入后发现)。 |
| 165 | +具体计算(保留 4~5 位小数即可): |
| 166 | +- $\log_2 (0.2) \approx -2.321928$, |
| 167 | +- $\log_2 (0.8) \approx -0.321928$. |
| 168 | + |
| 169 | +所以 |
| 170 | +$$ |
| 171 | +-\bigl(\theta\log 0.2 + (1-\theta)\log 0.8\bigr) |
| 172 | += \theta\cdot 2.321928 \;+\; (1-\theta)\cdot 0.321928 |
| 173 | += 0.321928 \;+\; 2.0\,\theta. |
| 174 | +$$ |
| 175 | +再核对一下 $\theta=0.2$ 时 |
| 176 | +$$ |
| 177 | +0.321928 \;+\; 2.0\times 0.2 |
| 178 | += 0.321928 + 0.4 |
| 179 | += 0.721928, |
| 180 | +$$ |
| 181 | +正好与 $H(0.2)$ 符合。 |
| 182 | + |
| 183 | +--- |
| 184 | + |
| 185 | +### 3.3 令该线性函数落入 $[\,H(0.2)-\varepsilon,\;H(0.2)+\varepsilon]$ |
| 186 | + |
| 187 | +我们要找所有 $\theta$ 使 |
| 188 | +$$ |
| 189 | +0.321928 \;+\; 2.0\,\theta |
| 190 | +\;\in\; |
| 191 | +\bigl[\,0.721928 - 0.01,\;0.721928 + 0.01\bigr] |
| 192 | += |
| 193 | +[\,0.711928,\;0.731928\,]. |
| 194 | +$$ |
| 195 | +令此区间为 $[\,L, U]$,则 |
| 196 | + |
| 197 | +1. 下界 $L = 0.711928$: |
| 198 | + $$ |
| 199 | + 0.321928 + 2.0\,\theta \;\ge\; 0.711928 |
| 200 | + \quad\Longrightarrow\quad |
| 201 | + 2.0\,\theta \;\ge\; 0.711928 - 0.321928 = 0.39 |
| 202 | + \quad\Longrightarrow\quad |
| 203 | + \theta \;\ge\; 0.195. |
| 204 | + $$ |
| 205 | + |
| 206 | +2. 上界 $U = 0.731928$: |
| 207 | + $$ |
| 208 | + 0.321928 + 2.0\,\theta \;\le\; 0.731928 |
| 209 | + \quad\Longrightarrow\quad |
| 210 | + 2.0\,\theta \;\le\; 0.731928 - 0.321928 = 0.41 |
| 211 | + \quad\Longrightarrow\quad |
| 212 | + \theta \;\le\; 0.205. |
| 213 | + $$ |
| 214 | + |
| 215 | +因此对于 $\theta = \frac{S(x)}{n}$,我们得到 |
| 216 | +$$ |
| 217 | +0.195 \;\le\; \theta \;\le\; 0.205. |
| 218 | +$$ |
| 219 | +最后将 $n = 200$ 代回: |
| 220 | +$$ |
| 221 | +S(x) = n\,\theta |
| 222 | +\;\in\; [\,200 \times 0.195,\;200 \times 0.205\,] |
| 223 | += [\,39,\;41\,]. |
| 224 | +$$ |
| 225 | +因为 $S(x)$ 必须是整数,所以 |
| 226 | +$$ |
| 227 | +S(x) \in \{\,39,\;40,\;41\}. |
| 228 | +$$ |
| 229 | + |
| 230 | +--- |
| 231 | + |
| 232 | +## 总结答案 |
| 233 | + |
| 234 | +1. **$p(x_1,\dots,x_{10})$:** |
| 235 | + $$ |
| 236 | + (x_1,\dots,x_{10}) = (0,1,1,0,0,0,0,1,0,0) |
| 237 | + \quad\Longrightarrow\quad |
| 238 | + p(x_1,\dots,x_{10}) |
| 239 | + = (1-\alpha)^7 \,\alpha^3. |
| 240 | + $$ |
| 241 | + |
| 242 | +2. **熵 $H(X_i)$ 与联合熵** |
| 243 | + $$ |
| 244 | + H(X_i) |
| 245 | + = -\bigl(\alpha\log \alpha + (1-\alpha)\log (1-\alpha)\bigr), |
| 246 | + \quad |
| 247 | + H\bigl(X_1, \dots, X_n\bigr) |
| 248 | + = n\,H(X_1). |
| 249 | + $$ |
| 250 | + |
| 251 | +3. **典型集合中 $S(x)$ 的范围** |
| 252 | + 在 $\alpha=0.2, n=200, \varepsilon=0.01$ 条件下,属于典型集合 $A_\varepsilon^{(n)}$ 的序列 $x$ 必须满足 |
| 253 | + $$ |
| 254 | + S(x) \;\in\; \{\,39,\,40,\,41\}. |
| 255 | + $$ |
0 commit comments