Skip to content

Commit 8c71745

Browse files
authored
Merge pull request #11 from Ynjxsjmh/patch-2
4.5 节 10^20 显示出错
2 parents bbf8e8d + e09591a commit 8c71745

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

source/partI/chapter4/dynamic_programming.rst

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -465,7 +465,7 @@ DP和增强学习思想的核心通常说来是用价值函数去组织构建一
465465
------------------
466466

467467
到目前为止我们所讨论的DP方法一个主要的缺点是他们涉及整个MDP状态集合,也就是说,需要对整个状态集合进行更新。
468-
如果状态集非常大,即使一次更新也会代价很大。例如,五子棋有多于 :math:`10^20` 个状态。
468+
如果状态集非常大,即使一次更新也会代价很大。例如,五子棋有多于 :math:`10^{20}` 个状态。
469469
即使我们能够一秒钟执行一百万个状态的价值迭代更新,也会花费一千年才能完成一次更新。
470470

471471
*异步* DP算法是就地迭代DP算法,并没有按照规则的状态集更新步骤进行组织。

0 commit comments

Comments
 (0)