We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent c2f36bd commit 4b6ca93Copy full SHA for 4b6ca93
_posts/2025-08-20-finite_mdp.md
@@ -534,8 +534,8 @@ $$
534
두 식은, 정말로 정책에 dependent한 식이 아니다.
535
(3.19)에 subscript로 $\pi$같은게 없다는 것이다.
536
537
-이것은 $|\mathcal S|$개의 변수 $v_\ast(s)$에 대한 $|\mathcal S|$개의 식으로 이루어진 연립방정식이다.
538
-$\max$를 포함하고 있어 일차연립방정식은 아니다, 즉 비선형 연립방정식이다.
+이것은 $|\mathcal S|$개의 변수 $v_\ast(s)$에 대한 $|\mathcal S|$개의 식이다.
+즉, 연립방정식인데 $\max$를 포함하고 있어 일차연립방정식은 아닌 비선형 연립방정식이다.
539
$q_\ast$ 버전의 Bellman optimal equation은 다음과 같다.
540
541
$$
0 commit comments