We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent 65ae96b commit 33999d0Copy full SHA for 33999d0
_posts/2025-08-20-policy_evaluation.md
@@ -0,0 +1,14 @@
1
+---
2
+layout: single
3
+title: "Policy Evaluation"
4
+categories: machine learning
5
+tags: [linear algebra, matrix]
6
+use_math: true
7
+publish: false
8
+author_profile: false
9
+toc: true
10
11
+
12
+얼떨결에 강화학습 업무를 맡았을때는 매우 당황스러웠고 지금도 막막하지만, 그래도 하나 얻은 것이 있다.
13
+대학원 시절에는 잘 읽히지 않던 Sutton의 책이 읽힌다는 것이었다.
14
+결국은 DPG와 DDPG를 구현해야 하는 어려운 일로 가야하지만, 그전에 당연히 DQN을 알아야 할 것이고
0 commit comments