Skip to content

Commit 1b0e126

Browse files
committed
fix LaTeX syntax error in chapter12/3a heading
1 parent 50d4a29 commit 1b0e126

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

chapters/ro/chapter12/3a.mdx

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -110,7 +110,7 @@ $\text{clip}\left( \frac{\pi_{\theta}(o_i|q)}{\pi_{\theta_{old}}(o_i|q)}, 1 - \e
110110

111111
Limitează raportul discutat mai sus să fie în intervalul $[1 - \epsilon, 1 + \epsilon]$ pentru a evita/controla schimbări drastice sau actualizări nebunești și să nu pășească prea departe de politica veche. Cu alte cuvinte, limitează cât de mult poate crește raportul de probabilitate pentru a ajuta la menținerea stabilității prin evitarea actualizărilor care împing modelul nou prea departe de cel vechi.
112112

113-
#### Exemplu $\space \text{să presupunem}(\epsilon = 0.2)$
113+
#### Exemplu (să presupunem epsilon = 0.2)
114114
Să ne uităm la două scenarii diferite pentru a înțelege mai bine această funcție de tăiere:
115115

116116
- **Cazul 1**: dacă noua politică are o probabilitate de 0.9 pentru un răspuns specific și vechea politică are o probabilitate de 0.5, înseamnă că acest răspuns este întărit de noua politică să aibă o probabilitate mai mare, dar într-o limită controlată care este tăierea pentru a-și strânge mâinile să nu devină drastică

0 commit comments

Comments
 (0)