Merge pull request #412 from NandiniMurali/patch-1

v-dirichards · web-flow · commit 59bdf7e9e30b · 2025-06-03T09:47:04.000-05:00
Update reinforcement-fine-tuning.md
diff --git a/articles/ai-services/openai/how-to/reinforcement-fine-tuning.md b/articles/ai-services/openai/how-to/reinforcement-fine-tuning.md
@@ -176,11 +176,11 @@ Models which we're supporting as grader models are:
     "model": string,
     "pass_threshold": number,
     "range": number[],
-    "sampling_parameters": {
+    "sampling_params": {
         "seed": number,
         "top_p": number,
         "temperature": number,
-        "max_completion_tokens": number,
+        "max_completions_tokens": number,
         "reasoning_effort": "low" | "medium" | "high"
     }
 }

Original file line number	Diff line number	Diff line change
`@@ -176,11 +176,11 @@ Models which we're supporting as grader models are:`
`176`	`176`	`"model": string,`
`177`	`177`	`"pass_threshold": number,`
`178`	`178`	`"range": number[],`
`179`		`- "sampling_parameters": {`
	`179`	`+ "sampling_params": {`
`180`	`180`	`"seed": number,`
`181`	`181`	`"top_p": number,`
`182`	`182`	`"temperature": number,`
`183`		`- "max_completion_tokens": number,`
	`183`	`+ "max_completions_tokens": number,`
`184`	`184`	`"reasoning_effort": "low" \| "medium" \| "high"`
`185`	`185`	`}`
`186`	`186`	`}`