change doc

NathanHB · NathanHB · commit c75869bc28bf · 2025-02-06T14:30:33.000Z
diff --git a/docs/source/use-vllm-as-backend.mdx b/docs/source/use-vllm-as-backend.mdx
@@ -44,19 +44,13 @@ model: # Model specific parameters
     model_args: "pretrained=HuggingFaceTB/SmolLM-1.7B,revision=main,dtype=bfloat16" # Model args that you would pass in the command line
   generation: # Generation specific parameters
     temperature: 0.3
-    early_stopping: 1
     repetition_penalty: 1.0
     frequency_penalty: 0.0
-    length_penalty: 0.0
     presence_penalty: 0.0
-    max_new_tokens: 100
-    min_new_tokens: 1
     seed: 42
-    stop_tokens: null
     top_k: 0
     min_p: 0.0
     top_p: 0.9
-    truncate_prompt: false
 ```
 
 > [!WARNING]
diff --git a/examples/model_configs/vllm_model_config.yaml b/examples/model_configs/vllm_model_config.yaml
@@ -3,3 +3,10 @@ model:
     model_args: "pretrained=HuggingFaceTB/SmolLM-1.7B,revision=main,dtype=bfloat16" # pretrained=model_name,trust_remote_code=boolean,revision=revision_to_use,model_parallel=True ...
   generation:
     temperature: 0.3
+    repetition_penalty: 1.0
+    frequency_penalty: 0.0
+    presence_penalty: 0.0
+    seed: 42
+    top_k: 0
+    min_p: 0.0
+    top_p: 0.9