Add arguments for updated vllm service

dudeperf3ct · dudeperf3ct · commit 2ed0d81b95f8 · 2024-10-25T13:55:11.000+05:30
diff --git a/llm-vllm-deployer/steps/vllm_deployer.py b/llm-vllm-deployer/steps/vllm_deployer.py
@@ -31,6 +31,7 @@
 @step(enable_cache=False)
 def vllm_model_deployer_step(
     model: str,
+    port: int = 8000,
     tokenizer: Optional[str] = None,
     timeout: int = 1200,
     deploy_decision: bool = True,
@@ -41,6 +42,7 @@ def vllm_model_deployer_step(
 
     Args:
         model: Name or path to huggingface model
+        port: Port used by vllm server
         tokenizer: Name or path of the huggingface tokenizer to use.
             If unspecified, model name or path will be used.
         timeout: the number of seconds to wait for the service to start/stop.
@@ -62,6 +64,7 @@ def vllm_model_deployer_step(
     # create a config for the new model service
     predictor_cfg = VLLMServiceConfig(
         model=model,
+        port=port,
         tokenizer=tokenizer,
         model_name="default",  # Required for ServiceConfig
     )