fix embedding_vllm

shell-nlp · shell-nlp · commit 861a4a52f9b7 · 2025-08-08T17:11:46.000+08:00
diff --git a/gpt_server/model_worker/embedding_vllm.py b/gpt_server/model_worker/embedding_vllm.py
@@ -67,14 +67,12 @@ async def get_embeddings(self, params):
         ret = {"embedding": [], "token_num": 0}
         texts: list = params["input"]
         if self.mode == "embedding":
-            usage = None
             texts = list(map(lambda x: x.replace("\n", " "), texts))
             # ----------
-            outputs = self.engine.embed(prompts=texts)
+            outputs = self.engine.embed(texts)
             embedding = [o.outputs.embedding for o in outputs]
 
         ret["embedding"] = embedding
-        ret["token_num"] = usage
         return ret