@@ -138,7 +138,8 @@ models:
138138 - chatglm4 : # 自定义的模型名称
139139 alias : null # 别名 例如 gpt4,gpt3
140140 enable : true # false true 控制是否启动模型worker
141- model_name_or_path : /home/dev/model/THUDM/glm-4-9b-chat/
141+ model_config :
142+ model_name_or_path : /home/dev/model/THUDM/glm-4-9b-chat/
142143 model_type : chatglm # qwen yi internlm
143144 work_mode : vllm # vllm hf lmdeploy-turbomind lmdeploy-pytorch
144145 # lora: # lora 配置
@@ -162,7 +163,11 @@ models:
162163 - qwen : # 自定义的模型名称
163164 alias : gpt-4,gpt-3.5-turbo,gpt-3.5-turbo-16k # 别名 例如 gpt4,gpt3
164165 enable : true # false true 控制是否启动模型worker
165- model_name_or_path : /home/dev/model/qwen/Qwen1___5-14B-Chat/
166+ model_config :
167+ model_name_or_path : /home/dev/model/qwen/Qwen1___5-14B-Chat/
168+ enable_prefix_caching : false
169+ dtype : auto
170+ max_model_len : 65536
166171 model_type : qwen # qwen yi internlm
167172 work_mode : vllm # vllm hf lmdeploy-turbomind lmdeploy-pytorch
168173 device : gpu # gpu / cpu
@@ -176,7 +181,8 @@ models:
176181 - bge-base-zh :
177182 alias : null # 别名
178183 enable : true # false true
179- model_name_or_path : /home/dev/model/Xorbits/bge-base-zh-v1___5/
184+ model_config :
185+ model_name_or_path : /home/dev/model/Xorbits/bge-base-zh-v1___5/
180186 model_type : embedding_infinity # embedding_infinity
181187 work_mode : hf
182188 device : gpu # gpu / cpu
@@ -187,7 +193,8 @@ models:
187193 - bge-reranker-base :
188194 alias : null # 别名
189195 enable : true # false true 控制是否启动模型worker
190- model_name_or_path : /home/dev/model/Xorbits/bge-reranker-base/
196+ model_config :
197+ model_name_or_path : /home/dev/model/Xorbits/bge-reranker-base/
191198 model_type : embedding_infinity # embedding_infinity
192199 work_mode : hf
193200 device : gpu # gpu / cpu
0 commit comments