chore: support deepseek

iziang · iziang · commit 3a1ce41c3029 · 2025-04-10T10:20:35.000+08:00
diff --git a/aperag/llm/base.py b/aperag/llm/base.py
@@ -80,7 +80,7 @@ def match_predictor(model_name, predictor_type, kwargs):
                 kwargs["model"] = "gpt-4"
                 from aperag.llm.openai import OpenAIPredictor
                 return OpenAIPredictor
-            case "gpt-4-1106-preview" | "gpt-4-vision-preview" | "gpt-4" | "gpt-4-32k" | "gpt-4-0613" | "gpt-4-32k-0613":
+            case "deepseek-chat" | "gpt-4-1106-preview" | "gpt-4-vision-preview" | "gpt-4" | "gpt-4-32k" | "gpt-4-0613" | "gpt-4-32k-0613":
                 from aperag.llm.openai import OpenAIPredictor
                 return OpenAIPredictor
             case "azure-openai":
diff --git a/deploy/aperag/values.yaml b/deploy/aperag/values.yaml
@@ -176,55 +176,6 @@ django:
           memory: "enabled"
           # https://help.aliyun.com/zh/dashscope/developer-reference/api-details?spm=a2c4g.11186623.0.i54
           context_window: 8096
-    - name: "chatglm"
-      label: "ChatGLM"
-      enabled: "true"
-      temperature: 0.01
-      models:
-        - name: "chatglm-turbo"
-          label: "ChatGLM Turbo"
-          enabled: "true"
-          memory: "enabled"
-          # context_window not found online
-        - name: "chatglm-std"
-          label: "ChatGLM Std"
-          enabled: "true"
-          memory: "enabled"
-          # context_window not found online
-        - name: "chatglm-lite"
-          label: "ChatGLM Lite"
-          enabled: "true"
-          memory: "enabled"
-          # context_window not found online
-        - name: "chatglm-pro"
-          label: "ChatGLM Pro"
-          enabled: "true"
-          memory: "enabled"
-          # context_window not found online
-        - name: "chatglm2-6b"
-          label: "ChatGLM2 6b"
-          endpoint: "http://llmserver-chatglm2-6b:8000"
-          enabled: "false"
-          memory: "disabled"
-          # https://github.com/THUDM/ChatGLM-6B
-          context_window: 32384
-    - name: "baichuan"
-      label: "BaiChuan"
-      enabled: "true"
-      temperature: 0.01
-      models:
-        - name: "baichuan-13b"
-          label: "BaiChuan 13b"
-          enabled: "false"
-          memory: "disabled"
-          # https://www.baichuan-ai.com/home
-          context_window: 4096
-          endpoint: "http://llmserver-baichuan-13b:8000"
-        - name: "baichuan-53b"
-          label: "BaiChuan 53b"
-          enabled: "true"
-          memory: "disabled"
-          # context_window not found online
     - name: "azure-openai"
       label: "Azure OpenAI"
       enabled: "true"
@@ -242,98 +193,23 @@ django:
       enabled: "true"
       temperature: 0
       models:
-        - name: "gpt-4-1106-preview"
-          label: "ChatGPT-4 Turbo"
-          enabled: "true"
-          memory: "enabled"
-          # https://platform.openai.com/docs/models/gpt-4-and-gpt-4-turbo
-          context_window: 128000
-          similarity_topk: 10
         - name: "gpt-4"
           label: "ChatGPT-4"
           enabled: "true"
           memory: "enabled"
           # https://platform.openai.com/docs/models/gpt-4-and-gpt-4-turbo
           context_window: 8192
-        - name: "gpt-4-0613"
-          label: "ChatGPT-4-0613"
-          enabled: "true"
-          memory: "enabled"
-          # https://platform.openai.com/docs/models/gpt-4-and-gpt-4-turbo
-          context_window: 8192
-        - name: "gpt-3.5-turbo-1106"
-          label: "ChatGPT 3.5 Turbo 1106"
-          enabled: "true"
-          memory: "enabled"
-          # https://platform.openai.com/docs/models/gpt-3-5
-          context_window: 16385
-          similarity_topk: 5
-        - name: "gpt-3.5-turbo"
-          label: "ChatGPT-3.5 Turbo"
-          enabled: "true"
-          memory: "enabled"
-          # https://platform.openai.com/docs/models/gpt-3-5
-          context_window: 4096
-        - name: "gpt-3.5-turbo-16k"
-          label: "ChatGPT-3.5 Turbo 16k"
-          enabled: "true"
-          memory: "enabled"
-          # https://platform.openai.com/docs/models/gpt-3-5
-          context_window: 16384
-          similarity_topk: 5
-    - name: "wenxinyiyan"
-      label: "Wen Xin Yi Yan"
+    - name: "deepseek"
+      label: "DeepSeek"
       enabled: "true"
       models:
-      - name: "ernie-bot-turbo"
-        label: "Wen Xin Yi Yan"
+      - name: "deepseek-chat"
+        label: "DeepSeek Chat"
         enabled: "true"
         memory: "disabled"
-        # context_window not found online
-    - name: "vicuna"
-      label: "Vicuna"
-      enabled: "false"
-      models:
-        - name: "vicuna-13b"
-          label: "Vicuna 13b"
-          enabled: "false"
-          memory: "disabled"
-          # https://lmsys.org/blog/2023-03-30-vicuna/
-          context_window: 2048
-          endpoint: "http://llmserver-vicuna-13b:8000"
-    - name: "guanaco"
-      label: "Guanaco"
-      enabled: "false"
-      models:
-        - name: "guanaco-33b"
-          label: "Guanaco 33b"
-          enabled: "false"
-          memory: "disabled"
-          # https://llm.extractum.io/model/guanaco-33b-merged,5iVNwg40vN6tl3fT0UJAT1
-          context_window: 2048
-          endpoint: "http://llmserver-guanaco-33b:8000"
-    - name: "falcon"
-      label: "Falcon"
-      enabled: "false"
-      models:
-        - name: "falcon-40b"
-          label: "Falcon 40b"
-          enabled: "false"
-          memory: "disabled"
-          # https://codingscape.com/blog/most-powerful-llms-large-language-models-in-2023
-          context_window: 2048
-          endpoint: "http://llmserver-falcon-40b:8000"
-    - name: "gorilla"
-      label: "Gorilla"
-      enabled: "false"
-      models:
-        - name: "gorilla-7b"
-          label: "Gorilla 7b"
-          enabled: "false"
-          memory: "disabled"
-          # https://llm.extractum.io/model/gorilla-llm/gorilla-7b-hf-delta-v0,628M0wYI5qNZeBLak6s82K
-          context_window: 2048
-          endpoint: "http://llmserver-gurilla-7b:8000"
+        free_tier: true
+        context_window: 128000
+        similarity_topk: 10
 
 celery-worker:
   replicaCount: 1
diff --git a/envs/.env.template b/envs/.env.template
@@ -1,5 +1,5 @@
 LLM_MODEL=vicuna-13b
-MODEL_FAMILIES=[{"name":"qianwen","label":"QianWen","enabled":"true","temperature":0.01,"models":[{"name":"qwen-turbo","label":"QianWen Turbo","enabled":"true","memory":"enabled"},{"name":"qwen-plus","label":"QianWen Plus","enabled":"true","memory":"enabled"},{"name":"qwen-max","label":"QianWen Max","enabled":"true","memory":"enabled"}]},{"name":"chatglm","label":"ChatGLM","enabled":"true","temperature":0.01,"models":[{"name":"chatglm-turbo","label":"ChatGLM Turbo","enabled":"true","memory":"enabled"},{"name":"chatglm-std","label":"ChatGLM Std","enabled":"true","memory":"enabled"},{"name":"chatglm-lite","label":"ChatGLM Lite","enabled":"true","memory":"enabled"},{"name":"chatglm-pro","label":"ChatGLM Pro","enabled":"true","memory":"enabled"},{"name":"chatglm2-6b","label":"ChatGLM2 6b","endpoint":"http://llmserver-chatglm2-6b:8000","enabled":"false","memory":"disabled"}]},{"name":"baichuan","label":"BaiChuan","enabled":"true","temperature":0.01,"models":[{"name":"baichuan-13b","label":"BaiChuan 13b","enabled":"false","memory":"disabled","endpoint":"http://llmserver-baichuan-13b:8000"},{"name":"baichuan-53b","label":"BaiChuan 53b","enabled":"true","memory":"disabled"}]},{"name":"azure-openai","label":"Azure OpenAI","enabled":"true","temperature":0,"models":[{"name":"azure-openai","label":"Azure OpenAI","enabled":"true","memory":"enabled"}]},{"name":"chatgpt","label":"ChatGPT","enabled":"true","temperature":0,"models":[{"name":"gpt-4-1106-preview","label":"ChatGPT-4 Turbo","enabled":"true","memory":"enabled","context_window":128000,"similarity_topk":10},{"name":"gpt-4","label":"ChatGPT-4","enabled":"true","memory":"enabled","context_window":8192},{"name":"gpt-4-0613","label":"ChatGPT-4-0613","enabled":"true","memory":"enabled","context_window":8192},{"name":"gpt-3.5-turbo-1106","label":"ChatGPT 3.5 Turbo 1106","enabled":"true","memory":"enabled","context_window":16385,"similarity_topk":5},{"name":"gpt-3.5-turbo","label":"ChatGPT-3.5 Turbo","enabled":"true","memory":"enabled","context_window":4096},{"name":"gpt-3.5-turbo-16k","label":"ChatGPT-3.5 Turbo 16k","enabled":"true","memory":"enabled","context_window":16384,"similarity_topk":5}]},{"name":"wenxinyiyan","label":"Wen Xin Yi Yan","enabled":"true","models":[{"name":"ernie-bot-turbo","label":"Wen Xin Yi Yan","enabled":"true","memory":"disabled"}]},{"name":"vicuna","label":"Vicuna","enabled":"false","models":[{"name":"vicuna-13b","label":"Vicuna 13b","enabled":"false","memory":"disabled","endpoint":"http://llmserver-vicuna-13b:8000"}]},{"name":"guanaco","label":"Guanaco","enabled":"false","models":[{"name":"guanaco-33b","label":"Guanaco 33b","enabled":"false","memory":"disabled","endpoint":"http://llmserver-guanaco-33b:8000"}]},{"name":"falcon","label":"Falcon","enabled":"false","models":[{"name":"falcon-40b","label":"Falcon 40b","enabled":"false","memory":"disabled","endpoint":"http://llmserver-falcon-40b:8000"}]},{"name":"gorilla","label":"Gorilla","enabled":"false","models":[{"name":"gorilla-7b","label":"Gorilla 7b","enabled":"false","memory":"disabled","endpoint":"http://llmserver-gurilla-7b:8000"}]}]
+MODEL_FAMILIES=[{"name":"qianwen","label":"QianWen","enabled":"true","temperature":0.01,"models":[{"name":"qwen-turbo","label":"QianWen Turbo","enabled":"true","memory":"enabled","context_window":8096},{"name":"qwen-plus","label":"QianWen Plus","enabled":"true","memory":"enabled","context_window":8096},{"name":"qwen-max","label":"QianWen Max","enabled":"true","memory":"enabled","context_window":8096}]},{"name":"azure-openai","label":"Azure OpenAI","enabled":"true","temperature":0,"models":[{"name":"azure-openai","label":"Azure OpenAI","enabled":"true","memory":"enabled","context_window":4096,"free_tier":true}]},{"name":"chatgpt","label":"ChatGPT","enabled":"true","temperature":0,"models":[{"name":"gpt-4","label":"ChatGPT-4","enabled":"true","memory":"enabled","context_window":8192}]},{"name":"deepseek","label":"DeepSeek","enabled":"true","models":[{"name":"deepseek-chat","label":"DeepSeek Chat","enabled":"true","memory":"disabled","free_tier":true,"context_window":128000,"similarity_topk":10}]}]
 LIMIT_MODEL_CONCURRENCY=5
 MAX_POSITION_EMBEDDINGS=4096
 QUANTIZE_QLORA=True
@@ -57,7 +57,6 @@ EMBEDDING_SERVICE_URL=http://localhost:9997
 EMBEDDING_SERVICE_MODEL=bge-large-zh-v1.5
 EMBEDDING_SERVICE_TOKEN=
 EMBEDDING_SERVICE_MODEL_UID=
-OPENAI_API_KEY=
 
 
 CHAT_CONSUMER_IMPLEMENTATION=document-qa
@@ -81,3 +80,5 @@ DEFAULT_ENCODING_MODEL=cl100k_base
 DATABASE_URL="postgres://postgres:postgres@127.0.0.1:5432/postgres"
 
 #OPENAI_API_PROXY='{"https": "socks5h://127.0.0.1:1080"}'
+OPENAI_API_BASE=
+OPENAI_API_KEY=