1Panel-dev
diff --git a/‎apps/application/api/application_api.py‎
Lines changed: 43 additions & 1 deletion b/‎apps/application/api/application_api.py‎
Lines changed: 43 additions & 1 deletion
diff --git a/‎apps/application/chat_pipeline/step/search_dataset_step/impl/base_search_dataset_step.py‎
Lines changed: 1 addition & 1 deletion b/‎apps/application/chat_pipeline/step/search_dataset_step/impl/base_search_dataset_step.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎apps/application/serializers/application.py‎
Lines changed: 87 additions & 13 deletions b/‎apps/application/serializers/application.py‎
Lines changed: 87 additions & 13 deletions
diff --git a/‎apps/application/urls.py‎
Lines changed: 4 additions & 0 deletions b/‎apps/application/urls.py‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎apps/application/views/application.py‎
Lines changed: 103 additions & 3 deletions b/‎apps/application/views/application.py‎
Lines changed: 103 additions & 3 deletions
@@ -12,7 +12,7 @@
 from rest_framework import serializers
 
 from application.serializers.application import ApplicationCreateSerializer, ApplicationListResponse, \
-    ApplicationImportRequest, ApplicationEditSerializer
+    ApplicationImportRequest, ApplicationEditSerializer, TextToSpeechRequest, SpeechToTextRequest, PlayDemoTextRequest
 from common.mixins.api_mixin import APIMixin
 from common.result import ResultSerializer, ResultPageSerializer, DefaultResultSerializer
 
@@ -167,3 +167,45 @@ class ApplicationEditAPI(APIMixin):
     @staticmethod
     def get_request():
         return ApplicationEditSerializer
+
+
+class TextToSpeechAPI(APIMixin):
+    @staticmethod
+    def get_parameters():
+        return ApplicationOperateAPI.get_parameters()
+
+    @staticmethod
+    def get_request():
+        return TextToSpeechRequest
+
+    @staticmethod
+    def get_response():
+        return DefaultResultSerializer
+
+
+class SpeechToTextAPI(APIMixin):
+    @staticmethod
+    def get_parameters():
+        return ApplicationOperateAPI.get_parameters()
+
+    @staticmethod
+    def get_request():
+        return SpeechToTextRequest
+
+    @staticmethod
+    def get_response():
+        return DefaultResultSerializer
+
+
+class PlayDemoTextAPI(APIMixin):
+    @staticmethod
+    def get_parameters():
+        return ApplicationOperateAPI.get_parameters()
+
+    @staticmethod
+    def get_request():
+        return PlayDemoTextRequest
+
+    @staticmethod
+    def get_response():
+        return DefaultResultSerializer
@@ -103,7 +103,7 @@ def list_paragraph(embedding_list: List, vector):
         paragraph_list = native_search(QuerySet(Paragraph).filter(id__in=paragraph_id_list),
                                        get_file_content(
                                            os.path.join(PROJECT_DIR, "apps", "application", 'sql',
-                                                        'list_dataset_paragraph_by_paragraph_id.sql')),
+                                                        'list_knowledge_paragraph_by_paragraph_id.sql')),
                                        with_table_name=True)
         # 如果向量库中存在脏数据 直接删除
         if len(paragraph_list) != len(paragraph_id_list):
 
@@ -6,8 +6,10 @@
     @date：2025/5/26 17:03
     @desc:
 """
+import asyncio
 import datetime
 import hashlib
+import json
 import os
 import pickle
 import re
@@ -19,6 +21,7 @@
 from django.db.models import QuerySet, Q
 from django.http import HttpResponse
 from django.utils.translation import gettext_lazy as _
+from langchain_mcp_adapters.client import MultiServerMCPClient
 from rest_framework import serializers, status
 from rest_framework.utils.formatting import lazy_format
 
@@ -36,6 +39,7 @@
 from knowledge.serializers.knowledge import KnowledgeSerializer, KnowledgeModelSerializer
 from maxkb.conf import PROJECT_DIR
 from models_provider.models import Model
+from models_provider.tools import get_model_instance_by_model_workspace_id
 from system_manage.models import WorkspaceUserResourcePermission
 from tools.models import Tool, ToolScope
 from tools.serializers.tool import ToolModelSerializer
@@ -384,9 +388,9 @@ class ApplicationEditSerializer(serializers.Serializer):
                                                label=_("Historical chat records"))
     prologue = serializers.CharField(required=False, allow_null=True, allow_blank=True, max_length=102400,
                                      label=_("Opening remarks"))
-    dataset_id_list = serializers.ListSerializer(required=False, child=serializers.UUIDField(required=True),
-                                                 label=_("Related Knowledge Base")
-                                                 )
+    knowledge_id_list = serializers.ListSerializer(required=False, child=serializers.UUIDField(required=True),
+                                                   label=_("Related Knowledge Base")
+                                                   )
     # 数据集相关设置
     knowledge_setting = KnowledgeSettingSerializer(required=False, allow_null=True,
                                                    label=_("Dataset settings"))
@@ -441,8 +445,8 @@ def insert_workflow(self, instance: Dict):
         return ApplicationCreateSerializer.ApplicationResponse(application_model).data
 
     @staticmethod
-    def to_application_knowledge_mapping(application_id: str, dataset_id: str):
-        return ApplicationKnowledgeMapping(id=uuid.uuid7(), application_id=application_id, dataset_id=dataset_id)
+    def to_application_knowledge_mapping(application_id: str, knowledge_id: str):
+        return ApplicationKnowledgeMapping(id=uuid.uuid7(), application_id=application_id, knowledge_id=knowledge_id)
 
     def insert_simple(self, instance: Dict):
         self.is_valid(raise_exception=True)
@@ -451,10 +455,10 @@ def insert_simple(self, instance: Dict):
         ApplicationCreateSerializer.SimplateRequest(data=instance).is_valid(user_id=user_id, raise_exception=True)
         application_model = ApplicationCreateSerializer.SimplateRequest.to_application_model(user_id, workspace_id,
                                                                                              instance)
-        dataset_id_list = instance.get('knowledge_id_list', [])
+        knowledge_id_list = instance.get('knowledge_id_list', [])
         application_knowledge_mapping_model_list = [
-            self.to_application_knowledge_mapping(application_model.id, dataset_id) for
-            dataset_id in dataset_id_list]
+            self.to_application_knowledge_mapping(application_model.id, knowledge_id) for
+            knowledge_id in knowledge_id_list]
         # 插入应用
         application_model.save()
         # 插入认证信息
@@ -519,15 +523,15 @@ def to_tool(tool, workspace_id, user_id):
     def to_application(application, workspace_id, user_id):
         work_flow = application.get('work_flow')
         for node in work_flow.get('nodes', []):
-            if node.get('type') == 'search-dataset-node':
-                node.get('properties', {}).get('node_data', {})['dataset_id_list'] = []
+            if node.get('type') == 'search-knowledge-node':
+                node.get('properties', {}).get('node_data', {})['knowledge_id_list'] = []
         return Application(id=uuid.uuid7(),
                            user_id=user_id,
                            name=application.get('name'),
                            workspace_id=workspace_id,
                            desc=application.get('desc'),
                            prologue=application.get('prologue'), dialogue_number=application.get('dialogue_number'),
-                           dataset_setting=application.get('dataset_setting'),
+                           knowledge_setting=application.get('knowledge_setting'),
                            model_setting=application.get('model_setting'),
                            model_params_setting=application.get('model_params_setting'),
                            tts_model_params_setting=application.get('tts_model_params_setting'),
@@ -545,6 +549,27 @@ def to_application(application, workspace_id, user_id):
                            )
 
 
+class TextToSpeechRequest(serializers.Serializer):
+    text = serializers.CharField(required=True, label=_('Text'))
+
+
+class SpeechToTextRequest(serializers.Serializer):
+    file = UploadedFileField(required=True, label=_("file"))
+
+
+class PlayDemoTextRequest(serializers.Serializer):
+    tts_model_id = serializers.UUIDField(required=True, label=_('Text to speech model ID'))
+
+
+async def get_mcp_tools(servers):
+    async with MultiServerMCPClient(servers) as client:
+        return client.get_tools()
+
+
+class McpServersSerializer(serializers.Serializer):
+    mcp_servers = serializers.JSONField(required=True)
+
+
 class ApplicationOperateSerializer(serializers.Serializer):
     application_id = serializers.UUIDField(required=True, label=_("Application ID"))
     user_id = serializers.UUIDField(required=True, label=_("User ID"))
@@ -559,6 +584,23 @@ def is_valid(self, *, raise_exception=False):
         if not query_set.exists():
             raise AppApiException(500, _('Application id does not exist'))
 
+    def get_mcp_servers(self, instance, with_valid=True):
+        if with_valid:
+            self.is_valid(raise_exception=True)
+            McpServersSerializer(data=instance).is_valid(raise_exception=True)
+        servers = json.loads(instance.get('mcp_servers'))
+        tools = []
+        for server in servers:
+            tools += [
+                {
+                    'server': server,
+                    'name': tool.name,
+                    'description': tool.description,
+                    'args_schema': tool.args_schema,
+                }
+                for tool in asyncio.run(get_mcp_tools({server: servers[server]}))]
+        return tools
+
     def delete(self, with_valid=True):
         if with_valid:
             self.is_valid()
@@ -691,7 +733,7 @@ def edit(self, instance: Dict, with_valid=True):
         if application.type == ApplicationTypeChoices.SIMPLE.value:
             application.is_publish = True
         update_keys = ['name', 'desc', 'model_id', 'multiple_rounds_dialogue', 'prologue', 'status',
-                       'dataset_setting', 'model_setting', 'problem_optimization', 'dialogue_number',
+                       'knowledge_setting', 'model_setting', 'problem_optimization', 'dialogue_number',
                        'stt_model_id', 'tts_model_id', 'tts_model_enable', 'stt_model_enable', 'tts_type',
                        'tts_autoplay', 'stt_autosend', 'file_upload_enable', 'file_upload_setting',
                        'api_key_is_active', 'icon', 'work_flow', 'model_params_setting', 'tts_model_params_setting',
@@ -746,7 +788,7 @@ def update_knowledge_node(self, workflow, available_knowledge_dict):
         """
         修改知识库检索节点 数据
         定义 all_knowledge_id_list:    所有的关联知识库
-            dataset_id_list:          当前用户可看到的关联知识库列表
+            knowledge_id_list:          当前用户可看到的关联知识库列表
             knowledge_list:           用户
         @param workflow:              知识库
         @param available_knowledge_dict:   当前用户可用的知识库
@@ -802,3 +844,35 @@ def save_application_knowledge_mapping(application_knowledge_id_list, knowledge_
         QuerySet(ApplicationKnowledgeMapping).bulk_create(
             [ApplicationKnowledgeMapping(application_id=application_id, knowledge_id=knowledge_id) for knowledge_id in
              knowledge_id_list]) if len(knowledge_id_list) > 0 else None
+
+    def speech_to_text(self, instance, with_valid=True):
+        if with_valid:
+            self.is_valid(raise_exception=True)
+            SpeechToTextRequest(data=instance).is_valid(raise_exception=True)
+        application_id = self.data.get('application_id')
+        application = QuerySet(Application).filter(id=application_id).first()
+        if application.stt_model_enable:
+            model = get_model_instance_by_model_workspace_id(application.stt_model_id, application.workspace_id)
+            text = model.speech_to_text(instance.get('file'))
+            return text
+
+    def text_to_speech(self, instance, with_valid=True):
+        if with_valid:
+            self.is_valid(raise_exception=True)
+            TextToSpeechRequest(data=instance).is_valid(raise_exception=True)
+        application_id = self.data.get('application_id')
+        application = QuerySet(Application).filter(id=application_id).first()
+        if application.tts_model_enable:
+            model = get_model_instance_by_model_workspace_id(application.tts_model_id, application.workspace_id,
+                                                             **application.tts_model_params_setting)
+
+            return model.text_to_speech(instance.get('text'))
+
+    def play_demo_text(self, instance, with_valid=True):
+        text = '你好，这里是语音播放测试'
+        if with_valid:
+            self.is_valid(raise_exception=True)
+            PlayDemoTextRequest(data=instance).is_valid(raise_exception=True)
+        tts_model_id = instance.pop('tts_model_id')
+        model = get_model_instance_by_model_workspace_id(tts_model_id, self.data.get('workspace_id'), **instance)
+        return model.text_to_speech(text)
@@ -30,6 +30,10 @@
     path('workspace/<str:workspace_id>/application/<str:application_id>/work_flow_version/<int:current_page>/<int:page_size>', views.ApplicationVersionView.Page.as_view()),
     path('workspace/<str:workspace_id>/application/<str:application_id>/work_flow_version/<str:work_flow_version_id>', views.ApplicationVersionView.Operate.as_view()),
     path('workspace/<str:workspace_id>/application/<str:application_id>/open', views.OpenView.as_view()),
+    path('workspace/<str:workspace_id>/application/<str:application_id>/text_to_speech', views.TextToSpeech.as_view()),
+    path('workspace/<str:workspace_id>/application/<str:application_id>/speech_to_text', views.SpeechToText.as_view()),
+    path('workspace/<str:workspace_id>/application/<str:application_id>/play_demo_text', views.PlayDemoText.as_view()),
+    path('workspace/<str:workspace_id>/application/<str:application_id>/mcp_tools', views.McpServers.as_view()),
     path('chat_message/<str:chat_id>', views.ChatView.as_view()),
 
 ]
@@ -7,20 +7,22 @@
     @desc:
 """
 from django.db.models import QuerySet
+from django.http import HttpResponse
 from django.utils.translation import gettext_lazy as _
 from drf_spectacular.utils import extend_schema
 from rest_framework.parsers import MultiPartParser
 from rest_framework.request import Request
 from rest_framework.views import APIView
 
 from application.api.application_api import ApplicationCreateAPI, ApplicationQueryAPI, ApplicationImportAPI, \
-    ApplicationExportAPI, ApplicationOperateAPI, ApplicationEditAPI
+    ApplicationExportAPI, ApplicationOperateAPI, ApplicationEditAPI, TextToSpeechAPI, SpeechToTextAPI, PlayDemoTextAPI
 from application.models import Application
-from application.serializers.application import ApplicationSerializer, Query, ApplicationOperateSerializer
+from application.serializers.application import ApplicationSerializer, Query, ApplicationOperateSerializer, \
+    McpServersSerializer
 from common import result
 from common.auth import TokenAuth
 from common.auth.authentication import has_permissions
-from common.constants.permission_constants import PermissionConstants, RoleConstants
+from common.constants.permission_constants import PermissionConstants, RoleConstants, CompareConstants
 from common.log.log import log
 
 
@@ -233,3 +235,101 @@ def put(self, request: Request, workspace_id: str, application_id: str):
                 ApplicationOperateSerializer(
                     data={'application_id': application_id, 'user_id': request.user.id,
                           'workspace_id': workspace_id, }).publish(request.data))
+
+
+class McpServers(APIView):
+    authentication_classes = [TokenAuth]
+
+    @extend_schema(
+        methods=['GET'],
+        description=_("speech to text"),
+        summary=_("speech to text"),
+        operation_id=_("speech to text"),  # type: ignore
+        parameters=SpeechToTextAPI.get_parameters(),
+        request=SpeechToTextAPI.get_request(),
+        responses=SpeechToTextAPI.get_response(),
+        tags=[_('Application')]  # type: ignore
+    )
+    @has_permissions(PermissionConstants.APPLICATION_READ.get_workspace_application_permission(),
+                     PermissionConstants.APPLICATION_READ.get_workspace_permission_workspace_manage_role(),
+                     RoleConstants.USER.get_workspace_role(),
+                     RoleConstants.WORKSPACE_MANAGE.get_workspace_role())
+    def get(self, request: Request, workspace_id, application_id: str):
+        return result.success(ApplicationOperateSerializer(
+            data={'mcp_servers': request.query_params.get('mcp_servers')}).get_mcp_servers())
+
+
+class SpeechToText(APIView):
+    authentication_classes = [TokenAuth]
+
+    @extend_schema(
+        methods=['POST'],
+        description=_("speech to text"),
+        summary=_("speech to text"),
+        operation_id=_("speech to text"),  # type: ignore
+        parameters=SpeechToTextAPI.get_parameters(),
+        request=SpeechToTextAPI.get_request(),
+        responses=SpeechToTextAPI.get_response(),
+        tags=[_('Application')]  # type: ignore
+    )
+    @has_permissions(PermissionConstants.APPLICATION_EDIT.get_workspace_application_permission(),
+                     PermissionConstants.APPLICATION_EDIT.get_workspace_permission_workspace_manage_role(),
+                     RoleConstants.USER.get_workspace_role(),
+                     RoleConstants.WORKSPACE_MANAGE.get_workspace_role())
+    def post(self, request: Request, workspace_id: str, application_id: str):
+        return result.success(
+            ApplicationOperateSerializer(
+                data={'application_id': application_id, 'workspace_id': workspace_id, 'user_id': request.user.id})
+            .speech_to_text({'file': request.FILES.get('file')}))
+
+
+class TextToSpeech(APIView):
+    authentication_classes = [TokenAuth]
+
+    @extend_schema(
+        methods=['POST'],
+        description=_("text to speech"),
+        summary=_("text to speech"),
+        operation_id=_("text to speech"),  # type: ignore
+        parameters=TextToSpeechAPI.get_parameters(),
+        request=TextToSpeechAPI.get_request(),
+        responses=TextToSpeechAPI.get_response(),
+        tags=[_('Application')]  # type: ignore
+    )
+    @has_permissions(PermissionConstants.APPLICATION_EDIT.get_workspace_application_permission(),
+                     PermissionConstants.APPLICATION_EDIT.get_workspace_permission_workspace_manage_role(),
+                     RoleConstants.USER.get_workspace_role(),
+                     RoleConstants.WORKSPACE_MANAGE.get_workspace_role())
+    def post(self, request: Request, workspace_id: str, application_id: str):
+        byte_data = ApplicationOperateSerializer(
+            data={'application_id': application_id, 'workspace_id': workspace_id,
+                  'user_id': request.user.id}).text_to_speech(request.data)
+        return HttpResponse(byte_data, status=200, headers={'Content-Type': 'audio/mp3',
+                                                            'Content-Disposition': 'attachment; filename="abc.mp3"'})
+
+
+class PlayDemoText(APIView):
+    authentication_classes = [TokenAuth]
+
+    @extend_schema(
+        methods=['POST'],
+        description=_("PlayDemo"),
+        summary=_("PlayDemo"),
+        operation_id=_("PlayDemo"),  # type: ignore
+        parameters=PlayDemoTextAPI.get_parameters(),
+        request=PlayDemoTextAPI.get_request(),
+        responses=PlayDemoTextAPI.get_response(),
+        tags=[_('Application')]  # type: ignore
+    )
+    @has_permissions(PermissionConstants.APPLICATION_EDIT.get_workspace_application_permission(),
+                     PermissionConstants.APPLICATION_EDIT.get_workspace_permission_workspace_manage_role(),
+                     RoleConstants.USER.get_workspace_role(),
+                     RoleConstants.WORKSPACE_MANAGE.get_workspace_role())
+    @log(menu='Application', operate="trial listening",
+         get_operation_object=lambda r, k: get_application_operation_object(k.get('application_id')))
+    def post(self, request: Request, workspace_id: str, application_id: str):
+        byte_data = ApplicationOperateSerializer(
+            data={'application_id': application_id, 'workspace_id': workspace_id,
+                  'user_id': request.user.id}).play_demo_text(request.data)
+        return HttpResponse(byte_data, status=200, headers={'Content-Type': 'audio/mp3',
+                                                            'Content-Disposition': 'attachment; filename="abc.mp3"'})