apconw
diff --git a/‎Makefile‎
Lines changed: 3 additions & 3 deletions b/‎Makefile‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎README.md‎
Lines changed: 1 addition & 1 deletion b/‎README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎agent/langgraph_react_agent.py‎
Lines changed: 52 additions & 4 deletions b/‎agent/langgraph_react_agent.py‎
Lines changed: 52 additions & 4 deletions
diff --git a/‎agent/text2sql/analysis/data_render_antv.py‎
Lines changed: 1 addition & 0 deletions b/‎agent/text2sql/analysis/data_render_antv.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎agent/text2sql/analysis/graph.py‎
Lines changed: 3 additions & 3 deletions b/‎agent/text2sql/analysis/graph.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎agent/text2sql/analysis/llm_reasoning.py‎
Lines changed: 7 additions & 3 deletions b/‎agent/text2sql/analysis/llm_reasoning.py‎
Lines changed: 7 additions & 3 deletions
diff --git a/‎agent/text2sql/analysis/llm_summarizer.py‎
Lines changed: 12 additions & 14 deletions b/‎agent/text2sql/analysis/llm_summarizer.py‎
Lines changed: 12 additions & 14 deletions
diff --git a/‎agent/text2sql/database/db_service.py‎
Lines changed: 90 additions & 4 deletions b/‎agent/text2sql/database/db_service.py‎
Lines changed: 90 additions & 4 deletions
@@ -5,7 +5,7 @@ include web/Makefile
 SERVER_PROJECT_NAME = sanic-web
 
 # 服务端 Docker 镜像标签
-SERVER_DOCKER_IMAGE = apconw/$(SERVER_PROJECT_NAME):1.1.6
+SERVER_DOCKER_IMAGE = apconw/$(SERVER_PROJECT_NAME):1.1.7
 
 # 阿里云镜像仓库地址 (需要根据实际情况修改)
 ALIYUN_REGISTRY = crpi-7xkxsdc0iki61l0q.cn-hangzhou.personal.cr.aliyuncs.com
@@ -27,7 +27,7 @@ docker-build-server-multi:
 
 
 # 构建服务端arm64/amd64架构镜像并推送至阿里云镜像仓库
-docker-build-aliyun-multi:
-	docker buildx build --platform linux/amd64,linux/arm64 --push -t $(ALIYUN_IMAGE_NAME):1.1.6 -f ./docker/Dockerfile .
+docker-build-aliyun-server-multi:
+	docker buildx build --platform linux/amd64,linux/arm64 --push -t $(ALIYUN_IMAGE_NAME):1.1.7 -f ./docker/Dockerfile .
 
 .PHONY: web-build service-build
@@ -93,7 +93,7 @@
 
 | 技术支持方式                                          |     赞助     | 
 |:------------------------------------------------|:----------:|
-| 一对一技术支持 我将亲自远程帮您 **配置环境并部署** **讲解项目架构&大模型学习资料** | **300元/次** |
+| 一对一技术支持 我将亲自远程帮您 **配置环境并部署** **讲解项目架构&大模型学习资料** | **100元/次** |
 | 需求开发支持 **具体场景Dify画布开发** **下面开源Dify画布前后端适配开发**   | **500元起**  |   
 
 
 
@@ -4,6 +4,7 @@
 import os
 import traceback
 from typing import Optional
+from uuid import uuid4
 
 from langchain_core.messages import SystemMessage, HumanMessage
 from langchain_core.messages.utils import trim_messages
@@ -13,7 +14,7 @@
 from langgraph.prebuilt import create_react_agent
 
 from constants.code_enum import DataTypeEnum, DiFyAppEnum
-from services.user_service import add_user_record
+from services.user_service import add_user_record, decode_jwt_token
 
 logger = logging.getLogger(__name__)
 
@@ -83,6 +84,9 @@ def __init__(self):
         # 全局checkpointer用于持久化所有用户的对话状态
         self.checkpointer = InMemorySaver()
 
+        # 存储运行中的任务
+        self.running_tasks = {}
+
     @staticmethod
     def _create_response(
         content: str, message_type: str = "continue", data_type: str = DataTypeEnum.ANSWER.value[0]
@@ -126,6 +130,13 @@ async def run_agent(
         :param user_token:
         :return:
         """
+
+        # 获取用户信息 标识对话状态
+        user_dict = await decode_jwt_token(user_token)
+        task_id = user_dict["id"]
+        task_context = {"cancelled": False}
+        self.running_tasks[task_id] = task_context
+
         try:
             t02_answer_data = []
 
@@ -150,6 +161,15 @@ async def run_agent(
                 config=config,
                 stream_mode="messages",
             ):
+                # 检查是否已取消
+                if self.running_tasks[task_id]["cancelled"]:
+                    await response.write(
+                        self._create_response("\n> 这条消息已停止", "info", DataTypeEnum.ANSWER.value[0])
+                    )
+                    # 发送最终停止确认消息
+                    await response.write(self._create_response("", "end", DataTypeEnum.STREAM_END.value[0]))
+                    break
+
                 # print(message_chunk)
                 # 工具输出
                 if metadata["langgraph_node"] == "tools":
@@ -172,12 +192,40 @@ async def run_agent(
                         await response.flush()
                     await asyncio.sleep(0)
 
-            await add_user_record(
-                uuid_str, session_id, query, t02_answer_data, {}, DiFyAppEnum.COMMON_QA.value[0], user_token
-            )
+            # 只有在未取消的情况下才保存记录
+            if not self.running_tasks[task_id]["cancelled"]:
+                await add_user_record(
+                    uuid_str, session_id, query, t02_answer_data, {}, DiFyAppEnum.COMMON_QA.value[0], user_token
+                )
+
+        except asyncio.CancelledError:
+            await response.write(self._create_response("\n> 这条消息已停止", "info", DataTypeEnum.ANSWER.value[0]))
+            await response.write(self._create_response("", "end", DataTypeEnum.STREAM_END.value[0]))
         except Exception as e:
             print(f"[ERROR] Agent运行异常: {e}")
             traceback.print_exception(e)
             await response.write(
                 self._create_response("[ERROR] 智能体运行异常:", "error", DataTypeEnum.ANSWER.value[0])
             )
+        finally:
+            # 清理任务记录
+            if task_id in self.running_tasks:
+                del self.running_tasks[task_id]
+
+    async def cancel_task(self, task_id: str) -> bool:
+        """
+        取消指定的任务
+        :param task_id: 任务ID
+        :return: 是否成功取消
+        """
+        if task_id in self.running_tasks:
+            self.running_tasks[task_id]["cancelled"] = True
+            return True
+        return False
+
+    def get_running_tasks(self):
+        """
+        获取当前运行中的任务列表
+        :return: 运行中的任务列表
+        """
+        return list(self.running_tasks.keys())
@@ -68,6 +68,7 @@ async def data_render_ant(state: AgentState):
             - 不要解释图表内容或生成文字说明。
             - 必须返回符合格式的图表链接。
             - 图表需清晰表达数据关系，符合可视化最佳实践。
+            - x轴和y轴的标签必须使用中文显示。
             
             ### 返回格式
              ![图表](https://example.com/chart.png)
 
@@ -33,16 +33,16 @@ def create_graph():
     graph = StateGraph(AgentState)
 
     graph.add_node("schema_inspector", DatabaseService.get_table_schema)
-    graph.add_node("llm_reasoning", create_reasoning_steps)
+    # graph.add_node("llm_reasoning", create_reasoning_steps)
     graph.add_node("sql_generator", sql_generate)
     graph.add_node("sql_executor", DatabaseService.execute_sql)
     graph.add_node("data_render", data_render_ant)
     graph.add_node("data_render_apache", data_render_apache)
     graph.add_node("summarize", summarize)
 
     graph.set_entry_point("schema_inspector")
-    graph.add_edge("schema_inspector", "llm_reasoning")
-    graph.add_edge("llm_reasoning", "sql_generator")
+    # graph.add_edge("schema_inspector", "llm_reasoning")
+    graph.add_edge("schema_inspector", "sql_generator")
     graph.add_edge("sql_generator", "sql_executor")
     graph.add_edge("sql_executor", "summarize")
 
 
@@ -1,4 +1,5 @@
 import logging
+from datetime import datetime
 
 from langchain.prompts import ChatPromptTemplate
 
@@ -20,7 +21,7 @@ def create_reasoning_steps(state):
     prompt = ChatPromptTemplate.from_template(
         """
         You are a helpful data analyst who is great at thinking deeply and reasoning about the user's question and the database schema, and you provide a step-by-step reasoning plan in order to answer the user's question.
-                                              
+
         1. Think deeply and reason about the user's question and the database schema.
         2. Give a step by step reasoning plan in order to answer user's question.
         3. The reasoning plan should be in the language same as the language user provided in the input.
@@ -34,8 +35,10 @@ def create_reasoning_steps(state):
 
         Database Schema:
         {db_schema}
-          
+
         User's Question: {user_query}
+        
+        Current Time: {current_time}
 
         Let's think step by step.
         """
@@ -48,10 +51,11 @@ def create_reasoning_steps(state):
             {
                 "db_schema": state["db_info"],
                 "user_query": state["user_query"],
+                "current_time": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
             }
         )
 
-        # logger.info(f"Raw LLM response: {response.content}")
+        logger.info(f"Raw LLM response: {response.content}")
 
         state["sql_reasoning"] = response.content
 
 
@@ -33,28 +33,26 @@ def summarize(state: AgentState):
                 Current Time: {current_time}
                 
             ## 核心能力
-            - 趋势识别：捕捉数据变动方向与强度  
-            - 模式归纳：提炼周期性或阶段性规律  
-            - 异常检测：识别显著偏离正常范围的点  
-            - 关键指标提取：聚焦驱动变化的核心维度  
+            - 趋势识别：判断变动方向与持续性（若有时间序列）
+            - 结构洞察：在截面数据中识别关键分布特征与异常模式
+            - 模式归纳：提炼可解释的品类/维度差异与行为信号
+            - 异常检测：发现偏离常规的数值或比例关系
+            - 驱动分析：定位主导整体表现的核心因素
             
-            ## 分析流程
-            1. 解析数据结构，确认时间轴与观测指标  
-            2. 检测整体趋势方向（上升、下降、平稳）  
-            3. 计算相邻周期变化率（环比/同比）  
-            4. 识别突变点、拐点或异常波动  
-            5. 提炼可复用的模式或信号  
+            ## 分析策略（动态适配）
+            - 若含时间维度：执行趋势分析（环比/拐点/周期性）
+            - 若为单期数据：转向结构分析，聚焦分布不均、高值集中、量价背离等信号
+            - 统一提取关键指标：如客单价、订单密度、销售额集中度等
+            - 结合业务常识推断潜在动因或风险
             
             ## 输出规范
             - **格式**：Markdown 文本，禁用代码块  
             - **结构**：  
-              ## 趋势概述  
+            ## 数据分析 
               一句话概括整体走势  
               **关键发现**  
               - 列出2-3项核心结论（**加粗**重点）  
-              **注意**  
-              - 指出异常、波动或数据局限  
-            - **要求**：≤300字，仅简体中文，结论有数据支撑，数据不足则返回“无法判断”
+              - **要求**：≤300字，仅使用简体中文，语言简洁、数据驱动、逻辑闭环
         """
     )
 
 
@@ -1,10 +1,12 @@
 import logging
+import re
 import traceback
-
+from typing import List
+import jieba
 import pandas as pd
 from sqlalchemy.inspection import inspect
 from sqlalchemy.sql.expression import text
-
+from rank_bm25 import BM25Okapi
 from agent.text2sql.state.agent_state import AgentState, ExecutionResult
 from model.db_connection_pool import get_db_pool
 
@@ -19,7 +21,37 @@ class DatabaseService:
 
     def __init__(self):
         pass
-        # self.engine = db_pool.get_engine()
+
+    @staticmethod
+    def _build_document(table_name: str, table_info: dict) -> str:
+        """
+        将表结构拼接成一段文本，用于匹配
+        """
+        parts = []
+
+        # 添加表名和注释
+        table_comment = table_info.get("table_comment", "")
+        parts.append(f"{table_name} {table_comment}")
+
+        # 添加列信息
+        for col_name, col_info in table_info.get("columns", {}).items():
+            col_comment = col_info.get("comment", "")
+            col_cn_name = col_info.get("cn_name", "")
+            parts.append(f"{col_name} {col_cn_name} {col_comment}")
+
+        return " ".join(parts)
+
+    @staticmethod
+    def _tokenize_text(text: str) -> List[str]:
+        """
+         :param text
+        对文本进行分词
+        """
+        # 过滤掉标点符号和特殊字符，只保留中文、英文和数字
+        filtered_text = re.sub(r"[^\u4e00-\u9fa5a-zA-Z0-9]", " ", text)
+        tokens = list(jieba.cut(filtered_text))
+        # 过滤空字符串
+        return [token.strip() for token in tokens if token.strip()]
 
     @staticmethod
     def get_table_schema(state: AgentState):
@@ -28,6 +60,7 @@ def get_table_schema(state: AgentState):
         :param state:
         :return:
         获取数据中所有表schema信息
+        使用BM25算法过滤出相关表信息
         :return: 表schema信息
         """
         try:
@@ -46,7 +79,60 @@ def get_table_schema(state: AgentState):
                 ]
 
                 table_info[table_name] = {"columns": columns, "foreign_keys": foreign_keys}
-            state["db_info"] = table_info
+
+            # 如果有用户查询，则根据查询过滤表信息
+            user_query = state.get("user_query", "")
+            if user_query and table_info:
+                # 构建表文档
+                corpus = []
+                table_names = []
+                table_comments = []
+                for table_name, info in table_info.items():
+                    doc = DatabaseService._build_document(table_name, info)
+                    corpus.append(doc)
+                    table_names.append(table_name)
+                    table_comments.append(info.get("table_comment", ""))
+
+                # 对文档进行分词
+                tokenized_corpus = [DatabaseService._tokenize_text(doc) for doc in corpus]
+
+                # 使用BM25算法训练模型
+                bm25 = BM25Okapi(tokenized_corpus)
+
+                # 对查询进行分词
+                query_tokens = DatabaseService._tokenize_text(user_query)
+
+                # 计算文档得分
+                doc_scores = bm25.get_scores(query_tokens)
+
+                # 优化算法：提高表注释匹配的优先级
+                # 如果查询内容直接匹配表注释，则给予更高的权重
+                for i, (table_comment, score) in enumerate(zip(table_comments, doc_scores)):
+                    if score > 0 and table_comment:
+                        # 检查查询是否直接包含表注释中的关键词
+                        comment_tokens = DatabaseService._tokenize_text(table_comment)
+                        query_text = "".join(query_tokens)
+                        comment_text = "".join(comment_tokens)
+
+                        # 如果查询中包含表注释的关键内容，增加权重
+                        if comment_text and (comment_text in query_text or query_text in comment_text):
+                            doc_scores[i] *= 2  # 给予两倍权重
+
+                # 按得分排序，取前3个最相关的表
+                top_indices = sorted(range(len(doc_scores)), key=lambda i: doc_scores[i], reverse=True)[:3]
+
+                # 只保留最相关的表
+                filtered_table_info = {
+                    table_names[idx]: table_info[table_names[idx]]
+                    for idx in top_indices
+                    if doc_scores[idx] > 0  # 只保留得分大于0的表
+                }
+
+                state["db_info"] = filtered_table_info
+            else:
+                state["db_info"] = table_info
+
+            logger.info(f"获取数据库表信息成功: {state.get('db_info')}")
         except Exception as e:
             logger.error(f"获取数据库表信息失败: {e}")
             state["db_info"] = {}