update

cyyeh · cyyeh · commit bf3eb42607ba · 2025-09-01T14:51:11.000+08:00
diff --git a/deployment/kustomizations/base/cm.yaml b/deployment/kustomizations/base/cm.yaml
@@ -174,6 +174,8 @@ data:
         llm: litellm_llm.default
       - name: data_exploration_assistance
         llm: litellm_llm.default
+      - name: user_clarification_assistance
+        llm: litellm_llm.default
       - name: sql_pairs_indexing
         document_store: qdrant
         embedder: litellm_embedder.default
diff --git a/docker/config.example.yaml b/docker/config.example.yaml
@@ -124,6 +124,8 @@ pipes:
     llm: litellm_llm.default
   - name: data_exploration_assistance
     llm: litellm_llm.default
+  - name: user_clarification_assistance
+    llm: litellm_llm.default
   - name: sql_pairs_indexing
     document_store: qdrant
     embedder: litellm_embedder.default
diff --git a/wren-ai-service/src/pipelines/generation/__init__.py b/wren-ai-service/src/pipelines/generation/__init__.py
@@ -16,6 +16,7 @@
 from .sql_question import SQLQuestion
 from .sql_regeneration import SQLRegeneration
 from .sql_tables_extraction import SQLTablesExtraction
+from .user_clarification_assistance import UserClarificationAssistance
 from .user_guide_assistance import UserGuideAssistance
 
 __all__ = [
@@ -38,4 +39,5 @@
     "MisleadingAssistance",
     "SQLTablesExtraction",
     "DataExplorationAssistance",
+    "UserClarificationAssistance",
 ]
diff --git a/wren-ai-service/src/pipelines/generation/user_clarification_assistance.py b/wren-ai-service/src/pipelines/generation/user_clarification_assistance.py
@@ -0,0 +1,144 @@
+import asyncio
+import logging
+import sys
+from typing import Any, Optional
+
+from hamilton import base
+from hamilton.async_driver import AsyncDriver
+from haystack.components.builders.prompt_builder import PromptBuilder
+from langfuse.decorators import observe
+
+from src.core.pipeline import BasicPipeline
+from src.core.provider import LLMProvider
+from src.pipelines.common import clean_up_new_lines
+from src.utils import trace_cost
+from src.web.v1.services.ask import AskHistory
+
+logger = logging.getLogger("wren-ai-service")
+
+
+user_clarification_assistance_system_prompt = """
+"""
+
+user_clarification_assistance_user_prompt_template = """
+"""
+
+
+## Start of Pipeline
+@observe(capture_input=False)
+def prompt(
+    query: str,
+    db_schemas: list[str],
+    language: str,
+    histories: list[AskHistory],
+    prompt_builder: PromptBuilder,
+    custom_instruction: str,
+) -> dict:
+    previous_query_summaries = (
+        [history.question for history in histories] if histories else []
+    )
+    query = "\n".join(previous_query_summaries) + "\n" + query
+
+    _prompt = prompt_builder.run(
+        query=query,
+        db_schemas=db_schemas,
+        language=language,
+        custom_instruction=custom_instruction,
+    )
+    return {"prompt": clean_up_new_lines(_prompt.get("prompt"))}
+
+
+@observe(as_type="generation", capture_input=False)
+@trace_cost
+async def user_clarification_assistance(
+    prompt: dict, generator: Any, query_id: str, generator_name: str
+) -> dict:
+    return await generator(
+        prompt=prompt.get("prompt"),
+        query_id=query_id,
+    ), generator_name
+
+
+## End of Pipeline
+
+
+class UserClarificationAssistance(BasicPipeline):
+    def __init__(
+        self,
+        llm_provider: LLMProvider,
+        **kwargs,
+    ):
+        self._user_queues = {}
+        self._components = {
+            "generator": llm_provider.get_generator(
+                system_prompt=user_clarification_assistance_system_prompt,
+                streaming_callback=self._streaming_callback,
+            ),
+            "generator_name": llm_provider.get_model(),
+            "prompt_builder": PromptBuilder(
+                template=user_clarification_assistance_user_prompt_template
+            ),
+        }
+
+        super().__init__(
+            AsyncDriver({}, sys.modules[__name__], result_builder=base.DictResult())
+        )
+
+    def _streaming_callback(self, chunk, query_id):
+        if query_id not in self._user_queues:
+            self._user_queues[
+                query_id
+            ] = asyncio.Queue()  # Create a new queue for the user if it doesn't exist
+        # Put the chunk content into the user's queue
+        asyncio.create_task(self._user_queues[query_id].put(chunk.content))
+        if chunk.meta.get("finish_reason"):
+            asyncio.create_task(self._user_queues[query_id].put("<DONE>"))
+
+    async def get_streaming_results(self, query_id):
+        async def _get_streaming_results(query_id):
+            return await self._user_queues[query_id].get()
+
+        if query_id not in self._user_queues:
+            self._user_queues[
+                query_id
+            ] = asyncio.Queue()  # Ensure the user's queue exists
+        while True:
+            try:
+                # Wait for an item from the user's queue
+                self._streaming_results = await asyncio.wait_for(
+                    _get_streaming_results(query_id), timeout=120
+                )
+                if (
+                    self._streaming_results == "<DONE>"
+                ):  # Check for end-of-stream signal
+                    del self._user_queues[query_id]
+                    break
+                if self._streaming_results:  # Check if there are results to yield
+                    yield self._streaming_results
+                    self._streaming_results = ""  # Clear after yielding
+            except TimeoutError:
+                break
+
+    @observe(name="User Clarification Assistance")
+    async def run(
+        self,
+        query: str,
+        db_schemas: list[str],
+        language: str,
+        query_id: Optional[str] = None,
+        histories: Optional[list[AskHistory]] = None,
+        custom_instruction: Optional[str] = None,
+    ):
+        logger.info("User Clarification Assistance pipeline is running...")
+        return await self._pipe.execute(
+            ["user_clarification_assistance"],
+            inputs={
+                "query": query,
+                "db_schemas": db_schemas,
+                "language": language,
+                "query_id": query_id or "",
+                "histories": histories or [],
+                "custom_instruction": custom_instruction or "",
+                **self._components,
+            },
+        )
diff --git a/wren-ai-service/src/web/v1/services/ask.py b/wren-ai-service/src/web/v1/services/ask.py
@@ -291,9 +291,7 @@ async def ask(
                                 self._pipelines["misleading_assistance"].run(
                                     query=user_query,
                                     histories=histories,
-                                    db_schemas=intent_classification_result.get(
-                                        "db_schemas"
-                                    ),
+                                    db_schemas=table_ddls,
                                     language=ask_request.configurations.language,
                                     query_id=ask_request.query_id,
                                     custom_instruction=ask_request.custom_instruction,
@@ -316,9 +314,7 @@ async def ask(
                                 self._pipelines["data_assistance"].run(
                                     query=user_query,
                                     histories=histories,
-                                    db_schemas=intent_classification_result.get(
-                                        "db_schemas"
-                                    ),
+                                    db_schemas=table_ddls,
                                     language=ask_request.configurations.language,
                                     query_id=ask_request.query_id,
                                     custom_instruction=ask_request.custom_instruction,
@@ -364,6 +360,7 @@ async def ask(
                                     sql_data=last_sql_data,
                                     language=ask_request.configurations.language,
                                     query_id=ask_request.query_id,
+                                    custom_instruction=ask_request.custom_instruction,
                                 )
                             )
 
@@ -378,6 +375,28 @@ async def ask(
                             )
                             results["metadata"]["type"] = "GENERAL"
                             return results
+                        elif intent == "USER_CLARIFICATION":
+                            asyncio.create_task(
+                                self._pipelines["user_clarification_assistance"].run(
+                                    query=user_query,
+                                    db_schemas=table_ddls,
+                                    language=ask_request.configurations.language,
+                                    query_id=ask_request.query_id,
+                                    custom_instruction=ask_request.custom_instruction,
+                                )
+                            )
+
+                            self._ask_results[query_id] = AskResultResponse(
+                                status="finished",
+                                type="GENERAL",
+                                rephrased_question=rephrased_question,
+                                intent_reasoning=intent_reasoning,
+                                trace_id=trace_id,
+                                is_followup=True if histories else False,
+                                general_type="USER_CLARIFICATION",
+                            )
+                            results["metadata"]["type"] = "GENERAL"
+                            return results
                         else:
                             self._ask_results[query_id] = AskResultResponse(
                                 status="understanding",
@@ -689,6 +708,10 @@ async def get_ask_streaming_result(
                     _pipeline_name = "misleading_assistance"
                 elif self._ask_results.get(query_id).general_type == "DATA_EXPLORATION":
                     _pipeline_name = "data_exploration_assistance"
+                elif (
+                    self._ask_results.get(query_id).general_type == "USER_CLARIFICATION"
+                ):
+                    _pipeline_name = "user_clarification_assistance"
             elif self._ask_results.get(query_id).status == "planning":
                 if self._ask_results.get(query_id).is_followup:
                     _pipeline_name = "followup_sql_generation_reasoning"
diff --git a/wren-ai-service/tools/config/config.example.yaml b/wren-ai-service/tools/config/config.example.yaml
@@ -137,6 +137,8 @@ pipes:
     llm: litellm_llm.default
   - name: data_exploration_assistance
     llm: litellm_llm.default
+  - name: user_clarification_assistance
+    llm: litellm_llm.default
   - name: sql_pairs_indexing
     document_store: qdrant
     embedder: litellm_embedder.default
diff --git a/wren-ai-service/tools/config/config.full.yaml b/wren-ai-service/tools/config/config.full.yaml
@@ -137,6 +137,8 @@ pipes:
     llm: litellm_llm.default
   - name: data_exploration_assistance
     llm: litellm_llm.default
+  - name: user_clarification_assistance
+    llm: litellm_llm.default
   - name: sql_pairs_indexing
     document_store: qdrant
     embedder: litellm_embedder.default