DUT-Team-21TCLC-DT3
diff --git a/‎ai_service/Dockerfile.local‎
Lines changed: 24 additions & 0 deletions b/‎ai_service/Dockerfile.local‎
Lines changed: 24 additions & 0 deletions
diff --git a/‎ai_service/PIPELINE_MIGRATION.md‎
Lines changed: 74 additions & 0 deletions b/‎ai_service/PIPELINE_MIGRATION.md‎
Lines changed: 74 additions & 0 deletions
diff --git a/‎ai_service/app/new_pipelines/query_preprocessor.py‎
Lines changed: 1 addition & 1 deletion b/‎ai_service/app/new_pipelines/query_preprocessor.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎ai_service/app/services/answer_composer.py‎
Lines changed: 144 additions & 0 deletions b/‎ai_service/app/services/answer_composer.py‎
Lines changed: 144 additions & 0 deletions
@@ -0,0 +1,24 @@
+# Dockerfile.local - Dùng cho môi trường dev/local
+FROM python:3.11-slim
+
+WORKDIR /srv/app
+
+# Cài đặt các dependencies hệ thống nếu cần (ví dụ gcc để build một số thư viện python)
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    build-essential \
+    && rm -rf /var/lib/apt/lists/*
+
+# Copy requirements.txt
+COPY requirements.txt ./
+
+# Cài đặt thư viện
+RUN pip install --upgrade pip && \
+    pip install --no-cache-dir -r requirements.txt
+
+# Copy mã nguồn
+COPY . .
+
+# --- KHỞI CHẠY ---
+ENV PYTHONUNBUFFERED=1
+
+CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000"]
@@ -0,0 +1,74 @@
+# Tài liệu Chuyển đổi: Từ Notebook sang Production Pipeline
+
+Tài liệu này mô tả quá trình và cấu trúc mã nguồn được chuyển đổi từ file thực nghiệm `05_ai_agent_pipeline.ipynb` sang hệ thống backend `ai_service` hoàn chỉnh.
+
+## 1. Tổng quan
+
+Mục tiêu là chuyển đổi logic của AI Agent từ môi trường notebook (chạy tuần tự, khó tái sử dụng) sang kiến trúc **Microservices-ready** bên trong FastAPI, đảm bảo các yếu tố:
+
+- **Modularity**: Tách nhỏ các chức năng thành từng service riêng biệt.
+- **Performance**: Sử dụng Singleton Pattern cho các model nặng (Embedding, Neo4j Driver).
+- **Scalability**: Hỗ trợ Asynchronous (Async/Await) và Streaming Response.
+- **Maintainability**: Dễ dàng debug và mở rộng từng module.
+
+## 2. Ánh xạ Cấu trúc (Mapping)
+
+Dưới đây là bảng ánh xạ từ các cell trong Notebook sang các file source code:
+
+| Chức năng trong Notebook | File Source Code tương ứng (`app/services/`) | Nhiệm vụ chính                                                                         |
+| ------------------------ | -------------------------------------------- | -------------------------------------------------------------------------------------- |
+| **Query Rewriting**      | `query_processor.py`                         | Phân tích câu hỏi, kiểm tra hợp lệ, tách từ khóa search.                               |
+| **Vector Search**        | `vector_search.py`                           | Tạo embedding cho query và tìm kiếm vector trong Neo4j. Tự động tạo index nếu chưa có. |
+| **Reranking**            | `reranker.py`                                | Dùng Gemini để chấm điểm và chọn lọc lại các node kết quả từ Vector Search.            |
+| **Graph Traversal**      | `graph_search.py`                            | Sinh câu lệnh Cypher động, duyệt đồ thị để lấy ngữ cảnh (Điều, Khoản, Điểm) liên quan. |
+| **Web Search**           | `web_search.py`                              | Fallback tìm kiếm Google/Tavily khi dữ liệu nội bộ không đủ.                           |
+| **Answer Generation**    | `answer_composer.py`                         | Tổng hợp tất cả thông tin và sinh câu trả lời cuối cùng (có hỗ trợ Streaming).         |
+| **Orchestration**        | `streaming_service.py`                       | "Nhạc trưởng" điều phối luồng chạy tuần tự qua các bước trên.                          |
+
+## 3. Luồng xử lý dữ liệu (Data Flow)
+
+Khi người dùng gọi API `POST /api/v1/ask`:
+
+1.  **Request** đi vào `app/main.py`.
+2.  **StreamingService** (`generate_streaming_response`) được kích hoạt.
+3.  **Bước 1 - Query Processor**:
+    - Input: "Người lao động được hưởng BHYT thế nào?"
+    - Output: Intent "CONSULTATION", Keywords ["chế độ BHYT", "mức hưởng"].
+4.  **Bước 2 - Vector Search**:
+    - Input: Keywords.
+    - Action: Embed keywords -> Query Neo4j Vector Index.
+    - Output: Top 5-10 Nodes có nội dung tương đồng.
+5.  **Bước 3 - Reranker**:
+    - Input: Top Nodes + Câu hỏi gốc.
+    - Action: Dùng Gemini chấm điểm sự liên quan.
+    - Output: Top 3 Nodes tốt nhất (Focus Nodes).
+6.  **Bước 4 - Graph Search**:
+    - Input: Focus Nodes.
+    - Action: Từ mỗi Node, duyệt đồ thị (Parent/Children/Relationships) để lấy ngữ cảnh luật đầy đủ.
+    - Output: Đoạn văn bản luật chính xác nhất.
+7.  **Bước 5 - Web Search (Optional)**:
+    - Nếu Graph không tìm thấy thông tin -> Gọi Tavily API tìm kiếm online.
+8.  **Bước 6 - Answer Composer**:
+    - Input: Context từ Graph + Context từ Web + Câu hỏi.
+    - Action: Gemini sinh câu trả lời streaming.
+    - Output: Từng token text được gửi về client.
+
+## 4. Các cải tiến kỹ thuật
+
+- **Singleton Pattern**: `VectorSearchService` và `GraphSearchService` chỉ khởi tạo kết nối Database và load Model **một lần duy nhất** khi ứng dụng khởi chạy. Không load lại mỗi request như notebook.
+- **Error Handling**: Mỗi service đều có try/catch riêng biệt, đảm bảo một bước lỗi (ví dụ Web Search) không làm sập cả luồng.
+- **Environment Variables**: Tất cả cấu hình (API Key, URI) được quản lý qua file `.env` và `config.py` thay vì hardcode.
+- **Streaming**: API trả về dữ liệu dạng `Server-Sent Events (SSE)` hoặc `NDJSON` chunk, giúp UX mượt mà hơn (thấy chữ chạy ra ngay lập tức).
+
+## 5. Hướng dẫn chạy
+
+Để chạy hệ thống với code mới nhất:
+
+```bash
+# 1. Đảm bảo file .env đã có đủ key (GEMINI_API_KEY, NEO4J_URI,...)
+
+# 2. Chạy Docker (Mount volume để hot reload khi sửa code)
+docker run -p 3000:8000 --env-file .env -v "%cd%:/srv/app" ai_service uvicorn app.main:app --host 0.0.0.0 --port 8000 --reload
+```
+
+_(Lưu ý: Trên PowerShell thay `%cd%` bằng `${PWD}`)_
@@ -151,7 +151,7 @@ def __init__(self):
 
         # Khởi tạo model với System Instruction riêng biệt
         # Khuyên dùng gemini-1.5-flash (nhanh, rẻ, tuân thủ tốt) hoặc gemini-1.5-pro
-        gemini_model = 'gemini-2.5-flash'
+        gemini_model = 'gemini-2.5-pro'
         self.model = genai.GenerativeModel(
             gemini_model, 
             generation_config=generation_config,
 
@@ -0,0 +1,144 @@
+import logging
+import google.generativeai as genai
+from typing import Dict, Any, List
+from ..dependencies import get_settings
+
+log = logging.getLogger(__name__)
+
+class AnswerComposerService:
+    def __init__(self):
+        settings = get_settings()
+        if not settings.gemini_api_key:
+             raise ValueError("GEMINI_API_KEY not found")
+        genai.configure(api_key=settings.gemini_api_key)
+        self.model_name = 'gemini-2.5-flash' # Or settings.GEMINI_COMPOSER_MODEL
+
+    def compose(
+        self, 
+        question: str, 
+        graph_result: Dict[str, Any], 
+        web_context: str = ""
+    ) -> str:
+        """
+        Tổng hợp câu trả lời cuối cùng.
+        """
+        final_choice = graph_result.get("final_choice")
+        
+        # Xây dựng context từ Graph
+        graph_context_str = ""
+        if final_choice:
+            graph_context_str = (
+                f"THÔNG TIN TỪ CƠ SỞ DỮ LIỆU LUẬT (Tin cậy cao):\n"
+                f"- Nguồn: {final_choice['source_type']} (Node ID: {final_choice['source_node_id']})\n"
+                f"- Nội dung:\n{final_choice['chosen_snippet']}\n"
+            )
+        else:
+            graph_context_str = "Không tìm thấy thông tin trong cơ sở dữ liệu luật nội bộ."
+
+        # Xây dựng context từ Web (nếu có)
+        web_context_str = ""
+        if web_context:
+            web_context_str = f"\nTHÔNG TIN BỔ SUNG TỪ WEB (Tham khảo):\n{web_context}\n"
+
+        prompt = f"""
+Bạn là Trợ lý Luật sư AI chuyên nghiệp (Legal Assistant).
+
+NHIỆM VỤ:
+Trả lời câu hỏi của người dùng dựa trên các nguồn thông tin được cung cấp dưới đây.
+
+CÂU HỎI: "{question}"
+
+NGUỒN THÔNG TIN:
+{graph_context_str}
+{web_context_str}
+
+YÊU CẦU TRẢ LỜI:
+1. **Chính xác & Cẩn trọng**: Chỉ trả lời dựa trên thông tin được cung cấp. Nếu thông tin mâu thuẫn, ưu tiên "THÔNG TIN TỪ CƠ SỞ DỮ LIỆU LUẬT".
+2. **Trích dẫn rõ ràng**:
+   - Luôn trích dẫn Điều/Khoản/Luật nếu có trong nội dung (ví dụ: "Theo Khoản 1 Điều 60 Luật BHXH...").
+   - Nếu dùng thông tin từ Web, hãy nói rõ "Theo thông tin tham khảo từ nguồn web...".
+3. **Cấu trúc mạch lạc**:
+   - Mở đầu: Trả lời trực tiếp vào vấn đề.
+   - Thân bài: Giải thích chi tiết, nêu căn cứ pháp lý.
+   - Kết luận: Tóm tắt lại hoặc đưa ra lời khuyên (nếu phù hợp).
+4. **Không bịa đặt**: Nếu không có đủ thông tin để trả lời, hãy thành thật xin lỗi và đề xuất người dùng cung cấp thêm chi tiết hoặc tra cứu nguồn khác.
+
+HÃY VIẾT CÂU TRẢ LỜI HOÀN CHỈNH:
+"""
+        model = genai.GenerativeModel(
+            self.model_name,
+            generation_config={"temperature": 0.2} # Hơi sáng tạo một chút để viết văn mượt mà
+        )
+
+        try:
+            response = model.generate_content(prompt)
+            return response.text.strip()
+        except Exception as e:
+            log.error(f"Lỗi compose answer: {e}")
+            return "Xin lỗi, hệ thống gặp sự cố khi tổng hợp câu trả lời."
+
+    def compose_stream(
+        self, 
+        question: str, 
+        graph_result: Dict[str, Any], 
+        web_context: str = ""
+    ):
+        """
+        Tổng hợp câu trả lời cuối cùng (Streaming).
+        """
+        final_choice = graph_result.get("final_choice")
+        
+        # Xây dựng context từ Graph
+        graph_context_str = ""
+        if final_choice:
+            graph_context_str = (
+                f"THÔNG TIN TỪ CƠ SỞ DỮ LIỆU LUẬT (Tin cậy cao):\n"
+                f"- Nguồn: {final_choice['source_type']} (Node ID: {final_choice['source_node_id']})\n"
+                f"- Nội dung:\n{final_choice['chosen_snippet']}\n"
+            )
+        else:
+            graph_context_str = "Không tìm thấy thông tin trong cơ sở dữ liệu luật nội bộ."
+
+        # Xây dựng context từ Web (nếu có)
+        web_context_str = ""
+        if web_context:
+            web_context_str = f"\nTHÔNG TIN TỪ WEB (Tham khảo):\n{web_context}\n"
+
+        prompt = f"""
+Bạn là Trợ lý Luật sư AI chuyên nghiệp (Legal Assistant).
+
+NHIỆM VỤ:
+Trả lời câu hỏi của người dùng dựa trên các nguồn thông tin được cung cấp dưới đây.
+
+CÂU HỎI: "{question}"
+
+NGUỒN THÔNG TIN:
+{graph_context_str}
+{web_context_str}
+
+YÊU CẦU TRẢ LỜI:
+1. **Chính xác & Cẩn trọng**: Chỉ trả lời dựa trên thông tin được cung cấp. Nếu thông tin mâu thuẫn, ưu tiên "THÔNG TIN TỪ CƠ SỞ DỮ LIỆU LUẬT".
+2. **Trích dẫn rõ ràng**:
+   - Luôn trích dẫn Điều/Khoản/Luật nếu có trong nội dung (ví dụ: "Theo Khoản 1 Điều 60 Luật BHXH...").
+   - Nếu dùng thông tin từ Web, hãy nói rõ "Theo thông tin tham khảo từ nguồn web...".
+3. **Cấu trúc mạch lạc**:
+   - Mở đầu: Trả lời trực tiếp vào vấn đề.
+   - Thân bài: Giải thích chi tiết, nêu căn cứ pháp lý.
+   - Kết luận: Tóm tắt lại hoặc đưa ra lời khuyên (nếu phù hợp).
+4. **Không bịa đặt**: Nếu không có đủ thông tin để trả lời, hãy thành thật xin lỗi và đề xuất người dùng cung cấp thêm chi tiết hoặc tra cứu nguồn khác.
+
+HÃY VIẾT CÂU TRẢ LỜI HOÀN CHỈNH:
+"""
+        model = genai.GenerativeModel(
+            self.model_name,
+            generation_config={"temperature": 0.2}
+        )
+
+        try:
+            response = model.generate_content(prompt, stream=True)
+            for chunk in response:
+                if chunk.text:
+                    yield chunk.text
+        except Exception as e:
+            log.error(f"Lỗi compose answer stream: {e}")
+            yield "Xin lỗi, hệ thống gặp sự cố khi tổng hợp câu trả lời."