Add rag service to prepare prompts and document retriaval

edkaya · edkaya · commit 726846de9a42 · 2025-06-10T00:51:19.000+02:00
diff --git a/genai/controller/generate_controller.py b/genai/controller/generate_controller.py
@@ -3,12 +3,10 @@
 import logging
 from werkzeug.utils import secure_filename
 
-from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
-from langchain_core.messages import HumanMessage
-
 from genai.rag.ingestion_pipeline import IngestionPipeline
 from genai.vector_database.qdrant_vdb import QdrantVDB
 from genai.rag.llm.chat_model import ChatModel
+from genai.service.rag_service import retrieve_similar_docs, prepare_prompt
 
 
 # Set Logging
@@ -80,13 +78,25 @@ def upload_file():
 
 @generate_bp.route('/genai/generate', methods=['POST'])
 def generate():
+    """API Endpoint for generating recipe responses based on document retrieval.
+    
+    This endpoint processes user queries against a vector database of recipes and returns
+    AI-generated responses using retrieved context.
+    
+    Request Body:
+        query (str): The user's recipe-related query
+        conversation_id (str): Unique identifier for the conversation thread
+    
+    Returns:
+        JSON response containing the generated recipe response or error message
+    """
     data = request.get_json()
 
     if not data or "query" not in data or "conversation_id" not in data:
         return jsonify({"error": "Missing 'query' or 'conversation_id'"}), 400
 
     query = data["query"]
-    conversation_id = data["conversation_id"] # will be used
+    #conversation_id = data["conversation_id"] # will be used in the future
 
     try:
         collection_name = "recipes"
@@ -96,29 +106,15 @@ def generate():
             vector_store = qdrant.create_and_get_vector_storage(
                 collection_name
             )
+            #todo: retrieve messages from chat history as BaseMessage
+            messages = []
+            retrieved_docs = retrieve_similar_docs(vector_store, query)
+            prompt = prepare_prompt(query, retrieved_docs, messages)
 
-            # Retrieve 5 similar documents
-            retriever = vector_store.as_retriever(search_kwargs={"k": 5})
-            retrieved_docs = retriever.invoke(query)
-            docs_content = "\n\n".join(doc.page_content for doc in retrieved_docs)
-
-            # Prepare prompt
-            prompt_template = ChatPromptTemplate([
-                ("system", "You are a helpful assistant for recipe generation based on the given ingredients and the following context:\n\n{context}"),
-                MessagesPlaceholder("msgs")
-            ])
-
-            prompt = prompt_template.invoke({
-                "context": docs_content,
-                "msgs": HumanMessage(content=query)
-            })
-            
             response = llm.invoke(prompt)
             return jsonify({
                 "response": response.content,
             }), 200
 
     except Exception as e:
         return jsonify({"error": str(e)}), 500
-
-
diff --git a/genai/service/rag_service.py b/genai/service/rag_service.py
@@ -0,0 +1,28 @@
+from typing import List
+
+from langchain_qdrant import QdrantVectorStore
+from langchain_core.messages import BaseMessage, HumanMessage
+from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
+
+def retrieve_similar_docs(vector_store: QdrantVectorStore, user_query: str):
+    """Retrieve similar documents based on the user query"""
+    retriever = vector_store.as_retriever(search_kwargs={"k": 5})
+    retrieved_docs = retriever.invoke(user_query)
+    docs_content = "\n\n".join(doc.page_content for doc in retrieved_docs)
+    return docs_content
+
+def prepare_prompt(user_query: str, docs_content: str, messages: List[BaseMessage]):
+    """Prepare the prompt with prompt templates to give to LLM"""
+    prompt_template = ChatPromptTemplate([
+        ("system", "You are a helpful assistant for recipe generation based on the given ingredients and the following context:\n\n{context}"),
+        MessagesPlaceholder("msgs")
+    ])
+
+    full_messages = messages + [HumanMessage(content=user_query)]
+
+    prompt = prompt_template.invoke({
+        "context": docs_content,
+        "msgs": full_messages
+    })
+
+    return prompt