AET-DevOps25
diff --git a/‎.env.example‎
Lines changed: 4 additions & 1 deletion b/‎.env.example‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎.github/workflows/build-and-test-server.yml‎
Lines changed: 2 additions & 0 deletions b/‎.github/workflows/build-and-test-server.yml‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎.github/workflows/deploy_to_aws.yml‎
Lines changed: 3 additions & 0 deletions b/‎.github/workflows/deploy_to_aws.yml‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎.github/workflows/manual_aws_deploy.yml‎
Lines changed: 4 additions & 1 deletion b/‎.github/workflows/manual_aws_deploy.yml‎
Lines changed: 4 additions & 1 deletion
diff --git a/‎docker-compose.yml‎
Lines changed: 3 additions & 0 deletions b/‎docker-compose.yml‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎genai/src/main.py‎
Lines changed: 25 additions & 22 deletions b/‎genai/src/main.py‎
Lines changed: 25 additions & 22 deletions
diff --git a/‎genai/src/services/embedding/embedder_service.py‎
Lines changed: 15 additions & 12 deletions b/‎genai/src/services/embedding/embedder_service.py‎
Lines changed: 15 additions & 12 deletions
diff --git a/‎genai/src/services/llm/llm_service.py‎
Lines changed: 53 additions & 59 deletions b/‎genai/src/services/llm/llm_service.py‎
Lines changed: 53 additions & 59 deletions
@@ -14,6 +14,7 @@ MONGODB_EXPOSED_PORT=27017      # (default: 27017)
 MONGODB_DATABASE=skillforge_dev # Name of the database to create/use
 MONGODB_USERNAME=dev_user       # MongoDB username (choose any)
 MONGODB_PASSWORD=dev_password   # MongoDB password (choose any)
+MONGO_URL=mongodb://dev_user:dev_password@mongo:27017/skillforge-dev?authSource=admin
 
 ##########################
 # 🚦 Gateway Service
@@ -61,6 +62,8 @@ GENAI_APP_NAME=SkillForge GenAI # (default: SkillForge GenAI)
 GENAI_APP_VERSION=1.0.0         # (default: 1.0.0)
 UVICORN_WORKERS=2               # (default: 2)
 CORS_ALLOW_ORIGINS=*            # (default: *)
+SERVER_HOST_GENAI=skillforge-genai
+SERVER_PORT_GENAI=8888
 
 ##########################
 # 🤖 LLM Provider (OpenAI or other)
@@ -84,7 +87,7 @@ WEAVIATE_EXPOSED_GRPC_PORT=50051 # (default: 50051)
 ##########################
 CLIENT_HOST=client.localhost
 SERVER_HOST=server.localhost
-
+GENAI_HOST=genai.localhost
 ###############################################
 # ⚠️  Notes:
 # - Secrets like JWT_SECRET and OPENAI_API_KEY should NEVER be committed!
 
@@ -114,6 +114,8 @@ jobs:
         env:
           SPRING_PROFILES_ACTIVE: test
           MONGO_URL: mongodb://localhost:27017/test
+          SERVER_HOST_GENAI: localhost
+          SERVER_PORT_GENAI: 8888
         run: ./gradlew build --no-daemon --scan
       - name: Post workflow summary
         if: always()
 
@@ -96,9 +96,12 @@ jobs:
 
             echo "CLIENT_HOST=client.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
             echo "SERVER_HOST=api.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
+            echo "GENAI_HOST=genai.api.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
             echo "VITE_PUBLIC_API_URL=https://api.${{ vars.EC2_PUBLIC_IP }}.nip.io/api" >> .env
             echo "VITE_API_INTERNAL_HOST=server-gateway" >> .env
             echo "VITE_API_INTERNAL_PORT=8081" >> .env
+            echo "SERVER_HOST_GENAI=skillforge-genai" >> .env
+            echo "SERVER_PORT_GENAI=8888" >> .env
 
             chmod 600 .env
             echo ".env file created ✅"
 
@@ -85,9 +85,12 @@ jobs:
 
             echo "CLIENT_HOST=client.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
             echo "SERVER_HOST=api.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
+            echo "GENAI_HOST=genai.api.${{ vars.EC2_PUBLIC_IP }}.nip.io" >> .env
             echo "VITE_PUBLIC_API_URL=https://api.${{ vars.EC2_PUBLIC_IP }}.nip.io/api" >> .env
             echo "VITE_API_INTERNAL_HOST=server-gateway" >> .env
             echo "VITE_API_INTERNAL_PORT=8081" >> .env
+            echo "SERVER_HOST_GENAI=skillforge-genai" >> .env
+            echo "SERVER_PORT_GENAI=8888" >> .env
 
             chmod 600 .env
             echo ".env file created ✅"
@@ -117,7 +120,7 @@ jobs:
           echo "Deployment complete! Access your services at:"
           echo "Client: https://client.${{ vars.EC2_PUBLIC_IP }}.nip.io"
           echo "API: https://api.${{ vars.EC2_PUBLIC_IP }}.nip.io"
-          echo "GenAI: https://genai.ai.${{ vars.EC2_PUBLIC_IP }}.nip.io"
+          echo "GenAI: https://genai.api.${{ vars.EC2_PUBLIC_IP }}.nip.io"
           echo "Check the status of your services with:"
           echo "docker compose -f docker-compose.prod.yml ps"
           echo "View logs with:"
 
@@ -114,6 +114,9 @@ services:
       MONGO_URL: ${MONGO_URL:-mongodb://mongo:27017/skillforge-dev}
       JWT_SECRET: ${JWT_SECRET}
       JWT_EXPIRATION_MS: 86400000
+      SERVER_HOST_GENAI: ${SERVER_HOST_GENAI:-skillforge-genai-service}
+      SERVER_PORT_GENAI: ${SERVER_PORT_GENAI:-8888}
+
     depends_on:
       mongo:
         condition: service_healthy
 
@@ -19,25 +19,26 @@
 from .services.embedding.schemas import EmbedRequest, EmbedResponse, QueryRequest, QueryResponse, DocumentResult
 from .services.embedding.weaviate_service import get_weaviate_client, ensure_schema_exists, DOCUMENT_CLASS_NAME
 from .services.llm import llm_service
-from .services.llm.schemas import GenerateRequest, GenerateResponse 
-from .services.rag.schemas import CourseGenerationRequest, Course 
-from .services.rag import course_generator 
-from .utils.error_schema import ErrorResponse 
+from .services.llm.schemas import GenerateRequest, GenerateResponse
+from .services.rag.schemas import CourseGenerationRequest, Course
+from .services.rag import course_generator
+from .utils.error_schema import ErrorResponse
 from .utils.handle_httpx_exception import handle_httpx_exception
 
+
 # --- Configuration ---
 load_dotenv()
 logger = logging.getLogger("skillforge.genai")
 
 APP_PORT = int(os.getenv("GENAI_PORT", "8082"))
 APP_TITLE = os.getenv("GENAI_APP_NAME", "SkillForge GenAI Service")
 APP_VERSION = os.getenv("GENAI_APP_VERSION", "0.0.1")
-APP_DESCRIPTION = ( 
-    "SkillForge GenAI Service provides endpoints for web crawling, " 
-    "chunking, embedding, semantic querying, and text generation using LLMs. " 
-    "Ideal for integrating vector search and AI-driven workflows." 
-) 
-API_PREFIX = "/api/v1" 
+APP_DESCRIPTION = (
+    "SkillForge GenAI Service provides endpoints for web crawling, "
+    "chunking, embedding, semantic querying, and text generation using LLMs. "
+    "Ideal for integrating vector search and AI-driven workflows."
+)
+API_PREFIX = "/api/v1"
 TAGS_METADATA = [
     {"name": "System", "description": "Health checks and system status."},
     {"name": "Crawler", "description": "Crawl and clean website content."},
@@ -247,20 +248,22 @@ async def generate_completion(request: GenerateRequest):
         logging.error(f"ERROR during text generation: {e}")
         raise HTTPException(status_code=500, detail=f"Failed to generate text: {str(e)}")
 
-# ────────────────────────────────────────────────────────────────────────── 
-# NEW – main RAG endpoint 
-# ────────────────────────────────────────────────────────────────────────── 
-@app.post(f"{API_PREFIX}/rag/generate-course", response_model=Course, tags=["rag"]) 
-async def generate_course(req: CourseGenerationRequest): 
-    """ 
-    • POST because generation is a side-effectful operation (non-idempotent). 
-    • Returns a fully-validated Course JSON ready for the course-service. 
-    """ 
-    try: 
-        return course_generator.generate_course(req) 
-    except Exception as e: 
+
+# ──────────────────────────────────────────────────────────────────────────
+# RAG endpoint
+# ──────────────────────────────────────────────────────────────────────────
+@app.post("/api/v1/rag/generate-course", response_model=Course, tags=["rag"])
+async def generate_course(req: CourseGenerationRequest):
+    """
+    • POST because generation is a side-effectful operation (non-idempotent).
+    • Returns a fully-validated Course JSON ready for the course-service.
+    """
+    try:
+        return course_generator.generate_course(req)
+    except Exception as e:
         raise HTTPException(500, str(e)) from e
 
+
 # -------------------------------
 # --------- MAIN ----------------
 # -------------------------------
 
@@ -6,7 +6,7 @@
 import logging
 from typing import List
 import numpy as np
-from .schemas import QueryResponse, QueryRequest, DocumentResult
+
 
 logger = logging.getLogger("skillforge.genai.embedder_service")
 
@@ -47,17 +47,7 @@ def embed_and_store_text(text: str, source_url: str) -> int:
 
     return num_chunks
 
-_embeddings_model = OpenAIEmbeddings(model="text-embedding-3-small")
-
-def embed_text(text: str) -> List[float]:
-    """Generate a single embedding vector from raw text."""
-    return _embeddings_model.embed_query(text)
-
-def cosine_similarity(v1: List[float], v2: List[float]) -> float:
-    """Simple cosine similarity between two vectors."""
-    a = np.array(v1)
-    b = np.array(v2)
-    return float(np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b)))
+from .schemas import QueryResponse, QueryRequest, DocumentResult  # reuse existing pydantic model
 
 def query_similar_chunks(query_text: str, limit: int = 3) -> QueryResponse:
     """
@@ -76,3 +66,16 @@ def query_similar_chunks(query_text: str, limit: int = 3) -> QueryResponse:
     )
     docs = [DocumentResult(**d) for d in result["data"]["Get"][DOCUMENT_CLASS_NAME]]
     return QueryResponse(query=query_text, results=docs)
+
+
+_embeddings_model = OpenAIEmbeddings(model="text-embedding-3-small")
+
+def embed_text(text: str) -> List[float]:
+    """Generate a single embedding vector from raw text."""
+    return _embeddings_model.embed_query(text)
+
+def cosine_similarity(v1: List[float], v2: List[float]) -> float:
+    """Simple cosine similarity between two vectors."""
+    a = np.array(v1)
+    b = np.array(v2)
+    return float(np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b)))
@@ -1,126 +1,120 @@
+# genai/src/services/llm/llm_service.py
 import os
-from langchain_openai import ChatOpenAI
 import json
 import logging
-from langchain_community.llms import FakeListLLM
-from langchain_core.language_models.base import BaseLanguageModel
 from typing import List, Type, TypeVar
+
 from pydantic import BaseModel, ValidationError
+from langchain_openai import ChatOpenAI
+from langchain_community.llms import FakeListLLM
+from langchain_core.language_models.base import BaseLanguageModel
 
 logger = logging.getLogger(__name__)
+
 T = TypeVar("T", bound=BaseModel)
 
+# ──────────────────────────────────────────────────────────────────────────
+# LLM factory
+# ──────────────────────────────────────────────────────────────────────────
 
 def llm_factory() -> BaseLanguageModel:
-    """
-    Factory function to create and return an LLM instance based on the provider
-    specified in the environment variables.
-    Supports OpenAI, OpenAI-compatible (local/llmstudio), and dummy models.
-    """
+    """Return a singleton LangChain LLM according to $LLM_PROVIDER."""
     provider = os.getenv("LLM_PROVIDER", "dummy").lower()
     logger.info(f"--- Creating LLM for provider: {provider} ---")
 
     if provider in ("openai", "llmstudio", "local"):
-        # Get API base and key from env
         openai_api_key = os.getenv("OPENAI_API_KEY", "sk-xxx-dummy-key")
         openai_api_base = os.getenv("OPENAI_API_BASE", "https://api.openai.com/v1")
-
         model = os.getenv("OPENAI_MODEL", "gpt-4o-mini")
         return ChatOpenAI(
             model=model,
             temperature=0.7,
             openai_api_key=openai_api_key,
-            openai_api_base=openai_api_base
+            openai_api_base=openai_api_base,
         )
-    
-    elif provider == "dummy":
+
+    if provider == "dummy":
         responses = [
             "The first summary from the dummy LLM is about procedural languages.",
             "The second summary is about object-oriented programming.",
             "This is a fallback response.",
         ]
         return FakeListLLM(responses=responses)
 
-    else:
-        raise ValueError(f"Currently Unsupported LLM provider: {provider}")
+    raise ValueError(f"Unsupported LLM provider: {provider}")
+
 
 LLM_SINGLETON = llm_factory()
 
+# ──────────────────────────────────────────────────────────────────────────
+# Convenience helpers
+# ──────────────────────────────────────────────────────────────────────────
+
 def generate_text(prompt: str) -> str:
-    """
-    Generates a text completion for a given prompt using the configured LLM.
-    """
-    # 1. Get the correct LLM instance from our factory
+    """Simple text completion (legacy helper)."""
     llm = LLM_SINGLETON
 
-    # if we using local LLM, we need to append "/no_think" in case the model is a thinking model
-    if os.getenv("LLM_PROVIDER", "dummy").lower() == "llmstudio" and hasattr(llm, 'model_name'):
-            prompt += "/no_think"
-    
-    # 2. Invoke the LLM with the prompt
+    if os.getenv("LLM_PROVIDER", "dummy").lower() == "llmstudio" and hasattr(llm, "model_name"):
+        prompt += "/no_think"
+
     response = llm.invoke(prompt)
+    return response.content if hasattr(response, "content") else response
+
+
+def generate_structured(messages: List[dict], schema: Type[T], *, max_retries: int = 3) -> T:
+    """Return a Pydantic object *schema* regardless of the underlying provider.
 
-    # 3. The response object's structure can vary slightly by model.
-    #    For Chat models, the text is in the .content attribute.
-    #    For standard LLMs (like our FakeListLLM), it's the string itself.
-    if hasattr(response, 'content'):
-        return response.content
-    else:
-        return response
-
-    
-def generate_structured(
-    messages: List[dict],
-    schema: Type[T],
-    *,
-    max_retries: int = 3,
-) -> T:
-    """Return a Pydantic object regardless of provider (OpenAI JSON-mode or fallback)."""
+    1. For $LLM_PROVIDER==openai we use the native `beta.chat.completions.parse` API.
+    2. Otherwise we fall back to strict JSON prompting and `model_validate_json()`.
+    """
     provider = os.getenv("LLM_PROVIDER", "dummy").lower()
 
-    # 1) OpenAI native JSON mode
+    # ── 1. Native OpenAI JSON mode ───────────────────────────────────────
     if provider == "openai":
         try:
-            from openai import OpenAI
+            from openai import OpenAI  # local import to avoid hard dep for other providers
+
             client = OpenAI(
                 api_key=os.getenv("OPENAI_API_KEY"),
                 base_url=os.getenv("OPENAI_API_BASE", "https://api.openai.com/v1"),
             )
-            resp = client.beta.chat.completions.parse(
+            response = client.beta.chat.completions.parse(
                 model=os.getenv("OPENAI_MODEL", "gpt-4o-mini"),
                 messages=messages,
                 response_format=schema,
             )
-            return resp.choices[0].message.parsed  # type: ignore[arg-type]
+            return response.choices[0].message.parsed  # type: ignore[arg-type]
         except Exception as e:
             logger.warning(f"OpenAI structured parse failed – falling back: {e}")
 
-    # 2) Generic JSON-string fallback
+    # ── 2. Generic JSON-string fallback for all other models ─────────────
     system_json_guard = {
         "role": "system",
         "content": (
-            "Return ONLY valid JSON matching this schema:\n"
-            + json.dumps(schema.model_json_schema())
+            "You are a JSON-only assistant. Produce **only** valid JSON that conforms to "
+            "this schema (no markdown, no explanations):\n" + json.dumps(schema.model_json_schema())
         ),
     }
+
     convo: List[dict] = [system_json_guard] + messages
-    llm = LLM_SINGLETON
 
+    llm = LLM_SINGLETON
     for attempt in range(1, max_retries + 1):
         raw = llm.invoke(convo)
-        text = raw.content if hasattr(raw, "content") else raw
+        text = raw.content if hasattr(raw, "content") else raw  # Chat vs non-chat
         try:
             return schema.model_validate_json(text)
         except ValidationError as e:
             logger.warning(
-                f"Structured output validation failed ({attempt}/{max_retries}): {e}"
+                f"Structured output validation failed (try {attempt}/{max_retries}): {e}"\
             )
-            convo += [
-                {"role": "assistant", "content": text},
-                {
-                    "role": "user",
-                    "content": "❌ JSON invalid. Send ONLY fixed JSON.",
-                },
-            ]
-
-    raise ValueError("Could not obtain valid structured output")
+            convo.append({"role": "assistant", "content": text})
+            convo.append({
+                "role": "user",
+                "content": (
+                    "❌ JSON was invalid: " + str(e.errors()) +
+                    "\nPlease resend ONLY the corrected JSON (no extraneous text)."
+                ),
+            })
+
+    raise ValueError("Failed to get valid structured output after retries")