redis
diff --git a/‎pyproject.toml‎
Lines changed: 1 addition & 0 deletions b/‎pyproject.toml‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎redis_memory_server/memory.py‎ ‎redis_memory_server/api.py‎redis_memory_server/memory.py renamed to redis_memory_server/api.py
Lines changed: 69 additions & 20 deletions b/‎redis_memory_server/memory.py‎ ‎redis_memory_server/api.py‎redis_memory_server/memory.py renamed to redis_memory_server/api.py
Lines changed: 69 additions & 20 deletions
diff --git a/‎redis_memory_server/healthcheck.py‎
Lines changed: 1 addition & 1 deletion b/‎redis_memory_server/healthcheck.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎redis_memory_server/models.py‎ ‎redis_memory_server/llms.py‎redis_memory_server/models.py renamed to redis_memory_server/llms.py
Lines changed: 1 addition & 77 deletions b/‎redis_memory_server/models.py‎ ‎redis_memory_server/llms.py‎redis_memory_server/models.py renamed to redis_memory_server/llms.py
Lines changed: 1 addition & 77 deletions
diff --git a/‎redis_memory_server/main.py‎
Lines changed: 17 additions & 5 deletions b/‎redis_memory_server/main.py‎
Lines changed: 17 additions & 5 deletions
@@ -26,6 +26,7 @@ dependencies = [
     "transformers>=4.30.0",
     "numba>=0.60.0",
     "nanoid>=2.0.0",
+    "mcp>=1.6.0",
 ]
 
 [project.optional-dependencies]
 
@@ -4,17 +4,20 @@
 from fastapi import APIRouter, BackgroundTasks, Depends, HTTPException
 
 from redis_memory_server.config import settings
-from redis_memory_server.extraction import handle_extraction
 from redis_memory_server.logging import get_logger
-from redis_memory_server.long_term_memory import index_messages
-from redis_memory_server.models import (
+from redis_memory_server.models.extraction import handle_extraction
+from redis_memory_server.models.messages import (
     AckResponse,
     GetSessionsQuery,
     MemoryMessage,
     MemoryMessagesAndContext,
     MemoryResponse,
+    SearchPayload,
+    SearchResults,
+    index_messages,
+    search_messages,
 )
-from redis_memory_server.summarization import handle_compaction
+from redis_memory_server.models.summarization import handle_compaction
 from redis_memory_server.utils import (
     Keys,
     get_model_client,
@@ -29,11 +32,11 @@
 
 
 @router.get("/sessions/", response_model=list[str])
-async def get_sessions(
+async def list_sessions(
     pagination: GetSessionsQuery = Depends(),
 ):
     """
-    Get a list of session IDs, with optional pagination
+    Get a list of session IDs, with optional pagination.
 
     Args:
         pagination: Pagination parameters (page, size, namespace)
@@ -52,9 +55,7 @@ async def get_sessions(
     end = pagination.page * pagination.size - 1
 
     # Set key based on namespace
-    sessions_key = (
-        f"sessions:{pagination.namespace}" if pagination.namespace else "sessions"
-    )
+    sessions_key = Keys.sessions_key(namespace=pagination.namespace)
 
     try:
         # Get session IDs from Redis
@@ -69,26 +70,35 @@ async def get_sessions(
 
 
 @router.get("/sessions/{session_id}/memory", response_model=MemoryResponse)
-async def get_memory(session_id: str):
+async def get_session_memory(session_id: str, namespace: str | None = None):
     """
-    Get memory for a session
+    Get memory for a session.
+
+    This includes stored conversation history and context.
 
     Args:
         session_id: The session ID
 
     Returns:
-        Memory response with messages and context
+        Conversation history and context
     """
     redis = get_redis_conn()
 
     try:
         # Define keys
-        messages_key = Keys.messages_key(session_id)
-        context_key = Keys.context_key(session_id)
-        token_count_key = Keys.token_count_key(session_id)
+        sessions_key = Keys.sessions_key(namespace=namespace)
+        messages_key = Keys.messages_key(session_id, namespace=namespace)
+        context_key = Keys.context_key(session_id, namespace=namespace)
+        token_count_key = Keys.token_count_key(session_id, namespace=namespace)
+
+        # TODO: Use a hash
+        session_exists = await redis.zscore(sessions_key, session_id)
+        if not session_exists:
+            raise HTTPException(status_code=404, detail="Session not found")
 
         # Get data from Redis in a pipeline
         pipe = redis.pipeline()
+        # TODO: Make window size configurable via API parameter
         pipe.lrange(messages_key, 0, settings.window_size - 1)  # Get messages
         pipe.mget(context_key, token_count_key)  # Get context and token count
         results = await pipe.execute()
@@ -147,6 +157,8 @@ async def get_memory(session_id: str):
             tokens=tokens,
         )
 
+    except HTTPException as e:
+        raise e
     except Exception as e:
         logger.error(f"Error getting memory for session {session_id}: {e}")
         raise HTTPException(status_code=500, detail="Internal server error") from e
@@ -178,20 +190,17 @@ async def post_memory(
         context_key = Keys.context_key(session_id)
         sessions_key = f"sessions:{namespace}" if namespace else "sessions"
 
-        # Check if new context is provided
         if memory_messages.context is not None:
             await redis.set(context_key, memory_messages.context)
 
-        # Add session to sessions set with timestamp
         current_time = int(time.time())
         await redis.zadd(sessions_key, {session_id: current_time})
 
-        # Get model client for extraction
         model_client = await get_model_client(settings.generation_model)
-
         messages_json = []
 
         # Process messages for topic/entity extraction
+        # TODO: Use a distributed background task
         for msg in memory_messages.messages:
             # Handle extraction in background for each message
             msg = await handle_extraction(msg)
@@ -202,7 +211,7 @@ async def post_memory(
             messages_json.append(json.dumps(msg_dict))
 
         # Add messages to list
-        await redis.lpush(messages_key, *messages_json)  # type: ignore
+        await redis.rpush(messages_key, *messages_json)  # type: ignore
 
         # Check if window size is exceeded
         current_size = await redis.llen(messages_key)  # type: ignore
@@ -218,6 +227,7 @@ async def post_memory(
             )
 
         # If long-term memory is enabled, index messages
+        # TODO: Use a distributed background task
         if settings.long_term_memory:
             embedding_client = await get_openai_client()
             background_tasks.add_task(
@@ -226,6 +236,7 @@ async def post_memory(
                 session_id,
                 embedding_client,
                 redis,
+                namespace,
             )
 
         return AckResponse(status="ok")
@@ -267,3 +278,41 @@ async def delete_memory(
     except Exception as e:
         logger.error(f"Error deleting memory for session {session_id}: {e}")
         raise HTTPException(status_code=500, detail="Internal server error") from e
+
+
+@router.post("/sessions/{session_id}/search", response_model=SearchResults)
+async def search_session_messages(
+    session_id: str,
+    payload: SearchPayload,
+    namespace: str | None = None,
+):
+    """
+    Run a semantic search on the messages in a session
+
+    Args:
+        session_id: The session ID
+        payload: Search payload with text to search for
+        namespace: Optional namespace for the session
+
+    Returns:
+        List of search results
+    """
+    redis = get_redis_conn()
+
+    if not settings.long_term_memory:
+        raise HTTPException(status_code=400, detail="Long term memory is disabled")
+
+    # For embeddings, we always use OpenAI models since Anthropic doesn't support embeddings
+    client = await get_openai_client()
+
+    try:
+        return await search_messages(
+            payload.text,
+            client,
+            redis,
+            session_id=session_id,
+            namespace=namespace,
+        )
+    except Exception as e:
+        logger.error(f"Error in retrieval API: {e}")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
@@ -2,7 +2,7 @@
 
 from fastapi import APIRouter
 
-from redis_memory_server.models import HealthCheckResponse
+from redis_memory_server.models.messages import HealthCheckResponse
 
 
 router = APIRouter()
 
@@ -7,88 +7,12 @@
 import anthropic
 import numpy as np
 from openai import AsyncOpenAI
-from pydantic import BaseModel, Field
+from pydantic import BaseModel
 
 
-# Setup logging
 logger = logging.getLogger(__name__)
 
 
-class MemoryMessage(BaseModel):
-    """A message in the memory system"""
-
-    role: str
-    content: str
-    topics: list[str] = Field(
-        default_factory=list, description="List of topics associated with this message"
-    )
-    entities: list[str] = Field(
-        default_factory=list, description="List of entities mentioned in this message"
-    )
-
-
-class MemoryMessagesAndContext(BaseModel):
-    """Request payload for adding messages to memory"""
-
-    messages: list[MemoryMessage]
-    context: str | None = None
-
-
-class MemoryResponse(BaseModel):
-    """Response containing messages and context"""
-
-    messages: list[MemoryMessage]
-    context: str | None = None
-    tokens: int | None = None
-
-
-class SearchPayload(BaseModel):
-    """Payload for semantic search"""
-
-    text: str
-
-
-class HealthCheckResponse(BaseModel):
-    """Response for health check endpoint"""
-
-    now: int
-
-
-class AckResponse(BaseModel):
-    """Generic acknowledgement response"""
-
-    status: str
-
-
-class RedisearchResult(BaseModel):
-    """Result from a redisearch query"""
-
-    role: str
-    content: str
-    dist: float
-
-
-class SearchResults(BaseModel):
-    """Results from a redisearch query"""
-
-    docs: list[RedisearchResult]
-    total: int
-
-
-class NamespaceQuery(BaseModel):
-    """Query parameters for namespace"""
-
-    namespace: str | None = None
-
-
-class GetSessionsQuery(BaseModel):
-    """Query parameters for getting sessions"""
-
-    page: int = Field(default=1)
-    size: int = Field(default=20)
-    namespace: str | None = None
-
-
 class ModelProvider(str, Enum):
     """Type of model provider"""
 
 
@@ -1,15 +1,15 @@
 import os
 
 import uvicorn
-from fastapi import FastAPI
+from fastapi import BackgroundTasks, FastAPI
 
 from redis_memory_server import utils
+from redis_memory_server.api import router as memory_router
 from redis_memory_server.config import settings
 from redis_memory_server.healthcheck import router as health_router
+from redis_memory_server.llms import MODEL_CONFIGS, ModelProvider
 from redis_memory_server.logging import configure_logging, get_logger
-from redis_memory_server.memory import router as memory_router
-from redis_memory_server.models import MODEL_CONFIGS, ModelProvider
-from redis_memory_server.retrieval import router as retrieval_router
+from redis_memory_server.mcp import mcp_app
 from redis_memory_server.utils import ensure_redisearch_index, get_redis_conn
 
 
@@ -124,7 +124,19 @@ async def shutdown_event():
 
 app.include_router(health_router)
 app.include_router(memory_router)
-app.include_router(retrieval_router)
+
+
+# Set up MCP routes
+@app.middleware("http")
+async def mcp_middleware(request, call_next):
+    """Middleware to inject BackgroundTasks into MCP handler"""
+    background_tasks = BackgroundTasks()
+    request.state.background_tasks = background_tasks
+    return await call_next(request)
+
+
+# Mount MCP server
+app.mount("/mcp", mcp_app.sse_app())
 
 
 def on_start_logger(port: int):
Original file line number	Diff line number	Diff line change
`@@ -26,6 +26,7 @@ dependencies = [`
`26`	`26`	`"transformers>=4.30.0",`
`27`	`27`	`"numba>=0.60.0",`
`28`	`28`	`"nanoid>=2.0.0",`
	`29`	`+ "mcp>=1.6.0",`
`29`	`30`	`]`
`30`	`31`
`31`	`32`	`[project.optional-dependencies]`