Simplify reducers

abrookins · abrookins · commit f0c26ceeb112 · 2025-03-16T22:50:58.000-07:00
diff --git a/memory.py b/memory.py
@@ -13,7 +13,7 @@
     MemoryMessagesAndContext,
     MemoryResponse,
 )
-from reducers import handle_compaction
+from summarization import handle_compaction
 from utils import Keys, get_model_client, get_openai_client, get_redis_conn
 
 
@@ -24,7 +24,7 @@
 
 @router.get("/sessions/", response_model=list[str])
 async def get_sessions(
-    pagination: GetSessionsQuery = Depends(GetSessionsQuery),
+    pagination: GetSessionsQuery = Depends(),
 ):
     """
     Get a list of session IDs, with optional pagination
@@ -55,14 +55,11 @@ async def get_sessions(
         session_ids = await redis.zrange(sessions_key, start, end)
 
         # Convert from bytes to strings if needed
-        session_ids = [
-            s.decode("utf-8") if isinstance(s, bytes) else s for s in session_ids
-        ]
+        return [s.decode("utf-8") if isinstance(s, bytes) else s for s in session_ids]
 
-        return session_ids
     except Exception as e:
         logger.error(f"Error getting sessions: {e}")
-        raise HTTPException(status_code=500, detail="Internal server error")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
 
 
 @router.get("/sessions/{session_id}/memory", response_model=MemoryResponse)
@@ -72,7 +69,6 @@ async def get_memory(session_id: str):
 
     Args:
         session_id: The session ID
-        request: FastAPI request
 
     Returns:
         Memory response with messages and context
@@ -103,8 +99,19 @@ async def get_memory(session_id: str):
                 msg_raw = msg_raw.decode("utf-8")
 
             # Parse JSON
-            msg = json.loads(msg_raw)
-            memory_messages.append(MemoryMessage(**msg))
+            msg_dict = json.loads(msg_raw)
+
+            # Convert comma-separated strings back to lists for topics and entities
+            if "topics" in msg_dict:
+                msg_dict["topics"] = (
+                    msg_dict["topics"].split(",") if msg_dict["topics"] else []
+                )
+            if "entities" in msg_dict:
+                msg_dict["entities"] = (
+                    msg_dict["entities"].split(",") if msg_dict["entities"] else []
+                )
+
+            memory_messages.append(MemoryMessage(**msg_dict))
 
         # Extract context and tokens
         context = None
@@ -128,14 +135,15 @@ async def get_memory(session_id: str):
             tokens = int(tokens_str)
 
         # Build response
-        response = MemoryResponse(
-            messages=memory_messages, context=context, tokens=tokens
+        return MemoryResponse(
+            messages=memory_messages,
+            context=context,
+            tokens=tokens,
         )
 
-        return response
     except Exception as e:
         logger.error(f"Error getting memory for session {session_id}: {e}")
-        raise HTTPException(status_code=500, detail="Internal server error")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
 
 
 @router.post("/sessions/{session_id}/memory", response_model=AckResponse)
@@ -172,22 +180,22 @@ async def post_memory(
         current_time = int(time.time())
         await redis.zadd(sessions_key, {session_id: current_time})
 
-        # Add messages to session list
-        # TODO: Don't need a pipeline here, lpush takes multiple values.
-        pipe = redis.pipeline()
+        # Convert messages to JSON, handling topics and entities
+        messages_json = []
         for msg in memory_messages.messages:
-            # Convert to dict and serialize
-            msg_json = json.dumps(msg.model_dump())
-            pipe.lpush(messages_key, msg_json)
+            msg_dict = msg.model_dump()
+            # Convert lists to comma-separated strings for TAG fields
+            msg_dict["topics"] = ",".join(msg.topics) if msg.topics else ""
+            msg_dict["entities"] = ",".join(msg.entities) if msg.entities else ""
+            messages_json.append(json.dumps(msg_dict))
 
-        # Execute pipeline
-        await pipe.execute()
+        # Add messages to list
+        await redis.lpush(messages_key, *messages_json)  # type: ignore
 
         # Check if window size is exceeded
         current_size = await redis.llen(messages_key)
         if current_size > settings.window_size:
             # Handle compaction in background
-            # Get the appropriate client for the generation model
             model_client = await get_model_client(settings.generation_model)
             background_tasks.add_task(
                 handle_compaction,
@@ -198,26 +206,21 @@ async def post_memory(
                 redis,
             )
 
-        # If long-term memory is enabled, index messages.
-        #
-        # TODO: Add support for custom policies around when to index and/or
-        # avoid re-indexing duplicate content.
+        # If long-term memory is enabled, index messages
         if settings.long_term_memory:
-            # For embeddings, we always use OpenAI models since Anthropic doesn't support embeddings
             embedding_client = await get_openai_client()
-
             background_tasks.add_task(
                 index_messages,
                 memory_messages.messages,
                 session_id,
-                embedding_client,  # Explicitly use OpenAI client for embeddings
+                embedding_client,
                 redis,
             )
 
         return AckResponse(status="ok")
     except Exception as e:
         logger.error(f"Error adding messages for session {session_id}: {e}")
-        raise HTTPException(status_code=500, detail="Internal server error")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
 
 
 @router.delete("/sessions/{session_id}/memory", response_model=AckResponse)
@@ -252,5 +255,4 @@ async def delete_memory(
         return AckResponse(status="ok")
     except Exception as e:
         logger.error(f"Error deleting memory for session {session_id}: {e}")
-        raise
-        raise HTTPException(status_code=500, detail="Internal server error")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
diff --git a/models.py b/models.py
@@ -18,6 +18,12 @@ class MemoryMessage(BaseModel):
 
     role: str
     content: str
+    topics: list[str] = Field(
+        default_factory=list, description="List of topics associated with this message"
+    )
+    entities: list[str] = Field(
+        default_factory=list, description="List of entities mentioned in this message"
+    )
 
 
 class MemoryMessagesAndContext(BaseModel):
diff --git a/pyproject.toml b/pyproject.toml
@@ -21,7 +21,7 @@ target-version = "py312"
 # Enable various rules
 select = ["E", "F", "B", "I", "N", "UP", "C4", "RET", "SIM", "TID"]
 # Exclude COM812 which conflicts with the formatter
-ignore = ["COM812", "E501"]
+ignore = ["COM812", "E501", "B008"]
 
 # Allow unused variables when underscore-prefixed
 dummy-variable-rgx = "^(_+|(_+[a-zA-Z0-9_]*[a-zA-Z0-9]+?))$"
diff --git a/summarization.py b/summarization.py
@@ -1,10 +1,12 @@
+import json
 import logging
 
 import tiktoken
 from redis.asyncio import Redis
 
 from models import (
     AnthropicClientWrapper,
+    MemoryMessage,
     OpenAIClientWrapper,
     get_model_config,
 )
@@ -36,7 +38,7 @@ async def _incremental_summary(
     messages_joined = "\n".join(messages)
     prev_summary = context or ""
 
-    # Prompt template for progressive summarization (from langchain)
+    # Prompt template for progressive summarization
     progressive_prompt = f"""
 Progressively summarize the lines of conversation provided, adding onto the previous summary returning a new summary. If the lines are meaningless just return NONE
 
@@ -110,9 +112,20 @@ async def handle_compaction(
         pipe.get(context_key)
         results = await pipe.execute()
 
-        messages = results[0]
+        messages_raw = results[0]
         context = results[1]
 
+        # Parse messages
+        messages = []
+        for msg_raw in messages_raw:
+            if isinstance(msg_raw, bytes):
+                msg_raw = msg_raw.decode("utf-8")
+            msg_dict = json.loads(msg_raw)
+            messages.append(MemoryMessage(**msg_dict))
+
+        # Get context string
+        context_str = context.decode("utf-8") if isinstance(context, bytes) else context
+
         # Get model configuration for token limits
         model_config = get_model_config(model)
 
@@ -124,22 +137,19 @@ async def handle_compaction(
         buffer_tokens = 230
         max_message_tokens = max_tokens - summary_max_tokens - buffer_tokens
 
-        # Initialize encoding (currently uses OpenAI's tokenizer, but could be extended for different models)
+        # Initialize encoding
         encoding = tiktoken.get_encoding("cl100k_base")
 
         # Check token count of messages
         total_tokens = 0
         messages_to_summarize = []
 
         for msg in messages:
-            # Decode message if needed
-            if isinstance(msg, bytes):
-                msg = msg.decode("utf-8")
-
-            msg_tokens = len(encoding.encode(msg))
+            msg_str = json.dumps(msg.model_dump())
+            msg_tokens = len(encoding.encode(msg_str))
             if total_tokens + msg_tokens <= max_message_tokens:
                 total_tokens += msg_tokens
-                messages_to_summarize.append(msg)
+                messages_to_summarize.append(msg_str)
 
         # Skip if no messages to summarize
         if not messages_to_summarize:
@@ -150,7 +160,7 @@ async def handle_compaction(
         summary, _ = await _incremental_summary(
             model,
             client,
-            context.decode("utf-8") if isinstance(context, bytes) else context,
+            context_str,
             messages_to_summarize,
         )
 
diff --git a/tests/test_api.py b/tests/test_api.py
@@ -9,7 +9,7 @@
     RedisearchResult,
     SearchResults,
 )
-from reducers import handle_compaction
+from summarization import handle_compaction
 
 
 @pytest.fixture
diff --git a/tests/test_models.py b/tests/test_models.py
@@ -23,10 +23,36 @@ def test_memory_message(self):
         msg = MemoryMessage(role="user", content="Hello, world!")
         assert msg.role == "user"
         assert msg.content == "Hello, world!"
+        assert msg.topics == []  # Check default empty list
+        assert msg.entities == []  # Check default empty list
 
         # Test serialization
         data = msg.model_dump()
-        assert data == {"role": "user", "content": "Hello, world!"}
+        assert data == {
+            "role": "user",
+            "content": "Hello, world!",
+            "topics": [],
+            "entities": [],
+        }
+
+        # Test with topics and entities
+        msg_with_metadata = MemoryMessage(
+            role="user",
+            content="Hello, world!",
+            topics=["greeting", "general"],
+            entities=["world"],
+        )
+        assert msg_with_metadata.topics == ["greeting", "general"]
+        assert msg_with_metadata.entities == ["world"]
+
+        # Test serialization with metadata
+        data = msg_with_metadata.model_dump()
+        assert data == {
+            "role": "user",
+            "content": "Hello, world!",
+            "topics": ["greeting", "general"],
+            "entities": ["world"],
+        }
 
     def test_memory_messages_and_context(self):
         """Test MemoryMessagesAndContext model"""
diff --git a/tests/test_summarization.py b/tests/test_summarization.py
diff --git a/utils.py b/utils.py

Original file line number	Diff line number	Diff line change
`@@ -9,7 +9,7 @@`
`9`	`9`	`RedisearchResult,`
`10`	`10`	`SearchResults,`
`11`	`11`	`)`
`12`		`-from reducers import handle_compaction`
	`12`	`+from summarization import handle_compaction`
`13`	`13`
`14`	`14`
`15`	`15`	`@pytest.fixture`