fix: remove unsed change

fridayL · fridayL · commit df8199ff6516 · 2025-07-23T02:15:05.000Z
diff --git a/src/memos/mem_os/product.py b/src/memos/mem_os/product.py
@@ -679,57 +679,6 @@ def get_suggestion_query(self, user_id: str, language: str = "zh") -> list[str]:
         response_json = json.loads(clean_response)
         return response_json["query"]
 
-    def chat(
-        self,
-        query: str,
-        user_id: str,
-        cube_id: str | None = None,
-        history: MessageList | None = None,
-    ) -> Generator[str, None, None]:
-        """Chat with LLM SSE Type.
-        Args:
-            query (str): Query string.
-            user_id (str): User ID.
-            cube_id (str, optional): Custom cube ID for user.
-            history (list[dict], optional): Chat history.
-
-        Returns:
-            Generator[str, None, None]: The response string generator.
-        """
-        # Use MOSCore's built-in validation
-        if cube_id:
-            self._validate_cube_access(user_id, cube_id)
-        else:
-            self._validate_user_exists(user_id)
-
-        # Load user cubes if not already loaded
-        self._load_user_cubes(user_id, self.default_cube_config)
-        time_start = time.time()
-        memories_list = super().search(query, user_id)["text_mem"]
-        # Get response from parent MOSCore (returns string, not generator)
-        response = super().chat(query, user_id)
-        time_end = time.time()
-
-        # Use tiktoken for proper token-based chunking
-        for chunk in self._chunk_response_with_tiktoken(response, chunk_size=5):
-            chunk_data = f"data: {json.dumps({'type': 'text', 'content': chunk})}\n\n"
-            yield chunk_data
-
-        # Prepare reference data
-        reference = []
-        for memories in memories_list:
-            memories_json = memories.model_dump()
-            memories_json["metadata"]["ref_id"] = f"[{memories.id.split('-')[0]}]"
-            memories_json["metadata"]["embedding"] = []
-            memories_json["metadata"]["sources"] = []
-            reference.append(memories_json)
-
-        yield f"data: {json.dumps({'type': 'reference', 'content': reference})}\n\n"
-        total_time = round(float(time_end - time_start), 1)
-
-        yield f"data: {json.dumps({'type': 'time', 'content': {'total_time': total_time, 'speed_improvement': '23%'}})}\n\n"
-        yield f"data: {json.dumps({'type': 'end'})}\n\n"
-
     def chat_with_references(
         self,
         query: str,
@@ -768,6 +717,8 @@ def chat_with_references(
             self._register_chat_history(user_id)
 
         chat_history = self.chat_history_manager[user_id]
+        if history:
+            chat_history.chat_history = history[-10:]
         current_messages = [
             {"role": "system", "content": system_prompt},
             *chat_history.chat_history,
@@ -853,15 +804,12 @@ def chat_with_references(
         yield f"data: {json.dumps({'type': 'reference', 'data': reference})}\n\n"
         total_time = round(float(time_end - time_start), 1)
         yield f"data: {json.dumps({'type': 'time', 'data': {'total_time': total_time, 'speed_improvement': '23%'}})}\n\n"
-        chat_history.chat_history.append({"role": "user", "content": query})
-        chat_history.chat_history.append({"role": "assistant", "content": full_response})
         self._send_message_to_scheduler(
             user_id=user_id, mem_cube_id=cube_id, query=query, label=QUERY_LABEL
         )
         self._send_message_to_scheduler(
             user_id=user_id, mem_cube_id=cube_id, query=full_response, label=ANSWER_LABEL
         )
-        self.chat_history_manager[user_id] = chat_history
 
         yield f"data: {json.dumps({'type': 'end'})}\n\n"
         self.add(
@@ -880,12 +828,6 @@ def chat_with_references(
             ],
             mem_cube_id=cube_id,
         )
-        # Keep chat history under 30 messages by removing oldest conversation pair
-        if len(self.chat_history_manager[user_id].chat_history) > 10:
-            self.chat_history_manager[user_id].chat_history.pop(0)  # Remove oldest user message
-            self.chat_history_manager[user_id].chat_history.pop(
-                0
-            )  # Remove oldest assistant response
 
     def get_all(
         self,