Feat/pref optimize update (#422)

Wang-Daoji · yuan.wang · web-flow · commit 25c7642d2331 · 2025-10-30T18:40:30.000+08:00
* add hybrid search and fine extractor

* add dialog and modify spliter chunk

* optmize the update and retriever code

* modify pref field

* add pref mem update srategy

* add pref mem update srategy

* fix bug in pre_commit

* modify pref filed

* fix bug

* fix pre_commit

---------

Co-authored-by: yuan.wang &lt;yuan.wang@yuanwangdebijibendiannao.local&gt;
diff --git a/evaluation/scripts/PrefEval/pref_memos.py b/evaluation/scripts/PrefEval/pref_memos.py
@@ -103,7 +103,7 @@ def search_memory_for_line(line_data, mem_client, top_k_value):
                 f"- {entry.get('memory', '')}"
                 for entry in relevant_memories["text_mem"][0]["memories"]
             )
-            + f"\n{relevant_memories['pref_string']}"
+            + f"\n{relevant_memories.get('pref_string', '')}"
         )
 
         memory_tokens_used = len(tokenizer.encode(memories_str))
diff --git a/evaluation/scripts/locomo/locomo_search.py b/evaluation/scripts/locomo/locomo_search.py
@@ -107,11 +107,11 @@ def memos_api_search(
 
     speaker_a_context = (
         "\n".join([i["memory"] for i in search_a_results["text_mem"][0]["memories"]])
-        + f"\n{search_a_results['pref_string']}"
+        + f"\n{search_a_results.get('pref_string', '')}"
     )
     speaker_b_context = (
         "\n".join([i["memory"] for i in search_b_results["text_mem"][0]["memories"]])
-        + f"\n{search_b_results['pref_string']}"
+        + f"\n{search_b_results.get('pref_string', '')}"
     )
 
     context = TEMPLATE_MEMOS.format(
diff --git a/evaluation/scripts/longmemeval/lme_search.py b/evaluation/scripts/longmemeval/lme_search.py
@@ -46,7 +46,7 @@ def memos_search(client, query, user_id, top_k):
     results = client.search(query=query, user_id=user_id, top_k=top_k)
     context = (
         "\n".join([i["memory"] for i in results["text_mem"][0]["memories"]])
-        + f"\n{results['pref_string']}"
+        + f"\n{results.get('pref_string', '')}"
     )
     context = MEMOS_CONTEXT_TEMPLATE.format(user_id=user_id, memories=context)
     duration_ms = (time() - start) * 1000
diff --git a/evaluation/scripts/personamem/pm_search.py b/evaluation/scripts/personamem/pm_search.py
@@ -81,8 +81,8 @@ def memos_search(client, user_id, query, top_k):
     start = time()
     results = client.search(query=query, user_id=user_id, top_k=top_k)
     search_memories = (
-            "\n".join(item["memory"] for cube in results["text_mem"] for item in cube["memories"])
-            + f"\n{results['pref_string']}"
+        "\n".join(item["memory"] for cube in results["text_mem"] for item in cube["memories"])
+        + f"\n{results.get('pref_string', '')}"
     )
     context = MEMOS_CONTEXT_TEMPLATE.format(user_id=user_id, memories=search_memories)
 
diff --git a/evaluation/scripts/utils/client.py b/evaluation/scripts/utils/client.py
@@ -182,7 +182,8 @@ def search(self, query, user_id, top_k):
                 "conversation_id": "",
                 "top_k": top_k,
                 "mode": os.getenv("SEARCH_MODE", "fast"),
-                "handle_pref_mem": False,
+                "include_preference": True,
+                "pref_top_k": 6,
             },
             ensure_ascii=False,
         )
@@ -344,9 +345,10 @@ def wait_for_completion(self, task_id):
     query = "杭州西湖有什么"
     top_k = 5
 
-    # MEMOBASE
-    client = MemobaseClient()
+    # MEMOS-API
+    client = MemosApiClient()
     for m in messages:
         m["created_at"] = iso_date
-    client.add(messages, user_id)
+    client.add(messages, user_id, user_id)
     memories = client.search(query, user_id, top_k)
+    print(memories)
diff --git a/src/memos/api/config.py b/src/memos/api/config.py
@@ -354,7 +354,7 @@ def get_preference_memory_config() -> dict[str, Any]:
         return {
             "backend": "pref_text",
             "config": {
-                "extractor_llm": {"backend": "openai", "config": APIConfig.get_openai_config()},
+                "extractor_llm": APIConfig.get_memreader_config(),
                 "vector_db": {
                     "backend": "milvus",
                     "config": APIConfig.get_milvus_config(),
diff --git a/src/memos/api/product_models.py b/src/memos/api/product_models.py
@@ -180,7 +180,8 @@ class APISearchRequest(BaseRequest):
     operation: list[PermissionDict] | None = Field(
         None, description="operation ids for multi cubes"
     )
-    handle_pref_mem: bool = Field(False, description="Whether to handle preference memory")
+    include_preference: bool = Field(True, description="Whether to handle preference memory")
+    pref_top_k: int = Field(6, description="Number of preference results to return")
 
 
 class APIADDRequest(BaseRequest):
diff --git a/src/memos/api/routers/server_router.py b/src/memos/api/routers/server_router.py
@@ -324,17 +324,18 @@ def _post_process_pref_mem(
     memories_result: list[dict[str, Any]],
     pref_formatted_mem: list[dict[str, Any]],
     mem_cube_id: str,
-    handle_pref_mem: bool,
+    include_preference: bool,
 ):
-    if handle_pref_mem:
+    if include_preference:
         memories_result["pref_mem"].append(
             {
                 "cube_id": mem_cube_id,
                 "memories": pref_formatted_mem,
             }
         )
-        pref_instruction: str = instruct_completion(pref_formatted_mem)
+        pref_instruction, pref_note = instruct_completion(pref_formatted_mem)
         memories_result["pref_string"] = pref_instruction
+        memories_result["pref_note"] = pref_note
 
     return memories_result
 
@@ -354,7 +355,7 @@ def search_memories(search_req: APISearchRequest):
         "act_mem": [],
         "para_mem": [],
         "pref_mem": [],
-        "pref_string": "",
+        "pref_note": "",
     }
 
     search_mode = search_req.mode
@@ -382,7 +383,7 @@ def _search_pref():
             return []
         results = naive_mem_cube.pref_mem.search(
             query=search_req.query,
-            top_k=search_req.top_k,
+            top_k=search_req.pref_top_k,
             info={
                 "user_id": search_req.user_id,
                 "session_id": search_req.session_id,
@@ -405,7 +406,10 @@ def _search_pref():
     )
 
     memories_result = _post_process_pref_mem(
-        memories_result, pref_formatted_memories, search_req.mem_cube_id, search_req.handle_pref_mem
+        memories_result,
+        pref_formatted_memories,
+        search_req.mem_cube_id,
+        search_req.include_preference,
     )
 
     return SearchResponse(
diff --git a/src/memos/templates/instruction_completion.py b/src/memos/templates/instruction_completion.py
@@ -6,7 +6,7 @@
 
 def instruct_completion(
     memories: list[dict[str, Any]] | None = None,
-) -> str:
+) -> [str, str]:
     """Create instruction following the preferences."""
     explicit_pref = []
     implicit_pref = []
@@ -49,10 +49,16 @@ def instruct_completion(
     lang = detect_lang(explicit_pref_str + implicit_pref_str)
 
     if not explicit_pref_str and not implicit_pref_str:
-        return ""
+        return "", ""
     if not explicit_pref_str:
-        return implicit_pref_str + "\n" + _prompt_map[lang].replace(_remove_exp_map[lang], "")
+        pref_note = _prompt_map[lang].replace(_remove_exp_map[lang], "")
+        pref_string = implicit_pref_str + "\n" + pref_note
+        return pref_string, pref_note
     if not implicit_pref_str:
-        return explicit_pref_str + "\n" + _prompt_map[lang].replace(_remove_imp_map[lang], "")
+        pref_note = _prompt_map[lang].replace(_remove_imp_map[lang], "")
+        pref_string = explicit_pref_str + "\n" + pref_note
+        return pref_string, pref_note
 
-    return explicit_pref_str + "\n" + implicit_pref_str + "\n" + _prompt_map[lang]
+    pref_note = _prompt_map[lang]
+    pref_string = explicit_pref_str + "\n" + implicit_pref_str + "\n" + pref_note
+    return pref_string, pref_note

Original file line number	Diff line number	Diff line change
`@@ -103,7 +103,7 @@ def search_memory_for_line(line_data, mem_client, top_k_value):`
`103`	`103`	`f"- {entry.get('memory', '')}"`
`104`	`104`	`for entry in relevant_memories["text_mem"][0]["memories"]`
`105`	`105`	`)`
`106`		`- + f"\n{relevant_memories['pref_string']}"`
	`106`	`+ + f"\n{relevant_memories.get('pref_string', '')}"`
`107`	`107`	`)`
`108`	`108`
`109`	`109`	`memory_tokens_used = len(tokenizer.encode(memories_str))`
Original file line number	Diff line number	Diff line change
`@@ -107,11 +107,11 @@ def memos_api_search(`
`107`	`107`
`108`	`108`	`speaker_a_context = (`
`109`	`109`	`"\n".join([i["memory"] for i in search_a_results["text_mem"][0]["memories"]])`
`110`		`- + f"\n{search_a_results['pref_string']}"`
	`110`	`+ + f"\n{search_a_results.get('pref_string', '')}"`
`111`	`111`	`)`
`112`	`112`	`speaker_b_context = (`
`113`	`113`	`"\n".join([i["memory"] for i in search_b_results["text_mem"][0]["memories"]])`
`114`		`- + f"\n{search_b_results['pref_string']}"`
	`114`	`+ + f"\n{search_b_results.get('pref_string', '')}"`
`115`	`115`	`)`
`116`	`116`
`117`	`117`	`context = TEMPLATE_MEMOS.format(`
Original file line number	Diff line number	Diff line change
`@@ -46,7 +46,7 @@ def memos_search(client, query, user_id, top_k):`
`46`	`46`	`results = client.search(query=query, user_id=user_id, top_k=top_k)`
`47`	`47`	`context = (`
`48`	`48`	`"\n".join([i["memory"] for i in results["text_mem"][0]["memories"]])`
`49`		`- + f"\n{results['pref_string']}"`
	`49`	`+ + f"\n{results.get('pref_string', '')}"`
`50`	`50`	`)`
`51`	`51`	`context = MEMOS_CONTEXT_TEMPLATE.format(user_id=user_id, memories=context)`
`52`	`52`	`duration_ms = (time() - start) * 1000`
Original file line number	Diff line number	Diff line change
`@@ -180,7 +180,8 @@ class APISearchRequest(BaseRequest):`
`180`	`180`	`operation: list[PermissionDict] \| None = Field(`
`181`	`181`	`None, description="operation ids for multi cubes"`
`182`	`182`	`)`
`183`		`- handle_pref_mem: bool = Field(False, description="Whether to handle preference memory")`
	`183`	`+ include_preference: bool = Field(True, description="Whether to handle preference memory")`
	`184`	`+ pref_top_k: int = Field(6, description="Number of preference results to return")`
`184`	`185`
`185`	`186`
`186`	`187`	`class APIADDRequest(BaseRequest):`