Update mem_recall.md

yxlvbubu-prog · web-flow · commit ac9baba9384b · 2025-11-06T21:09:24.000+08:00
diff --git a/content/cn/overview/quick_start/mem_recall.md b/content/cn/overview/quick_start/mem_recall.md
@@ -1,262 +1,28 @@
 ---
-title: 记忆召回和指令补全
-desc: 在 MemOS 中，记忆不仅仅是信息的存档，还要能够在需要时被动态取用，并转化为可执行的输入。这一过程由两个紧密衔接的环节完成：记忆召回 与 指令补全。
+title: 记忆召回
+desc: 在 MemOS 中，记忆不仅仅是信息的存档，还要能够在需要时被动态取用，并转化为可执行的输入。
 ---
 
 ## 1. 能力介绍
 
-### 1.1 记忆召回
-
 记忆召回负责在用户发起新请求时，快速检索出与任务最相关的记忆片段。
 
 *   **作用**：确保模型在生成回答时，不是“从零开始”，而是结合用户历史、偏好、上下文。
     
-*   **返回结果**：召回的内容以明文事实形式呈现
+*   **返回结果**：召回的内容以事实+偏好两种形式呈现
     
     *   可溯源：每条记忆均附带来源、时间戳和置信度。
         
     *   高可控：开发者可以完全掌握哪些记忆进入下游逻辑。
-
-
-### 1.2 指令补全（敬请期待）
-
-需要注意的是，“事实”并不等于“指令”。开发者若只得到明文记忆，还需要额外写规则，才能将这些信息转译成大模型能直接执行的 Prompt。
-
-:::note
-**指令补全的作用，** 就是在召回结果的基础上，自动生成不同粒度的指令
-:::
-
-*   **在多数系统里，开发者只能拿到“记忆事实”，然后自己拼接 Prompt。但这会遇到几个痛点：**
-    
-    *   任务感知：同一条记忆，在不同任务下需要不同表述；
-        
-    *   个性化偏好：用户风格、习惯需要被即时补齐；
-        
-    *   动态优化：不同模型对 Prompt 的最优写法不同；
-        
-    *   高效压缩：需要去除冗余，降低 token 消耗。
-
-      
-<br>
-
-*   **MemOS 的指令补全帮开发者完成这部分“最后一公里”的工作：**
-    
-    *   省去规则拼接和调优成本；
-        
-    *   确保召回的记忆能被真正有效利用；
-        
-    *   提供 matches / instruction / full\_instruction 三种模式，满足不同程度的控制需求。
-        
-        *   记忆事实（matchs）：召回当前Query的相关记忆
-            
-        *   半成品指令（instruction）：将召回的记忆与用户当前问题拼接，形成基础 Prompt，开发者可在此之上继续添加业务逻辑。
-            
-        *   完整指令（full\_instruction）：在半成品的基础上，结合上下文、偏好、合规约束等，生成可直接下发给模型的终端 Prompt。
-            
-
-<br>
-
-:::note
-指令补全由 **离线链路** 与 **实时链路** 共同作用
-:::
-
-| **链路** | **说明** |
-| --- | --- |
-| **离线链路**（沉淀与准备） |    抽取用户偏好，形成档案。<br>    <br>  构建 few-shot 样例库。<br>    <br>   固化品牌、合规、风格等长期规则。 |
-| **实时链路**（动态决策） |    根据任务意图，选择当前要启用的记忆与模板。<br>    <br>   裁决冲突（如“喜欢诗经开头” vs “要求简洁”）。<br>    <br>   根据 token 预算和模型特性，做压缩与降级。 |
-
-
-## 2. 案例（需待指令补全上线）——AI教育中的个性化辅导
-
-### 2.1 历史对话输入（原始材料）
-
-```json
-2025-06-10
-  学生：老师你好我叫小明，今年初三  
-  老师：你好小明，很高兴认识你
-  ……
-
-2025-08-01
-  学生：老师，这题我总算不出来，能不能讲清楚点？  
-  老师：好的，我会一步一步给你解释。 
-  ……
-
-2025-09-03
-  ……
-  学生：你刚刚讲得太长了，我有点跟不上。能不能简单一点？  
-  老师：行，那我用更简短的方法告诉你。
-  ……
-
-2025-10-09
-  学生：我还是分不清一次函数和二次函数……  
-  老师：一次函数的图像是直线，二次函数是抛物线，你要记住这个区别。
-  ……
-```
-
-### 2.2 MemOS指令偏好建模（离线链路）
-
-*   **偏好抽取**
-    
-    *   喜欢分步骤讲解（来自“能不能一步一步讲”）。
-        
-    *   偏好简洁（来自“你刚刚讲得太长了”）。
-        
-    *   容易混淆相似概念（来自“我还是分不清一次函数和二次函数”）
-        
-*   **few-shot 挑选**：挑出带分步骤、简洁解释、概念澄清的对话。
-    
-*   **策略总结**：总结为“分步骤 + 简洁 + 澄清常见混淆”。
-    
-
-```yaml
-user_teaching_template_u123:
-  audience: "初三学生"
-  task: "解答数学题"
-  structure:
-    - "分步骤讲解（3–4 步）"
-    - "必要时先纠正一次函数与二次函数的混淆"
-  constraints:
-    - "讲解简洁，不要太长"
-    - "重点突出，避免大段公式推导"
-
-fewshot_examples_u123:
-  - id: "fs-step-01"
-    user: "老师，这题我总算不出来，能不能讲清楚点？"
-    assistant: "好的，我会一步一步给你解释……"
-    tag: "分步骤讲解"
-
-  - id: "fs-brief-02"
-    user: "你刚刚讲得太长了，我有点跟不上。能不能简单一点？"
-    assistant: "行，那我用更简短的方法告诉你……"
-    tag: "简洁表达"
-
-  - id: "fs-contrast-03"
-    user: "我还是分不清一次函数和二次函数……"
-    assistant: "一次函数的图像是直线，二次函数是抛物线，你要记住这个区别……"
-    tag: "概念澄清"
-```
-
-### 2.3 实时链路（指令补全）
-
-:::note{icon="ri:message-2-line"}
-用户提问【老师，你能教我解一下这个题吗？2x² - 3x - 5 = 0】
-:::
-
-*   **召回记忆matches：** 只返回事实，未加工。开发者需要自行拼接 Prompt、决定如何引导学生解题。
-    
-
-```yaml
-matches:
-  - value: "初三学生"
-    score: 0.95
-    source: "对话记录#2025-06-10"
-    
-  - value: "偏好分步骤讲解"
-    score: 0.94
-    source: "对话记录#2025-08-01"
-    
-  - value: "喜欢简洁的解释"
-    score: 0.92
-    source: "对话记录#2025-09-03"
-    
-  - value: "分不清一次函数和二次函数概念"
-    score: 0.90
-    source: "对话记录#2025-10-09"
-
-user_query: "老师，你能教我解一下这个题吗？2x² - 3x - 5 = 0"
-```
-
-<br>
-
-*   **半成品指令 instruction：** 将事实转译成结构化要求：任务 / 受众 / 步骤 / 限制
-    
-
-```yaml
-instruction: |
-  任务：帮学生解答二次函数题目  
-  受众：初三学生  
-  要求：  
-  - 分 3–4 步讲解  
-  - 在讲解过程中纠正一次函数/二次函数的常见混淆  
-  - 保持简洁，避免冗长推导  
-  备注：如题目不完整，请先提出澄清问题
-
-user_query: "老师，你能教我解一下这个题吗？2x² - 3x - 5 = 0"
-```
-
-<br>
-
-*   **完整指令 full\_instruction：** 在半成品基础上进一步加工
+ 
+*   **特点**：
     
-    *   将“常混淆”转化为具体教学动作（在讲解时必须强调二次函数与一次函数的区别）
-        
-    *   把“分步骤讲解”的偏好转译为明确的解题方式（用分步骤的形式进行说明）
-        
-    *   将“初三学生”改写为教学场景中的角色关系（你是一名初三学生的数学老师）
+    *   无感召回：用户无需重复说明自己之前的选择或偏好
         
-    *   从历史对话中挑选 few-shot 示例，补充到最终指令中，帮助模型更好学习解题和澄清的模式
-        
-
-> 半成品偏结构化，方便开发者二次加工；完整指令偏自然语言，更贴近模型直接执行。
-
-```yaml
-final_prompt_to_model:
-  - role: system
-    content: |
-      你是一名初三学生的数学老师。  
-      学生在学习时经常把一次函数和二次函数混淆，且更喜欢简洁、分步骤的讲解。  
-      请参考以下历史示例的风格：  
-
-      【示例 1】  
-      学生：老师，这题我总算不出来，能不能讲清楚点？  
-      老师：好的，我会一步一步给你解释。  
-
-      【示例 2】  
-      学生：你刚刚讲得太长了，我有点跟不上。能不能简单一点？  
-      老师：行，那我用更简短的方法告诉你。  
-
-      【示例 3】  
-      学生：我还是分不清一次函数和二次函数……  
-      老师：一次函数的图像是直线，二次函数是抛物线，你要记住这个区别。  
-
-      现在请回答学生问题：“解 2x² - 3x - 5 = 0”。  
-      要求：  
-      - 用分步骤方式解题（3–4 步）；  
-      - 在讲解中指出一次函数与二次函数的区别；  
-      - 保持答案简洁清晰，避免冗长推导；  
-      - 如果题目信息不足，请先提出澄清问题。
-  - role: user
-    content: "老师，你能教我解一下这个题吗？2x² - 3x - 5 = 0"
-```
-> 案例总结：在“初三学生解二次函数”的场景中，指令补全相比只返回原始记忆有如下增益
-
-*   **从事实到可执行**
-    
-
-    *   原始记忆只有“学生常混淆二次函数和一次函数”，开发者需要自己转化为教学动作。
-    
-    *   指令补全直接生成“讲解时必须强调关键区别”，避免开发者额外写规则。
-    
-*   **上下文融合**
-    
-    *   原始记忆是零散片段，开发者要自己判断如何放进 Prompt。
-    
-    *   指令补全自动把记忆和用户问题融合成一个连贯的任务描述，模型可直接使用。
-    
-*   **优化与裁剪**
-    
-    *   如果开发者直接拼接记忆，结果往往冗余或冲突。
- 
-    *   指令补全自动压缩为简洁的步骤要求，减少 token 消耗，也提升回答聚焦度。
-
-*   **健壮性保障**
-
-    *   开发者如果只拿到记忆，还得考虑“题目不完整怎么办”。
-  
-    *   指令补全内置了澄清策略，让输出更稳健，无需开发者重复造轮子。
+    *   结构化输出：区分事实 / 偏好，便于开发者控制是否注入
 
 
-## 3. 进阶：如果你想做深度定制
+## 2. 进阶：如果你想做深度定制
 
 在 MemOS 中，召回与补全的实现方式并非单一路径，而是由多种策略与组件组合完成。不同场景可能需要不同的配置，本节列出主要环节与可定制点，供你根据业务需要灵活选择。
 
@@ -275,13 +41,13 @@ final_prompt_to_model:
 |  | A/B 测试 | 同时运行两套拼接模板，比较用户满意度差异 |
 
 
-## 4. 下一步行动
+## 3. 下一步行动
 
 了解MemOS更多核心能力
 
 *   [记忆生命周期管理](/overview/quick_start/mem_lifecycle)
     
 
-## 5. 联系我们
+## 4. 联系我们
 
 <img src="https://cdn.memtensor.com.cn/img/1758685658684_nbhka4_compressed.png" alt="image" style="width:70%;">