ReMe/README_ZH.md at main · ChasFX/ReMe

面向智能体的记忆管理工具包，Remember Me, Refine Me.

老版本请参阅 0.2.x 版本文档

🧠 ReMe 是一个专为 AI 智能体 打造的记忆管理框架，同时提供基于文件系统和基于向量库的记忆系统。

它解决智能体记忆的两类核心问题：上下文窗口有限（长对话时早期信息被截断或丢失）、会话无状态（新对话无法继承历史，每次从零开始）。

ReMe 让智能体拥有真正的记忆力——旧对话自动浓缩，重要信息持久保存，下次对话自动想起来。

📁 基于文件的记忆系统

记忆即文件，文件即记忆

将记忆视为文件——可读、可编辑、可复制。 CoPaw通过继承 ReMeLight 实现了长期记忆和上下文的管理。

传统记忆系统	File Based ReMe
🗄️ 数据库存储	📝 Markdown 文件
🔒 不可见	👀 随时可读
❌ 难修改	✏️ 直接编辑
🚫 难迁移	📦 复制即迁移

working_dir/
├── MEMORY.md              # 长期记忆：用户偏好、项目配置等持久信息
├── memory/
│   └── YYYY-MM-DD.md      # 每日摘要日志：对话结束后自动写入
└── tool_result/           # 超长工具输出缓存（自动管理，超期自动清理）
    └── <uuid>.txt

核心能力

ReMeLight 是该记忆系统的核心类，为 AI Agent 提供完整的记忆管理能力：

方法	功能	关键组件
`start`	🚀 启动记忆系统	初始化文件存储、文件监控、Embedding 缓存；清理过期工具结果文件
`close`	📕 关闭并清理	清理工具结果文件、停止文件监控、保存 Embedding 缓存
`compact_memory`	📦 压缩历史对话为摘要	Compactor — ReActAgent 生成结构化上下文检查点
`summary_memory`	📝 将重要记忆写入文件	Summarizer — ReActAgent + 文件工具（read / write / edit）
`compact_tool_result`	✂️ 压缩超长工具输出	ToolResultCompactor — 截断并转存到 `tool_result/`，消息中保留文件引用
`memory_search`	🔍 语义搜索记忆	MemorySearch — 向量 + BM25 混合检索
`get_in_memory_memory`	🗂️ 创建会话内存实例	ReMeInMemoryMemory — Token 感知的内存管理，支持压缩摘要和状态序列化

🚀 快速开始

安装

pip install -U reme-ai[light]

环境变量

ReMeLight 环境变量配置 Embedding 和存储后端

Variable	Description	Example
`LLM_API_KEY`	LLM API key	`sk-xxx`
`LLM_BASE_URL`	LLM base URL	`https://dashscope.aliyuncs.com/compatible-mode/v1`
`EMBEDDING_API_KEY`	Embedding API key	`sk-xxx`
`EMBEDDING_BASE_URL`	Embedding base URL	`https://dashscope.aliyuncs.com/compatible-mode/v1`
`LLM_MODEL_NAME`	LLM model name	`qwen3.5-plus`

Python使用

import asyncio

from agentscope.message import Msg
from reme.reme_light import ReMeLight


async def main():
    reme = ReMeLight(
        working_dir=".reme",  # 记忆文件存储目录
        max_input_length=128000,  # 模型上下文窗口（tokens）
        memory_compact_ratio=0.7,  # 达到 max_input_length * 0.7 时触发压缩
        language="zh",  # 摘要语言（zh / ""）
        tool_result_threshold=1000,  # 超过此字符数的工具输出自动转存
        retention_days=7,  # tool_result/ 文件保留天数
    )
    await reme.start()

    messages = [...]

    # 1. 压缩超长工具输出（防止工具结果撑爆上下文）
    messages = await reme.compact_tool_result(messages)

    # 2. 将历史对话压缩为结构化摘要（触发时机：上下文接近上限），可传入上轮摘要，实现增量更新
    summary = await reme.compact_memory(messages=messages, previous_summary="")

    # 3. 后台异步提交摘要任务（不阻塞对话，摘要写入 memory/YYYY-MM-DD.md）
    reme.add_async_summary_task(messages=messages)

    # 4. 语义搜索记忆（向量 + BM25 混合检索）
    result = await reme.memory_search(query="Python 版本偏好", max_results=5)

    # 5. 获取会话内存实例（ReMeInMemoryMemory，管理单次对话的上下文）AgentScope InMemoryMemory
    memory = reme.get_in_memory_memory()
    token_stats = await memory.estimate_tokens()
    print(f"当前上下文使用率: {token_stats['context_usage_ratio']:.1f}%")
    print(f"消息 Token 数: {token_stats['messages_tokens']}")
    print(f"预估总 Token 数: {token_stats['estimated_tokens']}")

    # 6. 关闭前等待后台任务完成
    summary_result = await reme.await_summary_tasks()

    # 关闭 ReMeLight
    await reme.close()


if __name__ == "__main__":
    asyncio.run(main())

基于文件的 ReMeLight 记忆系统架构

CoPaw MemoryManager 继承 ReMeLight，将记忆能力集成到 Agent 推理流程中：

graph TB
    CoPaw["CoPaw MemoryManager\n(继承 ReMeLight)"] -->|pre_reasoning hook| Hook[MemoryCompactionHook]
    CoPaw --> ReMeLight[ReMeLight]
    Hook -->|超出阈值| ReMeLight
    ReMeLight --> CompactMemory[compact_memory\n历史对话压缩]
    ReMeLight --> SummaryMemory[summary_memory\n记忆写入文件]
    ReMeLight --> CompactToolResult[compact_tool_result\n超长工具输出压缩]
    ReMeLight --> MemSearch[memory_search\n语义搜索]
    ReMeLight --> InMemory[get_in_memory_memory\nReMeInMemoryMemory]
    CompactMemory --> Compactor[Compactor\nReActAgent]
    SummaryMemory --> Summarizer[Summarizer\nReActAgent + 文件工具]
    CompactToolResult --> ToolResultCompactor[ToolResultCompactor\n截断 + 转存文件]
    Summarizer --> FileIO[FileIO\nread / write / edit]
    FileIO --> MemoryFiles[memory/YYYY-MM-DD.md]
    ToolResultCompactor --> ToolResultFiles[tool_result/*.txt]
    MemoryFiles -.->|文件变更| FileWatcher[异步文件监控]
    FileWatcher -->|更新索引| FileStore[本地数据库]
    MemSearch --> FileStore

上下文压缩机制

上下文压缩

Compactor 使用 ReActAgent 将历史对话压缩为结构化的上下文检查点：

字段	说明
`## Goal`	🎯 用户要完成的目标（可多项）
`## Constraints`	⚙️ 用户提到的约束和偏好
`## Progress`	📈 已完成 / 进行中 / 阻塞的任务
`## Key Decisions`	🔑 做出的决策及简短理由
`## Next Steps`	🗺️ 下一步行动计划（有序列表）
`## Critical Context`	📌 文件路径、函数名、错误信息等关键数据

支持增量更新：传入 previous_summary 时，自动将新对话与旧摘要合并，保留历史进展。

工具结果压缩

ToolResultCompactor 解决工具输出过长（比如 browser use）导致上下文膨胀的问题：

graph LR
    A[tool_result 消息] --> B{内容长度 > threshold?}
    B -->|否| C[保留原样]
    B -->|是| D[截断到 threshold 字符]
    D --> E[完整内容写入 tool_result/uuid.txt]
    E --> F[消息中追加文件引用路径]

过期文件（超过 retention_days）在 start / close / compact_tool_result 时自动清理。

记忆总结：ReAct + 文件工具

Summarizer 采用 ReAct + 文件工具 模式，让 AI 自主决定写什么、写到哪：

graph LR
    A[接收对话] --> B{思考: 有什么值得记录?}
    B --> C[行动: read memory/YYYY-MM-DD.md]
    C --> D{思考: 如何与现有内容合并?}
    D --> E[行动: edit 更新文件]
    E --> F{思考: 还有遗漏吗?}
    F -->|是| B
    F -->|否| G[完成]

FileIO 提供文件操作工具集：

工具	功能	使用场景
`read`	读取文件内容（支持行范围）	查看现有记忆，避免重复写入
`write`	覆盖写入文件	创建新记忆文件或大幅重构
`edit`	精确匹配后替换	追加新内容或修改特定段落

会话内存管理

ReMeInMemoryMemory 扩展了 AgentScope 的 InMemoryMemory：

功能	说明
`get_memory`	按标记过滤消息，自动在头部追加压缩摘要
`estimate_tokens`	精确估算当前上下文 Token 用量及使用率
`get_history_str`	生成人类可读的对话历史摘要（含 Token 统计）
`state_dict` / `load_state_dict`	支持状态序列化 / 反序列化（会话持久化）
`mark_messages_compressed`	标记消息为已压缩状态
`get_compressed_summary`	获取已压缩的摘要内容

记忆检索

MemorySearch 提供向量 + BM25 混合检索能力：

检索方式	优势	劣势
向量语义	捕捉意义相近但措辞不同的内容	对精确 token 匹配较弱
BM25 全文	精确 token 命中效果极佳	无法理解同义词和改写

融合机制：两路召回后按权重加权求和（向量 0.7 + BM25 0.3），自然语言与精确查找均可命中。

graph LR
    Q[搜索查询] --> V[向量搜索 × 0.7]
Q --> B[BM25 × 0.3]
V --> M[去重 + 加权融合]
B --> M
M --> R[Top-N 结果]

🗃️ 基于向量库的记忆系统

ReMe Vector Based 是基于向量库的记忆系统核心类，支持三种记忆类型的统一管理：

记忆类型	用途	使用场景
个人记忆	记录用户偏好、习惯	`user_name`
任务/程序性记忆	记录任务执行经验、成功/失败模式	`task_name`
工具记忆	记录工具使用经验、参数优化	`tool_name`

核心能力

方法	功能	说明
`summarize_memory`	🧠 记忆总结	从对话中自动提取并存储记忆
`retrieve_memory`	🔍 记忆检索	根据查询检索相关记忆
`add_memory`	➕ 添加记忆	手动添加记忆到向量库
`get_memory`	📖 获取记忆	通过 ID 获取单条记忆
`update_memory`	✏️ 更新记忆	更新已有记忆的内容或元数据
`delete_memory`	🗑️ 删除记忆	删除指定记忆
`list_memory`	📋 列出记忆	列出某类记忆，支持过滤和排序

安装

pip install -U reme-ai

环境变量

API 密钥通过环境变量设置，可写在项目根目录的 .env 文件中：

环境变量	说明	示例
`LLM_API_KEY`	LLM 的 API Key	`sk-xxx`
`LLM_BASE_URL`	LLM 的 Base URL	`https://dashscope.aliyuncs.com/compatible-mode/v1`
`EMBEDDING_API_KEY`	Embedding 的 API Key	`sk-xxx`
`EMBEDDING_BASE_URL`	Embedding 的 Base URL	`https://dashscope.aliyuncs.com/compatible-mode/v1`

Python使用

import asyncio

from reme import ReMe


async def main():
    # 初始化 ReMe
    reme = ReMe(
        working_dir=".reme",
        default_llm_config={
            "backend": "openai",
            "model_name": "qwen3.5-plus",
        },
        default_embedding_model_config={
            "backend": "openai",
            "model_name": "text-embedding-v4",
            "dimensions": 1024,
        },
        default_vector_store_config={
            "backend": "local",  # 支持 local/chroma/qdrant/elasticsearch
        },
    )
    await reme.start()

    messages = [
        {"role": "user", "content": "帮我写一个 Python 脚本", "time_created": "2026-02-28 10:00:00"},
        {"role": "assistant", "content": "好的，我来帮你写", "time_created": "2026-02-28 10:00:05"},
    ]

    # 1. 从对话中总结记忆（自动提取用户偏好、任务经验等）
    result = await reme.summarize_memory(
        messages=messages,
        user_name="alice",  # 个人记忆
        # task_name="code_writing",  # 任务记忆
    )
    print(f"总结结果: {result}")

    # 2. 检索相关记忆
    memories = await reme.retrieve_memory(
        query="Python 编程",
        user_name="alice",
        # task_name="code_writing",
    )
    print(f"检索结果: {memories}")

    # 3. 手动添加记忆
    memory_node = await reme.add_memory(
        memory_content="用户喜欢简洁的代码风格",
        user_name="alice",
    )
    print(f"添加的记忆: {memory_node}")
    memory_id = memory_node.memory_id

    # 4. 通过 ID 获取单条记忆
    fetched_memory = await reme.get_memory(memory_id=memory_id)
    print(f"获取的记忆: {fetched_memory}")

    # 5. 更新记忆内容
    updated_memory = await reme.update_memory(
        memory_id=memory_id,
        user_name="alice",
        memory_content="用户喜欢简洁且带注释的代码风格",
    )
    print(f"更新后的记忆: {updated_memory}")

    # 6. 列出用户的所有记忆（支持过滤和排序）
    all_memories = await reme.list_memory(
        user_name="alice",
        limit=10,
        sort_key="time_created",
        reverse=True,
    )
    print(f"用户记忆列表: {all_memories}")

    # 7. 删除指定记忆
    await reme.delete_memory(memory_id=memory_id)
    print(f"已删除记忆: {memory_id}")

    # 8. 删除所有记忆（谨慎使用）
    # await reme.delete_all()

    await reme.close()


if __name__ == "__main__":
    asyncio.run(main())

技术架构

graph TB
    User[用户 / Agent] --> ReMe[Vector Based ReMe]
    ReMe --> Summarize[记忆总结]
    ReMe --> Retrieve[记忆检索]
    ReMe --> CRUD[增删改查]
    Summarize --> PersonalSum[PersonalSummarizer]
    Summarize --> ProceduralSum[ProceduralSummarizer]
    Summarize --> ToolSum[ToolSummarizer]
    Retrieve --> PersonalRet[PersonalRetriever]
    Retrieve --> ProceduralRet[ProceduralRetriever]
    Retrieve --> ToolRet[ToolRetriever]
    PersonalSum --> VectorStore[向量数据库]
    ProceduralSum --> VectorStore
    ToolSum --> VectorStore
    PersonalRet --> VectorStore
    ProceduralRet --> VectorStore
    ToolRet --> VectorStore

⭐ 社区与支持

Star 与 Watch：Star 可让更多智能体开发者发现 ReMe；Watch 可助你第一时间获知新版本与特性。
分享你的成果：在 Issue 或 Discussion 中分享 ReMe 为你的智能体解锁了什么——我们非常乐意展示社区的优秀案例。
需要新功能？ 提交 Feature Request，我们将与社区一起完善。
代码贡献：欢迎任何形式的代码贡献，请参阅贡献指南。
致谢：感谢 OpenClaw、Mem0、MemU、CoPaw 等优秀的开源项目，为项目带来诸多启发与帮助。

📄 引用

@software{AgentscopeReMe2025,
  title = {AgentscopeReMe: Memory Management Kit for Agents},
  author = {ReMe Team},
  url = {https://reme.agentscope.io},
  year = {2025}
}

⚖️ 许可证

本项目基于 Apache License 2.0 开源，详情参见 LICENSE 文件。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

📁 基于文件的记忆系统

核心能力

🚀 快速开始

安装

环境变量

Python使用

基于文件的 ReMeLight 记忆系统架构

上下文压缩机制

上下文压缩

工具结果压缩

记忆总结：ReAct + 文件工具

会话内存管理

记忆检索

🗃️ 基于向量库的记忆系统

核心能力

安装

环境变量

Python使用

技术架构

⭐ 社区与支持

📄 引用

⚖️ 许可证

📈 Star 历史

FilesExpand file tree

README_ZH.md

Latest commit

History

README_ZH.md

File metadata and controls

📁 基于文件的记忆系统

核心能力

🚀 快速开始

安装

环境变量

Python使用

基于文件的 ReMeLight 记忆系统架构

上下文压缩机制

上下文压缩

工具结果压缩

记忆总结：ReAct + 文件工具

会话内存管理

记忆检索

🗃️ 基于向量库的记忆系统

核心能力

安装

环境变量

Python使用

技术架构

⭐ 社区与支持

📄 引用

⚖️ 许可证

📈 Star 历史