MS-Agent: 赋能智能体自主探索的轻量级框架

MCP Playground | Paper | Documentation | 中文文档

简介

MS-Agent是一个轻量级框架，旨在为智能体提供自主探索能力。它提供了灵活且可扩展的架构，允许开发者创建能够执行复杂任务的智能体，如代码生成、数据分析，以及基于MCP（模型调用协议）支持的通用工具调用。

特性

通用多智能体：基于MCP的工具调用能力与智能体聊天。
深度研究：启用自主探索和复杂任务执行的高级能力。
代码生成：支持复杂项目的代码生成任务。
短视频生成：支持5分钟左右的短视频生成。
Agent Skills：兼容Anthropic-Agent-Skills协议，实现智能体技能模块。
轻量级且可扩展：易于扩展和定制以适应各种应用。

历史存档版本，请参考：https://github.com/modelscope/ms-agent/tree/0.8.0

微信群

🎉 新闻

🎬 2025.11.13: 发布了“奇点放映室”，用于进行知识类文档的复杂场景短视频制作，具体查看这里
🚀 2025.11.12：发布MS-Agent v1.5.0，包含以下更新：
- 🔥 新增 FinResearch，支持金融领域的深度研究和分析
- 支持基于Akshare和Baostock的金融数据获取工具
- 支持以Dag形式编排工作流
- 优化DeepResearch稳定性与效率
- 官方文档：金融深度研究
- 魔搭创空间DEMO: FinResearchStudio
- 报告样例: FinResearchExamples
🚀 2025.11.07：发布MS-Agent v1.4.0，包含以下更新：
- 🔥 新增 MS-Agent Skills, 基于 Anthropic-Agent-Skills 协议实现.
- 🔥 新增中文文档和英文文档
- 🔥 支持沙箱框架 ms-enclave
🚀 2025.9.22：发布MS-Agent v1.3.0，包含以下更新：
- 🔥 支持Code Scratch
- 支持Memory用于构建具有长期和短期记忆的智能体
- 增强DeepResearch工作流
- 支持RAY加速文档信息提取
- 支持LLMs的Anthropic API格式
🚀 2025.8.28：发布MS-Agent v1.2.0，包含以下更新：
- DocResearch现在支持推送到ModelScope、HuggingFace、GitHub以便于分享研究报告。详情请参考Doc Research。
- DocResearch现在支持将Markdown报告导出为HTML、PDF、PPTX和DOCX格式，详情请参考Doc Research。
- DocResearch现在支持TXT文件处理和文件预处理，详情请参考Doc Research。
🚀 2025.7.31：发布MS-Agent v1.1.0，包含以下更新：

🔥 支持文档研究，演示：DocResearchStudio - 为智能洞察（DeepResearch）添加通用网络搜索引擎
- 为Agent与MCP聊天添加最大连续运行次数。

🚀 2025.7.18：发布MS-Agent v1.0.0，改进Agent与MCP聊天的体验，并更新智能洞察的说明文档。
🚀 2025.7.16：发布MS-Agent v1.0.0rc0，包含以下更新：
- 支持Agent与MCP（模型上下文协议）聊天
- 支持深度研究（智能洞察），参考：报告演示，脚本演示
- 支持MCP-Playground
- 为Agent聊天添加回调机制

归档

🔥🔥🔥2024年8月8日：Modelscope-Agent发布了一个新的基于图的代码生成工具CodexGraph，它已被证明在各种代码相关任务上有效且通用，请查看示例。
🔥🔥2024年8月1日：一个高效可靠的数据科学助手正在Modelscope-Agent上运行，请在示例中查看详情。
🔥2024年7月17日：Modelscope-Agent-Server上的并行工具调用，请在文档中查看详情。
🔥2024年6月17日：基于LLama-index升级RAG流程，允许用户通过不同策略和模态混合搜索知识，请在文档中查看详情。
🔥2024年6月6日：通过 Modelscope-Agent-Server，Qwen2 可以通过 OpenAI SDK 使用工具调用能力，详情请查看文档。
🔥2024年6月4日：Modelscope-Agent 支持 Mobile-Agent-V2arxiv，基于 Android Adb 环境，请在应用中查看。
🔥2024年5月17日：Modelscope-Agent 在 gradio 中支持多角色房间聊天。
2024年5月14日：Modelscope-Agent 在 RolePlay 智能体中支持图像输入，使用最新的 OpenAI 模型 GPT-4o。开发者可以通过指定 image_url 参数来体验此功能。
2024年5月10日：Modelscope-Agent 推出了用户友好的 Assistant API，并提供了在隔离、安全容器中执行实用程序的 Tools API，请查看文档
2024年4月12日：多智能体解决方案的 Ray 版本已在 modelscope-agent 上线，请查看文档
2024年3月15日：Modelscope-Agent 和 AgentFabric（GPTs 的开源版本）正在 modelscope studio 的生产环境中运行。
2024年2月10日：在中国新年期间，我们将modelscope agent升级到v0.3版本，以便开发者通过编码更方便地定制各种类型的智能体，并使多智能体演示更容易实现。更多详情，您可以参考#267和#293。
2023年11月26日：AgentFabric现在支持在ModelScope的创作空间中协作使用，允许在创作空间中分享自定义应用程序。此次更新还包括最新的GTE文本嵌入集成。
2023年11月17日：AgentFabric发布，这是一个交互式框架，旨在促进创建针对各种现实世界应用的智能体。
2023年10月30日：Facechain Agent发布了可以在本地运行的Facechain Agent本地版本。详细使用说明请参考Facechain Agent。
2023年10月25日：Story Agent发布了用于生成故事书插图的Story Agent本地版本。它可以在本地运行。详细使用说明请参考Story Agent。
2023年9月20日：ModelScope GPT通过gradio提供了可以在本地运行的本地版本。您可以导航到demo/msgpt/目录并执行bash run_msgpt.sh。
2023年9月4日：新增了三个演示，demo_qwen、demo_retrieval_agent 和 demo_register_tool，并提供了详细的教程。
2023年9月2日：发布了与该项目相关的预印本论文。
2023年8月22日：支持使用 ModelScope 令牌访问各种 AI 模型 API。
2023年8月7日：发布了 modelscope-agent 仓库的初始版本。

安装

从 PyPI 安装

# 基础功能
pip install ms-agent

# 深度研究功能
pip install 'ms-agent[research]'

从源码安装

git clone https://github.com/modelscope/ms-agent.git

cd ms-agent
pip install -e .

Warning

由于项目已重命名为 ms-agent，对于 v0.8.0 或更早版本，您可以使用以下命令安装：

pip install modelscope-agent<=0.8.0

使用 modelscope_agent 导入相关依赖：

from modelscope_agent import ...

快速开始

Agent 对话

该项目支持通过 MCP（模型上下文协议）与模型进行交互。以下是一个完整的示例，展示了如何配置和运行支持 MCP 的 LLMAgent。

✅ 使用 MCP 协议与 agent 对话：MCP Playground

默认情况下，agent 使用 ModelScope 的 API 推理服务。在运行 agent 之前，请确保设置您的 ModelScope API 密钥。

export MODELSCOPE_API_KEY={your_modelscope_api_key}

您可以在 https://modelscope.cn/my/myaccesstoken 找到或生成您的 API 密钥。

import asyncio

from ms_agent import LLMAgent

# Configure MCP servers
mcp = {
  "mcpServers": {
    "fetch": {
      "type": "streamable_http",
      "url": "https://mcp.api-inference.modelscope.net/{your_mcp_uuid}/mcp"
    }
  }
}

async def main():
    # Use json to configure MCP
    llm_agent = LLMAgent(mcp_config=mcp)   # Run task
    await llm_agent.run('Introduce modelscope.cn')

if __name__ == '__main__':
    # Start
    asyncio.run(main())

💡 提示：您可以在 modelscope.cn/mcp 找到可用的 MCP 服务器配置。

例如：https://modelscope.cn/mcp/servers/@modelcontextprotocol/fetch。将 mcp["mcpServers"]["fetch"] 中的 url 替换为您自己的 MCP 服务器端点。

记忆

我们在 v1.3.0 版本中通过使用 mem0 支持记忆功能！🎉

下面是一个简单的入门示例。更全面的测试用例，请参考 test_case。

在运行智能体之前，请确保您已经为 LLM 设置了 ModelScope API 密钥。

⚠️ 注意：截至目前，ModelScope API-Inference 尚未提供嵌入接口（即将推出）。因此，我们依赖外部 API 提供商进行嵌入。默认情况下，此实现使用 DashScope。在运行示例之前，请确保设置您的 DASHSCOPE_API_KEY。

pip install mem0ai
export MODELSCOPE_API_KEY={your_modelscope_api_key}
export DASHSCOPE_API_KEY={your_dashscope_api_key}

您可以在以下位置获取或生成您的 API 密钥：

使用示例

此示例演示了智能体如何使用持久记忆在会话间记住用户偏好：

import uuid
import asyncio
from omegaconf import OmegaConf
from ms_agent.agent.loader import AgentLoader


async def main():
    random_id = str(uuid.uuid4())
    default_memory = OmegaConf.create({
        'memory': [{
            'path': f'output/{random_id}',
            'user_id': 'awesome_me'
        }]
    })
    agent1 = AgentLoader.build(config_dir_or_id='ms-agent/simple_agent', config=default_memory)
    agent1.config.callbacks.remove('input_callback')  # Disable interactive input for direct output

    await agent1.run('I am a vegetarian and I drink coffee every morning.')
    del agent1
    print('========== Data preparation completed, starting test ===========')
    agent2 = AgentLoader.build(config_dir_or_id='ms-agent/simple_agent', config=default_memory)
    agent2.config.callbacks.remove('input_callback')  # Disable interactive input for direct output

    res = await agent2.run('Please help me plan tomorrow’s three meals.')
    print(res)
    assert 'vegan' in res[-1].content.lower() and 'coffee' in res[-1].content.lower()

asyncio.run(main())

Agent Skills

MS-Agent Skills 模块是对 Anthropic-Agent-Skills 协议的实现，允许开发者轻松创建、管理和使用智能体技能，提升智能体在复杂任务上的表现。

1) 核心特性

📜 标准技能协议：完全兼容 Anthropic Skills 协议
🧠 启发式上下文加载：仅在需要时加载必要的上下文，如References、Resources和Scripts等
🤖 自主执行：智能体根据技能定义，自主分析、规划和决策执行哪些脚本和资源
🔍 技能管理：支持技能批量加载，可根据用户输入自动检索和发现相关技能
🛡️ 代码执行环境：可选代码本地直接执行，或使用沙箱环境（ms-enclave），自动处理依赖项安装和环境隔离
📁 多文件类型支持：支持文档、脚本和资源文件
🧩 可扩展设计：对「技能」的数据结构进行了模块化设计，提供 SkillSchema、SkillContext等实现，便于扩展和定制

2) 快速开始

💡 提示：

在运行以下示例之前，请确保设置了 OPENAI_API_KEY 和 OPENAI_BASE_URL 环境变量，以便访问所需的模型 API

Agent Skills 要求 ms-agent 版本 >= 1.4.0

安装依赖：

pip install ms-agent

使用示例：

该示例展示了如何配置和运行一个Agent Skill，基于p5.js的流场生成艺术代码。

参考代码： Run Skills

运行结果：

Agent-Skills: Flow Field Particles

3) 参考文档

README：请参考 MS-Agent Skills
Anthropic Agent Skills官方文档：请参考 Anthropic-Agent-Skills
Anthropic预定义Skills GitHub仓库：请参考 Skills

Agentic Insight

- 轻量级、高效且可扩展的多模态深度研究框架

该项目提供了一个深度研究框架，使智能体能够自主探索和执行复杂任务。

🌟 特性

自主探索 - 针对各种复杂任务的自主探索
多模态 - 能够处理多样化的数据模态，生成包含丰富文本和图像的研究报告。
轻量级与高效 - 支持"搜索后执行"模式，在几分钟内完成复杂的研究任务，显著减少token消耗。

📺 演示

以下是Agentic Insight框架的实际演示，展示了其在高效处理复杂研究任务方面的能力。

用户查询
- 中文：

在计算化学这个领域，我们通常使用Gaussian软件模拟各种情况下分子的结构和性质计算，比如在关键词中加入'field=x+100'代表了在x方向增加了电场。但是，当体系是经典的单原子催化剂时，它属于分子催化剂，在反应环境中分子的朝向是不确定的，那么理论模拟的x方向电场和实际电场是不一致的。

请问：通常情况下，理论计算是如何模拟外加电场存在的情况？

- 英文：

在计算化学领域，我们经常使用Gaussian软件来模拟分子在各种条件下的结构和性质。例如，在关键词中添加'field=x+100'表示沿x方向施加电场。然而，当处理经典的单原子催化剂时，它属于分子催化范畴，分子在反应环境中的取向是不确定的。这意味着理论模拟中的x方向电场可能与实际电场不一致。

那么，在理论计算中通常如何模拟外部电场呢？

报告

agentic_insight_case_chem_0718a.mp4

更多详情，请参考深度研究。

文档研究

该项目提供了文档研究框架，使智能体能够自主探索和执行与文档分析和研究相关的复杂任务。

特性

🔍 深度文档研究 - 支持文档的深度分析和总结
📝 多种输入类型 - 支持多文件上传和URL输入
📊 多模态报告 - 支持Markdown格式的文本和图像报告
🚀 高效率 - 利用强大的LLM进行快速准确的研究，利用关键信息提取技术进一步优化token使用
⚙️ 灵活部署 - 支持本地运行和ModelScope Studio
💰 免费模型推理 - 为ModelScope用户提供免费的LLM API推理调用，参考ModelScope API-推理

演示

1. ModelScope Studio DocResearchStudio

2. 本地Gradio应用

针对UniME: Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs的研究报告

演示：UniME 研究报告

更多详情，请参考文档研究

Code Scratch

该项目提供了一个 Code Scratch 框架，使智能体能够自主生成代码项目。

特性

🎯 复杂代码生成 - 支持复杂代码生成任务，特别是 React 前端和 Node.js 后端
🔧 可定制工作流 - 使用户能够自由开发针对特定场景的代码生成工作流
🏗️ 三阶段架构 - 设计与编码阶段，然后是完善阶段，用于稳健的代码生成和错误修复
📁 智能文件分组 - 自动分组相关代码文件，以最小化依赖关系并减少错误
🔄 自动编译与修复 - 自动 npm 编译，具有智能错误分析和迭代修复功能

演示

AI 工作空间主页

使用以下命令生成完整的 AI 工作空间主页：

PYTHONPATH=. openai_api_key=your-api-key openai_base_url=your-api-url python ms_agent/cli/cli.py run --config projects/code_genesis --query 'Build a comprehensive AI workspace homepage' --trust_remote_code true

生成的代码将输出到当前目录的 output 文件夹中。

架构工作流：

设计阶段：分析需求 → 生成 PRD 和模块设计 → 创建实现任务
编码阶段：在智能文件组中执行编码任务 → 生成完整的代码结构
完善阶段：自动编译 → 错误分析 → 迭代错误修复 → 人工评估循环

更多详情，请参考 Code Scratch。

金融深度研究

MS-Agent FinResearch项目是一个面向金融市场研究场景的多智能体工作流，融合了金融数据分析能力与互联网舆情/资讯深度研究能力，自动生成专业的金融研究报告。

1) 核心特性

🤖 多智能体架构：通过多个专用智能体的编排实现工作流，从而完成任务拆解、数据收集、量化分析、舆情研究与最终报告生成。
📁 多维度分析：涵盖金融数据指标与公众舆情两个维度，实现结构化与非结构化数据的融合分析。
💰 金融数据采集：支持模型自动获取A股、港股、美股等市场的行情、财报、宏观指标与市场数据。
🔍 舆情深度研究：新闻/媒体/社区等多源舆情深度分析。
📝 专业报告生成：按业界常用方法论（MECE、SWOT、金字塔原理等）生成多章节、结构化、图文并茂的专业报告。
🔒 安全代码执行：在隔离的 Docker 沙箱中执行数据处理与分析，保证环境安全与可复现性。

2) 快速开始

💡 提示：

在运行以下示例之前，请确保设置了 OPENAI_API_KEY 和 OPENAI_BASE_URL 环境变量，以便访问所需的模型 API；如果希望运行完整工作流，请配置相应的搜索引擎环境变量EXA_API_KEY（https://exa.ai）或SERPAPI_API_KEY（https://serpapi.com）。

FinResearch 要求 ms-agent 版本 >= 1.5.0。

使用示例：

快速启动完整FinResearch工作流进行测试：

# 在 ms-agent 根目录执行
PYTHONPATH=. python ms_agent/cli/cli.py run --config projects/fin_research --query '请分析宁德时代（300750.SZ）近四个季度盈利能力变化，并与新能源领域主要竞争对手（如比亚迪、国轩高科、中创新航）进行对比；结合产业政策与锂价波动，预测其未来两季度业绩趋势。' --trust_remote_code true

不配置搜索引擎也可最小化运行，将工作流配置调整为：

type: DagWorkflow

orchestrator:
  next:
    - collector
  agent_config: orchestrator.yaml

collector:
  next:
    - analyst
  agent_config: collector.yaml

analyst:
  next:
    - aggregator
  agent_config: analyst.yaml

aggregator:
  agent_config: aggregator.yaml

运行结果：

finresearch-example-2.mp4

3) 参考文档

README：请参考FinResearch
说明文档: 请参考MS-Agent文档

奇点放映室

奇点放映室是一个Agent生成短视频的工作流，可以在使用一句话prompt或者知识类DOC的情况下支持高质量复杂短视频生成。

1) 核心特性

🎬 支持简单需求和复杂需求：可以一句话描述需求，也可以提供复杂的信息文件
🎹 复杂精美的表格和公式：可以在短视频内部展示和台本相应的公式和图表解读
🎮 端到端：从需求到台本到分镜，从旁白音到图表到字幕，最后人工反馈和生成视频，端到端流程一个命令搞定
🏁 可配置性：可配置性高，声音、风格、素材都可以通过简单配置调节
🚧 定制化：工作流清晰简单，适合二次开发

2) 快速开始

使用示例：

OPENAI_API_KEY=xxx-xxx T2I_API_KEY=ms-xxx-xxx MANIM_TEST_API_KEY=xxx-xxx ms-agent run --config "projects/singularity_cinema" --query "你的自定义主题" --load_cache true --trust_remote_code true

运行结果：

An introduction to Deepspeed ZeRO

A history of US GDP

3) 参考文档

完整文档

有趣的工作

新闻收集智能体 ms-agent/newspaper

未来计划

我们致力于不断改进和扩展 MS-Agent 框架，提升大模型和智能体的能力边界。未来的计划包括：

许可证

该项目基于 Apache License (Version 2.0) 许可证。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

MS-Agent: 赋能智能体自主探索的轻量级框架

简介

特性

🎉 新闻

安装

从 PyPI 安装

从源码安装

快速开始

Agent 对话

Agent Skills

1) 核心特性

2) 快速开始

3) 参考文档

Agentic Insight

- 轻量级、高效且可扩展的多模态深度研究框架

🌟 特性

📺 演示

报告

文档研究

特性

演示

Code Scratch

特性

演示

金融深度研究

1) 核心特性

2) 快速开始

3) 参考文档

奇点放映室

1) 核心特性

2) 快速开始

3) 参考文档

有趣的工作

未来计划

许可证

Star 历史

FilesExpand file tree

README_ZH.md

Latest commit

History

README_ZH.md

File metadata and controls

MS-Agent: 赋能智能体自主探索的轻量级框架

简介

特性

🎉 新闻

安装

从 PyPI 安装

从源码安装

快速开始

Agent 对话

Agent Skills

1) 核心特性

2) 快速开始

3) 参考文档

Agentic Insight

- 轻量级、高效且可扩展的多模态深度研究框架

🌟 特性

📺 演示

报告

文档研究

特性

演示

Code Scratch

特性

演示

金融深度研究

1) 核心特性

2) 快速开始

3) 参考文档

奇点放映室

1) 核心特性

2) 快速开始

3) 参考文档

有趣的工作

未来计划

许可证

Star 历史