MCP Playground | Paper | Documentation | 中文文档
MS-Agent是一个轻量级框架,旨在为智能体提供自主探索能力。它提供了灵活且可扩展的架构,允许开发者创建能够执行复杂任务的智能体,如代码生成、数据分析,以及基于MCP(模型调用协议)支持的通用工具调用。
- 通用多智能体:基于MCP的工具调用能力与智能体聊天。
- 深度研究:启用自主探索和复杂任务执行的高级能力。
- 代码生成:支持复杂项目的代码生成任务。
- 短视频生成:支持5分钟左右的短视频生成。
- Agent Skills:兼容Anthropic-Agent-Skills协议,实现智能体技能模块。
- 轻量级且可扩展:易于扩展和定制以适应各种应用。
历史存档版本,请参考:https://github.com/modelscope/ms-agent/tree/0.8.0
| 微信群 |
|---|
![]() |
-
🎬 2025.11.13: 发布了“奇点放映室”,用于进行知识类文档的复杂场景短视频制作,具体查看这里
-
🚀 2025.11.12:发布MS-Agent v1.5.0,包含以下更新:
- 🔥 新增 FinResearch,支持金融领域的深度研究和分析
- 支持基于Akshare和Baostock的金融数据获取工具
- 支持以Dag形式编排工作流
- 优化DeepResearch稳定性与效率
- 官方文档: 金融深度研究
- 魔搭创空间DEMO: FinResearchStudio
- 报告样例: FinResearchExamples
-
🚀 2025.11.07:发布MS-Agent v1.4.0,包含以下更新:
- 🔥 新增 MS-Agent Skills, 基于 Anthropic-Agent-Skills 协议实现.
- 🔥 新增 中文文档和英文文档
- 🔥 支持沙箱框架 ms-enclave
-
🚀 2025.9.22:发布MS-Agent v1.3.0,包含以下更新:
- 🔥 支持Code Scratch
- 支持
Memory用于构建具有长期和短期记忆的智能体 - 增强DeepResearch工作流
- 支持RAY加速文档信息提取
- 支持LLMs的Anthropic API格式
-
🚀 2025.8.28:发布MS-Agent v1.2.0,包含以下更新:
- DocResearch现在支持推送到
ModelScope、HuggingFace、GitHub以便于分享研究报告。详情请参考Doc Research。 - DocResearch现在支持将Markdown报告导出为
HTML、PDF、PPTX和DOCX格式,详情请参考Doc Research。 - DocResearch现在支持
TXT文件处理和文件预处理,详情请参考Doc Research。
- DocResearch现在支持推送到
-
🚀 2025.7.31:发布MS-Agent v1.1.0,包含以下更新:
- 🔥 支持文档研究,演示:DocResearchStudio - 为智能洞察(DeepResearch)添加
通用网络搜索引擎- 为Agent与MCP聊天添加
最大连续运行次数。
- 为Agent与MCP聊天添加
-
🚀 2025.7.18:发布MS-Agent v1.0.0,改进Agent与MCP聊天的体验,并更新智能洞察的说明文档。
-
🚀 2025.7.16:发布MS-Agent v1.0.0rc0,包含以下更新:
- 支持Agent与MCP(模型上下文协议)聊天
- 支持深度研究(智能洞察),参考:报告演示,脚本演示
- 支持MCP-Playground
- 为Agent聊天添加回调机制
归档
-
🔥🔥🔥2024年8月8日:Modelscope-Agent发布了一个新的基于图的代码生成工具CodexGraph,它已被证明在各种代码相关任务上有效且通用,请查看示例。
-
🔥🔥2024年8月1日:一个高效可靠的数据科学助手正在Modelscope-Agent上运行,请在示例中查看详情。
-
🔥2024年7月17日:Modelscope-Agent-Server上的并行工具调用,请在文档中查看详情。
-
🔥2024年6月17日:基于LLama-index升级RAG流程,允许用户通过不同策略和模态混合搜索知识,请在文档中查看详情。
-
🔥2024年6月6日:通过 Modelscope-Agent-Server,Qwen2 可以通过 OpenAI SDK 使用工具调用能力,详情请查看文档。
-
🔥2024年6月4日:Modelscope-Agent 支持 Mobile-Agent-V2arxiv,基于 Android Adb 环境,请在应用中查看。
-
🔥2024年5月17日:Modelscope-Agent 在 gradio 中支持多角色房间聊天。
-
2024年5月14日:Modelscope-Agent 在
RolePlay智能体中支持图像输入,使用最新的 OpenAI 模型GPT-4o。开发者可以通过指定image_url参数来体验此功能。 -
2024年5月10日:Modelscope-Agent 推出了用户友好的
Assistant API,并提供了在隔离、安全容器中执行实用程序的Tools API,请查看文档 -
2024年3月15日:Modelscope-Agent 和 AgentFabric(GPTs 的开源版本)正在 modelscope studio 的生产环境中运行。
-
2024年2月10日:在中国新年期间,我们将modelscope agent升级到v0.3版本,以便开发者通过编码更方便地定制各种类型的智能体,并使多智能体演示更容易实现。更多详情,您可以参考#267和#293。
-
2023年11月26日:AgentFabric现在支持在ModelScope的创作空间中协作使用,允许在创作空间中分享自定义应用程序。此次更新还包括最新的GTE文本嵌入集成。
-
2023年11月17日:AgentFabric发布,这是一个交互式框架,旨在促进创建针对各种现实世界应用的智能体。
-
2023年10月30日:Facechain Agent发布了可以在本地运行的Facechain Agent本地版本。详细使用说明请参考Facechain Agent。
-
2023年10月25日:Story Agent发布了用于生成故事书插图的Story Agent本地版本。它可以在本地运行。详细使用说明请参考Story Agent。
-
2023年9月20日:ModelScope GPT通过gradio提供了可以在本地运行的本地版本。您可以导航到demo/msgpt/目录并执行
bash run_msgpt.sh。 -
2023年9月4日:新增了三个演示,demo_qwen、demo_retrieval_agent 和 demo_register_tool,并提供了详细的教程。
-
2023年9月2日:发布了与该项目相关的预印本论文。
-
2023年8月22日:支持使用 ModelScope 令牌访问各种 AI 模型 API。
-
2023年8月7日:发布了 modelscope-agent 仓库的初始版本。
# 基础功能
pip install ms-agent
# 深度研究功能
pip install 'ms-agent[research]'git clone https://github.com/modelscope/ms-agent.git
cd ms-agent
pip install -e .Warning
由于项目已重命名为 ms-agent,对于 v0.8.0 或更早版本,您可以使用以下命令安装:
pip install modelscope-agent<=0.8.0使用 modelscope_agent 导入相关依赖:
from modelscope_agent import ...该项目支持通过 MCP(模型上下文协议)与模型进行交互。以下是一个完整的示例,展示了如何配置和运行支持 MCP 的 LLMAgent。
✅ 使用 MCP 协议与 agent 对话:MCP Playground
默认情况下,agent 使用 ModelScope 的 API 推理服务。在运行 agent 之前,请确保设置您的 ModelScope API 密钥。
export MODELSCOPE_API_KEY={your_modelscope_api_key}您可以在 https://modelscope.cn/my/myaccesstoken 找到或生成您的 API 密钥。
import asyncio
from ms_agent import LLMAgent
# Configure MCP servers
mcp = {
"mcpServers": {
"fetch": {
"type": "streamable_http",
"url": "https://mcp.api-inference.modelscope.net/{your_mcp_uuid}/mcp"
}
}
}
async def main():
# Use json to configure MCP
llm_agent = LLMAgent(mcp_config=mcp) # Run task
await llm_agent.run('Introduce modelscope.cn')
if __name__ == '__main__':
# Start
asyncio.run(main())💡 提示:您可以在 modelscope.cn/mcp 找到可用的 MCP 服务器配置。
例如:https://modelscope.cn/mcp/servers/@modelcontextprotocol/fetch。
将 mcp["mcpServers"]["fetch"] 中的 url 替换为您自己的 MCP 服务器端点。
记忆
我们在 v1.3.0 版本中通过使用 mem0 支持记忆功能!🎉
下面是一个简单的入门示例。更全面的测试用例,请参考 test_case。
在运行智能体之前,请确保您已经为 LLM 设置了 ModelScope API 密钥。
pip install mem0ai
export MODELSCOPE_API_KEY={your_modelscope_api_key}
export DASHSCOPE_API_KEY={your_dashscope_api_key}您可以在以下位置获取或生成您的 API 密钥:
使用示例
此示例演示了智能体如何使用持久记忆在会话间记住用户偏好:
import uuid
import asyncio
from omegaconf import OmegaConf
from ms_agent.agent.loader import AgentLoader
async def main():
random_id = str(uuid.uuid4())
default_memory = OmegaConf.create({
'memory': [{
'path': f'output/{random_id}',
'user_id': 'awesome_me'
}]
})
agent1 = AgentLoader.build(config_dir_or_id='ms-agent/simple_agent', config=default_memory)
agent1.config.callbacks.remove('input_callback') # Disable interactive input for direct output
await agent1.run('I am a vegetarian and I drink coffee every morning.')
del agent1
print('========== Data preparation completed, starting test ===========')
agent2 = AgentLoader.build(config_dir_or_id='ms-agent/simple_agent', config=default_memory)
agent2.config.callbacks.remove('input_callback') # Disable interactive input for direct output
res = await agent2.run('Please help me plan tomorrow’s three meals.')
print(res)
assert 'vegan' in res[-1].content.lower() and 'coffee' in res[-1].content.lower()
asyncio.run(main())MS-Agent Skills 模块是对 Anthropic-Agent-Skills 协议的实现,允许开发者轻松创建、管理和使用智能体技能,提升智能体在复杂任务上的表现。
- 📜 标准技能协议:完全兼容 Anthropic Skills 协议
- 🧠 启发式上下文加载:仅在需要时加载必要的上下文,如
References、Resources和Scripts等 - 🤖 自主执行:智能体根据技能定义,自主分析、规划和决策执行哪些脚本和资源
- 🔍 技能管理:支持技能批量加载,可根据用户输入自动检索和发现相关技能
- 🛡️ 代码执行环境:可选代码本地直接执行,或使用沙箱环境(ms-enclave),自动处理依赖项安装和环境隔离
- 📁 多文件类型支持:支持文档、脚本和资源文件
- 🧩 可扩展设计:对「技能」的数据结构进行了模块化设计,提供
SkillSchema、SkillContext等实现,便于扩展和定制
💡 提示:
- 在运行以下示例之前,请确保设置了
OPENAI_API_KEY和OPENAI_BASE_URL环境变量,以便访问所需的模型 API- Agent Skills 要求 ms-agent 版本 >= 1.4.0
安装依赖:
pip install ms-agent使用示例:
该示例展示了如何配置和运行一个Agent Skill,基于p5.js的流场生成艺术代码。
参考代码: Run Skills
运行结果:
- README:请参考 MS-Agent Skills
- Anthropic Agent Skills官方文档:请参考 Anthropic-Agent-Skills
- Anthropic预定义Skills GitHub仓库:请参考 Skills
该项目提供了一个深度研究框架,使智能体能够自主探索和执行复杂任务。
-
自主探索 - 针对各种复杂任务的自主探索
-
多模态 - 能够处理多样化的数据模态,生成包含丰富文本和图像的研究报告。
-
轻量级与高效 - 支持"搜索后执行"模式,在几分钟内完成复杂的研究任务,显著减少token消耗。
以下是Agentic Insight框架的实际演示,展示了其在高效处理复杂研究任务方面的能力。
-
用户查询
-
- 中文:
在计算化学这个领域,我们通常使用Gaussian软件模拟各种情况下分子的结构和性质计算,比如在关键词中加入'field=x+100'代表了在x方向增加了电场。但是,当体系是经典的单原子催化剂时,它属于分子催化剂,在反应环境中分子的朝向是不确定的,那么理论模拟的x方向电场和实际电场是不一致的。
请问:通常情况下,理论计算是如何模拟外加电场存在的情况?
-
- 英文:
在计算化学领域,我们经常使用Gaussian软件来模拟分子在各种条件下的结构和性质。例如,在关键词中添加'field=x+100'表示沿x方向施加电场。然而,当处理经典的单原子催化剂时,它属于分子催化范畴,分子在反应环境中的取向是不确定的。这意味着理论模拟中的x方向电场可能与实际电场不一致。
那么,在理论计算中通常如何模拟外部电场呢?
agentic_insight_case_chem_0718a.mp4
更多详情,请参考深度研究。
该项目提供了文档研究框架,使智能体能够自主探索和执行与文档分析和研究相关的复杂任务。
- 🔍 深度文档研究 - 支持文档的深度分析和总结
- 📝 多种输入类型 - 支持多文件上传和URL输入
- 📊 多模态报告 - 支持Markdown格式的文本和图像报告
- 🚀 高效率 - 利用强大的LLM进行快速准确的研究,利用关键信息提取技术进一步优化token使用
- ⚙️ 灵活部署 - 支持本地运行和ModelScope Studio
- 💰 免费模型推理 - 为ModelScope用户提供免费的LLM API推理调用,参考ModelScope API-推理
1. ModelScope Studio DocResearchStudio
2. 本地Gradio应用
更多详情,请参考 文档研究
该项目提供了一个 Code Scratch 框架,使智能体能够自主生成代码项目。
- 🎯 复杂代码生成 - 支持复杂代码生成任务,特别是 React 前端和 Node.js 后端
- 🔧 可定制工作流 - 使用户能够自由开发针对特定场景的代码生成工作流
- 🏗️ 三阶段架构 - 设计与编码阶段,然后是完善阶段,用于稳健的代码生成和错误修复
- 📁 智能文件分组 - 自动分组相关代码文件,以最小化依赖关系并减少错误
- 🔄 自动编译与修复 - 自动 npm 编译,具有智能错误分析和迭代修复功能
AI 工作空间主页
使用以下命令生成完整的 AI 工作空间主页:
PYTHONPATH=. openai_api_key=your-api-key openai_base_url=your-api-url python ms_agent/cli/cli.py run --config projects/code_genesis --query 'Build a comprehensive AI workspace homepage' --trust_remote_code true生成的代码将输出到当前目录的 output 文件夹中。
架构工作流:
- 设计阶段:分析需求 → 生成 PRD 和模块设计 → 创建实现任务
- 编码阶段:在智能文件组中执行编码任务 → 生成完整的代码结构
- 完善阶段:自动编译 → 错误分析 → 迭代错误修复 → 人工评估循环
更多详情,请参考 Code Scratch。
MS-Agent FinResearch项目是一个面向金融市场研究场景的多智能体工作流,融合了金融数据分析能力与互联网舆情/资讯深度研究能力,自动生成专业的金融研究报告。
-
🤖 多智能体架构:通过多个专用智能体的编排实现工作流,从而完成任务拆解、数据收集、量化分析、舆情研究与最终报告生成。
-
📁 多维度分析:涵盖金融数据指标与公众舆情两个维度,实现结构化与非结构化数据的融合分析。
-
💰 金融数据采集:支持模型自动获取A股、港股、美股等市场的行情、财报、宏观指标与市场数据。
-
🔍 舆情深度研究:新闻/媒体/社区等多源舆情深度分析。
-
📝 专业报告生成:按业界常用方法论(MECE、SWOT、金字塔原理等)生成多章节、结构化、图文并茂的专业报告。
-
🔒 安全代码执行:在隔离的 Docker 沙箱中执行数据处理与分析,保证环境安全与可复现性。
💡 提示:
- 在运行以下示例之前,请确保设置了
OPENAI_API_KEY和OPENAI_BASE_URL环境变量,以便访问所需的模型 API;如果希望运行完整工作流,请配置相应的搜索引擎环境变量EXA_API_KEY(https://exa.ai)或SERPAPI_API_KEY(https://serpapi.com)。- FinResearch 要求 ms-agent 版本 >= 1.5.0。
使用示例:
快速启动完整FinResearch工作流进行测试:
# 在 ms-agent 根目录执行
PYTHONPATH=. python ms_agent/cli/cli.py run --config projects/fin_research --query '请分析宁德时代(300750.SZ)近四个季度盈利能力变化,并与新能源领域主要竞争对手(如比亚迪、国轩高科、中创新航)进行对比;结合产业政策与锂价波动,预测其未来两季度业绩趋势。' --trust_remote_code true不配置搜索引擎也可最小化运行,将工作流配置调整为:
type: DagWorkflow
orchestrator:
next:
- collector
agent_config: orchestrator.yaml
collector:
next:
- analyst
agent_config: collector.yaml
analyst:
next:
- aggregator
agent_config: analyst.yaml
aggregator:
agent_config: aggregator.yaml运行结果:
finresearch-example-2.mp4
- README:请参考FinResearch
- 说明文档: 请参考MS-Agent文档
奇点放映室是一个Agent生成短视频的工作流,可以在使用一句话prompt或者知识类DOC的情况下支持高质量复杂短视频生成。
-
🎬 支持简单需求和复杂需求:可以一句话描述需求,也可以提供复杂的信息文件
-
🎹 复杂精美的表格和公式:可以在短视频内部展示和台本相应的公式和图表解读
-
🎮 端到端:从需求到台本到分镜,从旁白音到图表到字幕,最后人工反馈和生成视频,端到端流程一个命令搞定
-
🏁 可配置性:可配置性高,声音、风格、素材都可以通过简单配置调节
-
🚧 定制化:工作流清晰简单,适合二次开发
使用示例:
OPENAI_API_KEY=xxx-xxx T2I_API_KEY=ms-xxx-xxx MANIM_TEST_API_KEY=xxx-xxx ms-agent run --config "projects/singularity_cinema" --query "你的自定义主题" --load_cache true --trust_remote_code true运行结果:
An introduction to Deepspeed ZeRO
A history of US GDP
- 新闻收集智能体 ms-agent/newspaper
我们致力于不断改进和扩展 MS-Agent 框架,提升大模型和智能体的能力边界。未来的计划包括:
- 支持Anthropic-Agent-Skills 协议,实现智能体技能模块,提升智能体在复杂任务上的表现。
- 金融深度研究智能体 FinResearch - 专注于金融领域的深度研究和分析。
- 长周期深度金融分析报告生成
- 准实时事件驱动型简报生成
- 奇点放映室
- 支持更复杂的短视频场景
- 提升稳定度
- 多模态检索增强生成 Multimodal Agentic Search - 支持大规模多模态文档检索和图文检索结果生成。
- 增强的 Agent Skills - 提供更多预定义的技能和工具,提升智能体技能边界,并支持多技能协作,完成复杂任务执行。
- 统一的WebUI Agent-Workstation,支持本地一键部署,集成了 MS-Agent 的所有智能体能力,如 AgentChat、MCP、AgentSkills、DeepResearch、DocResearch、CodeGenesis 等。
该项目基于 Apache License (Version 2.0) 许可证。





