fix: agent performance optimization

YumengBao · YumengBao · commit b2f708b0d8c3 · 2025-12-16T23:50:15.000+08:00
- more strict prompt
- expand mcp timeout
- update requirements
diff --git a/02-use-cases/video_gen/README.md b/02-use-cases/video_gen/README.md
@@ -39,24 +39,20 @@ AgentKit 运行时
 主要特性包括：
 
 - **智能分镜生成**：自动将叙事分解为 4 个视觉关键帧,保持风格一致性和角色连续性
-
 - **无缝视频过渡**：使用先进的视觉 AI 模型在帧之间生成流畅的过渡视频
-
 - **本地 MCP 工具集成**：利用模型上下文协议进行高效的本地视频处理,无需云端依赖
-
 - **自动上传与分享**：将完成的视频上传到 TOS,并生成限时签名 URL 以安全分享
-
 - **迭代优化**：维护对话上下文,允许用户请求对风格、节奏或内容进行调整
 
 ## Agent 能力
 
-| 组件 | 描述 |
-| - | - |
-| **Agent 服务** | [`agent.py`](agent.py) - 主应用程序,包含 MCP 工具注册 |
+| 组件           | 描述                                                      |
+| -------------- | --------------------------------------------------------- |
+| **Agent 服务** | [`agent.py`](agent.py) - 主应用程序,包含 MCP 工具注册     |
 | **Agent 配置** | [`agent.yaml`](agent.yaml) - 模型设置、系统指令和工具列表 |
-| **自定义工具** | [`tool/`](tool/) - 文件下载和 TOS 上传实用工具 |
-| **MCP 集成** | `@pickstar-2002/video-clip-mcp` - 本地视频拼接服务 |
-| **短期记忆** | 会话上下文维护以保持对话连续性 |
+| **自定义工具** | [`tool/`](tool/) - 文件下载和 TOS 上传实用工具            |
+| **MCP 集成**   | `@pickstar-2002/video-clip-mcp` - 本地视频拼接服务        |
+| **短期记忆**   | 会话上下文维护以保持对话连续性                            |
 
 ## 快速开始
 
@@ -95,7 +91,7 @@ AgentKit 运行时
 
 ### 安装依赖
 
-*推荐使用uv工具build项目**
+\*推荐使用uv工具build项目\*\*
 
 ```bash
 # install uv
@@ -210,22 +206,41 @@ veadk web
 
 ## AgentKit 部署
 
-部署到火山引擎 AgentKit Runtime:
+### 部署到火山引擎 AgentKit Runtime
 
-```bash
-# 1. 进入项目目录
-cd 02-use-cases/video_gen
+步骤1: 进入项目目录
+
+   ```bash
+   cd 02-use-cases/video_gen
+   ```
+
+步骤2: 配置 AgentKit**
 
-# 2. 配置并部署
+```bash
 agentkit config \
 --agent_name storybook_illustrator \
 --entry_point 'agent.py' \
 --runtime_envs DATABASE_TOS_BUCKET=agentkit-platform-{{your_account_id}} \
 --launch_type cloud
+```
 
-# 3. 部署到运行时
-agentkit launch
+修改`agentkit.yaml`部署配置
+
+> 目的：修改后会在镜像build阶段前置安装video-clip-mcp，以加速runtime启动
 
+```bash
+# linux os命令
+sed -i 's/docker_build: {}/docker_build:\n  build_script: "scripts\/setup.sh"/' agentkit.yaml
+
+# mac os命令
+sed -i '' 's/docker_build: {}/docker_build:/' agentkit.yaml && sed -i '' '/docker_build:/a\
+  build_script: "scripts\/setup.sh"' agentkit.yaml
+```
+
+步骤4: 部署到运行时
+
+```bash
+agentkit launch
 ```
 
 ### 测试已部署的智能体
diff --git a/02-use-cases/video_gen/agent.py b/02-use-cases/video_gen/agent.py
@@ -48,7 +48,7 @@
 )
 mcpTool = McpToolset(
     connection_params=StdioConnectionParams(
-        server_params=server_parameters, timeout=60.0
+        server_params=server_parameters, timeout=600.0
     ),
     errlog=None,
 )
diff --git a/02-use-cases/video_gen/agent.yaml b/02-use-cases/video_gen/agent.yaml
@@ -1,12 +1,11 @@
 root_agent:
   type: Agent
   name: "storybook_illustrator"
-  description: "绘本插画师，将儿童故事转化为3D卡通风格绘本插画与分镜视频的完整技能，适用于5-15岁读者"
-  #model_name: "deepseek-v3-1-terminus"
+  description: "将儿童故事转化为3D卡通风格绘本插画与分镜视频的完整技能，内容需契合5-15岁读者认知水平、传递积极价值观并引发情感共鸣"
   model_name: "deepseek-v3-1-terminus"
   instruction: |
-    你是一个专业的绘本插画师，擅长根据故事情节生成卡通风格的绘本插画。输入输出中，任何涉及图片或视频的链接url，不要做任何修改。
-    
+    你是一个专业的绘本插画师，擅长根据故事情节生成卡通风格的绘本插画。输入输出中，任何涉及图片或视频的链接url，**绝对禁止任何形式的修改、截断、拼接或替换**，必须100%保持原始内容的完整性与准确性。
+
     ### 工作流程：
     ---
     name: storybook_illustrator
@@ -18,7 +17,7 @@ root_agent:
     当用户提供一个故事或情节时，执行以下步骤生成绘本插画与分镜视频：
 
     1. 理解并提炼故事情节，检索背景信息，将故事拆分为三个场景并重写为适合5-15岁儿童阅读的内容。
-    2. 使用 image_generate 工具按时间顺序生成四张 720P 分镜图片， 一次性构造4个独立 task来生成图片；若用户未指定风格，默认采用“上海美术卡通风格”。生成后，以 Markdown 图片列表形式返回，例如：
+    2. 使用 image_generate 工具按时间顺序生成四张分镜图片， 一次性构造4个独立 task来生成图片；若用户未指定风格，默认采用“上海美术卡通风格”。生成后，以 Markdown 图片列表形式返回，例如：
       ```
       ![分镜图片1](https://example.com/image1.png)
       ![分镜图片2](https://example.com/image2.png)
@@ -32,16 +31,16 @@ root_agent:
       <video src="https://example.com/video2.mp4" width="640" controls>分镜视频2</video>
       <video src="https://example.com/video3.mp4" width="640" controls>分镜视频3</video>
       ```
-    5. 下载所有分镜视频到本地，调用合并工具拼接成完整故事视频；若合并失败，自动重试最多 2 次。
+    5. **直接提取步骤4中返回的三段分镜视频的完整URL（包含所有query参数，不得有任何修改、省略或调整）**，下载所有分镜视频到本地，调用合并工具拼接成完整故事视频；若合并失败，自动重试最多 2 次。
     6. 将合并后的视频上传至 TOS；若上传失败，自动重试最多 2 次。最终返回 TOS 视频 URL，格式同上。
 
     ## Examples
     - 输入：“请把《小红帽》做成绘本视频” → 输出四张插画与三段过渡视频，最终合并为完整 TOS 视频链接。
     - 输入：“用国风画一只熊猫冒险故事” → 按国风风格生成插画与视频，合并后返回 TOS 链接。
 
     ## Guidelines
-    - 任何图片或视频 URL 在输入输出中均不得修改，保持原样。
-     - 3D 人物在插画和视频中必须是3D模型，不能是2D图片。
+    - **所有图片或视频 URL 在输入输出的全流程中均需严格保持原始状态，不允许进行任何形式的篡改（包括但不限于修改域名、路径、query参数、锚点等）**。
+    - 3D 人物在插画和视频中必须是3D模型，不能是2D图片。
     - 生成视频时务必一次性提交三个 task 列表，禁止单条视频多次调用工具。
     - 合并与上传环节失败时，最多重试 2 次，确保最终用户可获得 TOS 视频链接。
     - 下载的时候使用完整的URL带query参数
diff --git a/02-use-cases/video_gen/requirements.txt b/02-use-cases/video_gen/requirements.txt
@@ -1,5 +1,5 @@
 tos>=2.8.7
-veadk-python==0.2.27
-google-adk==1.18.0
-volcengine-python-sdk==4.0.33
-agentkit-sdk-python==0.1.15
+veadk-python>=0.2.27
+google-adk>=1.18.0
+volcengine-python-sdk>=4.0.33
+agentkit-sdk-python>=0.2.0
diff --git a/02-use-cases/video_gen/scripts/setup.sh b/02-use-cases/video_gen/scripts/setup.sh
@@ -0,0 +1,14 @@
+#!/bin/bash
+# install-video-clip-mcp.sh
+
+echo "开始安装 @pickstar-2002/video-clip-mcp..."
+npm install -g @pickstar-2002/video-clip-mcp@latest
+
+if [ $? -eq 0 ]; then
+    echo "✅ 安装成功！"
+    echo "安装位置: $(which video-clip-mcp)"
+    echo "版本信息: $(video-clip-mcp --version 2>/dev/null || echo '运行 video-clip-mcp --version 查看')"
+else
+    echo "❌ 安装失败！"
+    exit 1
+fi

Original file line number	Diff line number	Diff line change
`@@ -48,7 +48,7 @@`
`48`	`48`	`)`
`49`	`49`	`mcpTool = McpToolset(`
`50`	`50`	`connection_params=StdioConnectionParams(`
`51`		`- server_params=server_parameters, timeout=60.0`
	`51`	`+ server_params=server_parameters, timeout=600.0`
`52`	`52`	`),`
`53`	`53`	`errlog=None,`
`54`	`54`	`)`