中文 | English
一句话让你的 OpenClaw 拥有逆天的 PDF/图片读取能力!
当把包含复杂表格、数学公式或特殊排版的 PDF 和图片发给 AI 时,它经常会"胡言乱语"或者丢失格式。PaddleOCR Skills 完美解决了这个问题,将国产开源之光 PaddleOCR 接入 OpenClaw!
只需 一句提示词,3步极简操作,就能让你的 OpenClaw 瞬间拥有顶级文档和图片解析能力!
PaddleOCR Skills 是 ClawHub 上提供的一系列 AI 技能,让 OpenClaw 能够以极高的准确率处理文档和图片。它提供两大核心技能:
不再是简单的纯文本提取!它能返回完整的文档结构,完美还原:
- 文本内容(保留格式)
- 表格(完整单元格结构)
- 数学公式(LaTeX 格式)
- 图表和图形
- 复杂排版布局(多栏、页眉页脚)
- 阅读顺序和文档结构
适用于: 学术论文、财务报告、发票、法律文档、多栏排版
ClawHub 地址: paddleocr-doc-parsing
快速精准地从图片和 PDF 中提取文本,返回结构化的 JSON 数据,非常适合开发者做二次处理。
适用于: 截图、照片、扫描件、简单文本提取、快速 OCR 任务
ClawHub 地址: paddleocr-text-recognition
| 功能 | 文档解析 | 文字识别 |
|---|---|---|
| 主要用途 | 复杂文档理解 | 快速文本提取 |
| 表格 | ✅ 完整结构保留 | |
| 公式 | ✅ LaTeX 输出 | ❌ |
| 图表 | ✅ 智能分析 | ❌ |
| 版面分析 | ✅ 完整结构 | ❌ |
| 速度 | 中等 | 快速 |
| 输出格式 | Markdown + JSON | JSON |
| 适用场景 | 学术论文、报告、发票 | 截图、简单图片 |
使用文档解析:
- 包含表格的文档(发票、财务报告、电子表格)
- 包含数学公式的文档(学术论文、科学文献)
- 包含图表和图形的文档
- 多栏排版(报纸、杂志、宣传册)
- 任何需要结构化理解的文档
使用文字识别:
- 简单的纯文本提取
- 速度优先的 OCR 任务
- 截图或清晰文本的简单图片
- 需要结构化 JSON 输出进行处理
当把 PDF 或图片发送给 AI 助手时,经常会出现:
- 表格结构丢失
- 公式识别错误
- 多栏排版混乱
- 重要格式细节遗漏
PaddleOCR Skills 提供:
- 精准度:来自 PaddleOCR 的业界领先 OCR 技术(GitHub 80K+ 星)
- 完整性:保留所有文档结构
- 简单:一句提示词即可在 OpenClaw 中安装
- 免费额度:官方 API 每天免费解析数万页文档
安装 PaddleOCR Skills 前,你需要:
- ClawHub 账号 - 在 clawhub.ai 注册
- PaddleOCR API 访问权限 - 在 paddleocr.com 注册
- 访问 www.clawhub.ai 并完成注册登录
- 依次点击左侧菜单栏:Settings → Create Tokens
- 生成并复制以
clh_开头的 Token
- 访问 https://www.paddleocr.com 并注册
- 点击 API 按钮
- 找到以下接口:
- PaddleOCR-VL-1.5(文档解析)
- PP-OCRv5(文字识别)
- 复制各自的 API_URL 和 TOKEN
划重点: 官方目前支持申请每天免费解析数万页文档,羊毛必须薅!
把获取的 Token 和 API 地址,替换到下面这段提示词中,直接发给你的 OpenClaw:
请帮我安装 PaddleOCR 技能:
ClawHub Token: [填入你的 ClawHub Token,以 clh_ 开头]
PaddleOCR API 配置:
- 文档解析 API: [填入你的文档解析 API 地址]
- 文字识别 API: [填入你的文字识别 API 地址]
- Access Token: [填入你的 PaddleOCR 访问令牌]
执行要求:请严格按照以下流程自动完成:
登录 ClawHub → 安装依赖 → 安装技能 → 写入配置 → 执行测试 → 向我汇报安装报告。
完成!OpenClaw 会自动:
- 登录 ClawHub
- 安装依赖
- 安装技能
- 写入配置
- 执行测试
- 汇报安装报告
- 📖 PaddleOCR 官网
- 🔗 ClawHub 平台
- 📄 文档解析技能
- 🔍 文字识别技能
- 📝 原始教程
扫描下方二维码关注微信公众号,获取更多 AI 技巧和教程:
本项目采用 MIT 许可证 - 详见 LICENSE 文件。
为 OpenClaw 社区用心制作 ❤️
