Skip to content

Latest commit

 

History

History
188 lines (129 loc) · 5.81 KB

File metadata and controls

188 lines (129 loc) · 5.81 KB

PaddleOCR Skills for OpenClaw

License ClawHub PaddleOCR

中文 | English

一句话让你的 OpenClaw 拥有逆天的 PDF/图片读取能力!

目录


简介

当把包含复杂表格、数学公式或特殊排版的 PDF 和图片发给 AI 时,它经常会"胡言乱语"或者丢失格式。PaddleOCR Skills 完美解决了这个问题,将国产开源之光 PaddleOCR 接入 OpenClaw!

只需 一句提示词3步极简操作,就能让你的 OpenClaw 瞬间拥有顶级文档和图片解析能力!

什么是 PaddleOCR Skills?

PaddleOCR Skills 是 ClawHub 上提供的一系列 AI 技能,让 OpenClaw 能够以极高的准确率处理文档和图片。它提供两大核心技能:

📄 高级文档解析 (Document Parsing)

不再是简单的纯文本提取!它能返回完整的文档结构,完美还原:

  • 文本内容(保留格式)
  • 表格(完整单元格结构)
  • 数学公式(LaTeX 格式)
  • 图表和图形
  • 复杂排版布局(多栏、页眉页脚)
  • 阅读顺序和文档结构

适用于: 学术论文、财务报告、发票、法律文档、多栏排版

ClawHub 地址: paddleocr-doc-parsing

🔍 精准文字识别 (Text Recognition)

快速精准地从图片和 PDF 中提取文本,返回结构化的 JSON 数据,非常适合开发者做二次处理。

适用于: 截图、照片、扫描件、简单文本提取、快速 OCR 任务

ClawHub 地址: paddleocr-text-recognition


技能对比

功能 文档解析 文字识别
主要用途 复杂文档理解 快速文本提取
表格 ✅ 完整结构保留 ⚠️ 仅文本
公式 ✅ LaTeX 输出
图表 ✅ 智能分析
版面分析 ✅ 完整结构
速度 中等 快速
输出格式 Markdown + JSON JSON
适用场景 学术论文、报告、发票 截图、简单图片

如何选择

使用文档解析:

  • 包含表格的文档(发票、财务报告、电子表格)
  • 包含数学公式的文档(学术论文、科学文献)
  • 包含图表和图形的文档
  • 多栏排版(报纸、杂志、宣传册)
  • 任何需要结构化理解的文档

使用文字识别:

  • 简单的纯文本提取
  • 速度优先的 OCR 任务
  • 截图或清晰文本的简单图片
  • 需要结构化 JSON 输出进行处理

为什么重要

痛点问题

当把 PDF 或图片发送给 AI 助手时,经常会出现:

  • 表格结构丢失
  • 公式识别错误
  • 多栏排版混乱
  • 重要格式细节遗漏

解决方案

PaddleOCR Skills 提供:

  • 精准度:来自 PaddleOCR 的业界领先 OCR 技术(GitHub 80K+ 星)
  • 完整性:保留所有文档结构
  • 简单:一句提示词即可在 OpenClaw 中安装
  • 免费额度:官方 API 每天免费解析数万页文档

准备工作

安装 PaddleOCR Skills 前,你需要:

  1. ClawHub 账号 - 在 clawhub.ai 注册
  2. PaddleOCR API 访问权限 - 在 paddleocr.com 注册

安装指南

第一步:获取 ClawHub Token

  1. 访问 www.clawhub.ai 并完成注册登录
  2. 依次点击左侧菜单栏:SettingsCreate Tokens
  3. 生成并复制以 clh_ 开头的 Token

第二步:获取 PaddleOCR API 凭证

  1. 访问 https://www.paddleocr.com 并注册
  2. 点击 API 按钮
  3. 找到以下接口:
    • PaddleOCR-VL-1.5(文档解析)
    • PP-OCRv5(文字识别)
  4. 复制各自的 API_URLTOKEN

划重点: 官方目前支持申请每天免费解析数万页文档,羊毛必须薅!

第三步:一句话安装

把获取的 Token 和 API 地址,替换到下面这段提示词中,直接发给你的 OpenClaw:

请帮我安装 PaddleOCR 技能:
ClawHub Token: [填入你的 ClawHub Token,以 clh_ 开头]
PaddleOCR API 配置:
- 文档解析 API: [填入你的文档解析 API 地址]
- 文字识别 API: [填入你的文字识别 API 地址]
- Access Token: [填入你的 PaddleOCR 访问令牌]
执行要求:请严格按照以下流程自动完成:
登录 ClawHub → 安装依赖 → 安装技能 → 写入配置 → 执行测试 → 向我汇报安装报告。

完成!OpenClaw 会自动:

  1. 登录 ClawHub
  2. 安装依赖
  3. 安装技能
  4. 写入配置
  5. 执行测试
  6. 汇报安装报告

资源链接


联系我们

扫描下方二维码关注微信公众号,获取更多 AI 技巧和教程:

微信公众号二维码


许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件。


为 OpenClaw 社区用心制作 ❤️