PaddleOCR项目数据格式要求与多文本标注问题 #14672

Jerry200404 · 2025-02-13T09:27:19Z

Jerry200404
Feb 13, 2025

进行俄语OCR项目开发（包含手写体和印刷体检测与识别），在数据标注和格式适配过程中遇到以下问题，恳请指导：
一、检测任务数据格式问题
官方文档示例：

疑问点：
1.格式强制性问题：
是否必须严格使用JSON格式？若自定义格式（如下文建议）是否可行？
2.手写体与印刷体的区分标注：
如何在JSON标注中明确区分印刷体（printed）和手写体（handwriting）？是否需要在标注字段中添加额外参数（如"type": "printed"）？
自定义格式设想：
图像路径 x1,y1,x2,y1,x2,y2,x1,y2,标签类型 x1,y1,x2,y1,x2,y2,x1,y2,标签类型 ...
示例：
images/0_0/lhr_0_1000_01184616.jpg 0.58,0.72,0.86,0.72,0.86,0.96,0.58,0.96,printed ...
我在网上查到很多不一样格式，能否给出一个样板。
二、识别任务多文本标注问题
官方文档示例：

单图单标签格式：
图像路径文本标签
示例：
test_images/img_1.jpg "воссоздать"
实际需求：
一张图片中包含多个俄语单词（如下图），需同时识别多个文本：

疑问点：
1.多标签标注方式：
是否支持单图多标签标注？例如：
images/0_0/lhr_0_1000_01184616.jpg воссоздать пивной Винничек коммунизм
若不支持，是否需要通过切割图片将每个单词单独处理？
补充说明：
数据集中同时包含手写体和印刷体俄语文本，需确保标注格式能兼容类型区分。
作为初学者，对PP-v4的数据处理逻辑尚不熟悉，若问题表述不够清晰，还请海涵！
这个项目已经卡主很久了，真心期待您的专业解答，感谢！

GreatV · 2025-02-13T09:34:58Z

GreatV
Feb 13, 2025
Maintainer

PaddleOCR 数据格式要求与多文本标注问题解答

检测任务数据格式问题

1. 格式强制性问题

PaddleOCR官方推荐使用 JSON 格式 进行数据标注，主要是为了兼容性和易解析性。
如果要使用自定义格式，例如：

图像路径 x1,y1,x2,y1,x2,y2,x1,y2,标签类型 x1,y1,x2,y1,x2,y2,x1,y2,标签类型 ...

需要自行 修改数据加载部分 的代码，以适配新的格式，但 不影响训练。

2. 手写体与印刷体的区分标注

官方 JSON 格式 默认不区分 手写体和印刷体，但可以 在 JSON 标注字段中添加额外参数，例如：

{
  "image": "images/0_0/lhr_0_1000_01184616.jpg",
  "annotations": [
    {
      "polygon": [0.58, 0.72, 0.86, 0.72, 0.86, 0.96, 0.58, 0.96],
      "text": "воссоздать",
      "type": "printed"
    },
    {
      "polygon": [0.12, 0.35, 0.46, 0.35, 0.46, 0.62, 0.12, 0.62],
      "text": "коммунизм",
      "type": "handwriting"
    }
  ]
}

这样可以在 训练时针对不同类型文本做数据增强或分类训练。

识别任务多文本标注问题

1. 多标签标注方式

PaddleOCR 默认使用单图单标签格式：

图像路径 文本标签

示例：

test_images/img_1.jpg "воссоздать"

但在实际应用中，一张图片可能包含 多个俄语单词，如：

images/0_0/lhr_0_1000_01184616.jpg    воссоздать пивной Винничек коммунизм

2. 解决方案

方案 1：使用检测模型+识别模型

先 训练检测模型，获取每个单词的框坐标
再 训练识别模型，逐个识别框内文本
优点： 能适应不同文本排布方式
缺点： 需要 额外训练检测模型

方案 2：手动切割图片

预处理时 将一张图拆分为多个小图
采用 单图单标签格式
优点： 适用于 固定排布（如表格）
缺点： 需要 额外预处理数据

参考资料

如果有更具体的需求或问题，欢迎继续讨论！🚀

Response generated by feifei-bot | chatgpt-4o-latest

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

PaddleOCR项目数据格式要求与多文本标注问题 #14672

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

PaddleOCR项目数据格式要求与多文本标注问题 #14672

Uh oh!

Jerry200404 Feb 13, 2025

Replies: 1 comment

Uh oh!

GreatV Feb 13, 2025 Maintainer

PaddleOCR 数据格式要求与多文本标注问题解答

检测任务数据格式问题

1. 格式强制性问题

2. 手写体与印刷体的区分标注

识别任务多文本标注问题

1. 多标签标注方式

2. 解决方案

推荐的 PaddleOCR 适配方式

参考资料

Jerry200404
Feb 13, 2025

GreatV
Feb 13, 2025
Maintainer