非常棒的任务，想了解下是否可以分开成pdf （文件类）识别和针对真实图片的识别 #12389

652994331 · 2024-01-12T03:29:32Z

652994331
Jan 12, 2024

项目很棒，但作为OCR初学者，大量的算法和模块让我在学习的时候感觉有点没理清楚。再日常的一些工作中，大量的内容实际上是pdf, word 这样的文档使用ocr识别。我理解这个可以说和真实照片的识别是有关联，但似乎更加的简单一些。在paddle的算法储备这里，我看到了大量的算法，想问下，项目是否分了比如pdf文档类和真实照片类的这样的区分，便于可以初学者可以快速定位到具体想学习的方向。或者这两者本身是相关联的，算法是可以统一使用的呢。谢谢您指教

Answered by tink2123

Jan 18, 2024

目前来看大部分情况下算法是通用的，文档或真实图片模型只取决于训练数据的不同。因此不好在模型层面做区分。如果对文档场景感兴趣，欢迎关注PaddleX中的文档OCR模型：https://aistudio.baidu.com/application/detail/10368

View full answer

tink2123 · 2024-01-18T10:07:52Z

tink2123
Jan 18, 2024
Collaborator

目前来看大部分情况下算法是通用的，文档或真实图片模型只取决于训练数据的不同。因此不好在模型层面做区分。如果对文档场景感兴趣，欢迎关注PaddleX中的文档OCR模型：https://aistudio.baidu.com/application/detail/10368

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

非常棒的任务，想了解下是否可以分开成pdf （文件类）识别和针对真实图片的识别 #12389

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

非常棒的任务， 想了解下是否可以分开成pdf （文件类）识别 和 针对真实图片的识别 #12389

Uh oh!

652994331 Jan 12, 2024

Replies: 1 comment

Uh oh!

tink2123 Jan 18, 2024 Collaborator

非常棒的任务，想了解下是否可以分开成pdf （文件类）识别和针对真实图片的识别 #12389

652994331
Jan 12, 2024

tink2123
Jan 18, 2024
Collaborator