要识别的目标有多行文本
#15995
Replies: 1 comment
-
您好,目前识别模型确实只能识别单行。可以训练一个版面检测模型和ocr多行结果取IoU交集排序,目前PP-StructureV3 采用的就是这种方法。或者直接将检测的结果丢给多模态大模型去识别。 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
图片很多地方有文字,我只要检测其中的一部分。 但是这部分有的时候是一行文本有的时候是多行文本,训练完测试后只能识别出其中一行,想请问一下有没有什么解决办法。
Beta Was this translation helpful? Give feedback.
All reactions