要识别的目标有多行文本 #15995

yangoono · 2025-07-08T08:00:21Z

yangoono
Jul 8, 2025

图片很多地方有文字，我只要检测其中的一部分。但是这部分有的时候是一行文本有的时候是多行文本，训练完测试后只能识别出其中一行，想请问一下有没有什么解决办法。

liuhongen1234567 · 2025-07-08T08:08:23Z

您好，目前识别模型确实只能识别单行。可以训练一个版面检测模型和ocr多行结果取IoU交集排序，目前PP-StructureV3 采用的就是这种方法。或者直接将检测的结果丢给多模态大模型去识别。

0 replies