文本检测标点符号 #14692
Replies: 4 comments 1 reply
-
在fine-tune ch-PP-OCRv4_det模型后,出现检测框漏检文本行末尾标点符号的问题,可能是由于以下几个原因导致的:
具体操作建议:
参考链接:通过这些调整和优化,应该能够改善模型在检测文本行末尾标点符号时的漏检问题。 Response generated by 🤖 feifei-bot | deepseek-chat |
Beta Was this translation helpful? Give feedback.
-
非常感谢你的及时回复。 |
Beta Was this translation helpful? Give feedback.
-
关于文本检测标注框的大小选择,我来分享一些建议:
示例参考尺寸:
一个实用的检验方法是:当你标完数据后,可以先用基础模型在你的标注数据上做检测测试。如果出现明显的重复检测问题,再适当调整标注策略。记住,标注的最终目的是帮助模型更好地学习,适当的重叠有时反而能提高模型的鲁棒性。 Response generated by 🤖 feifei-bot | deepseek-chat |
Beta Was this translation helpful? Give feedback.
-
为什么有时候检测框把文字切割了一部分,还是能识别到完整的文字。但检测框把文字切割得太多,识别就会不准? |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking
🐛 Bug (问题描述)
我在fine-tune ch-PP-OCRv4_det模型后,测试发现检测框经常会漏检文本行末尾的标点符号,比如:逗号,句号;文本行中间的符号不会漏检。我在标注的时候已经刻意让标注框完全包含住标点符号。
我想请问一下,如何改善这种问题?不知道修改配置文件中的min_text_size有没有效果?
🏃♂️ Environment (运行环境)
windows 10, paddleocr 2.7,paddlepaddle-gpu 3.0.0b1, cuda 11.8
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
无
Beta Was this translation helpful? Give feedback.
All reactions