Replies: 1 comment 1 reply
-
针对宽高比非常大的图片数据集(如1600x20),在使用PaddleOCR的检测模型时,出现的问题以及可能的解决方案如下: 问题分析
可能的解决方案1. 数据预处理优化
2. 模型结构调整
3. 调整后处理参数
4. 数据集扩展
5. 模型训练技巧
6. 可视化与调试
相关参考在PaddleOCR常见问题中提到了一些关于特殊场景优化的建议:
总结针对宽高比极大的图片数据集,建议从数据预处理、模型结构、后处理参数和训练技巧四个方面进行优化。同时,结合可视化分析和调试,逐步解决问题,提高模型在此类极端场景下的表现。如果问题持续存在,可考虑向PaddleOCR社区提交Issue,反馈具体问题并寻求进一步支持。 Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking
🐛 Bug (问题描述)
数据集的所有图片为1600*20左右(宽1600,高20)200多张。使用ppocrv3原始检测模型(student)预测无法正常检测。但是导出的模型在C++ DEMO上可以检测出来。
使用该数据集进行训练,训练的过程中损失可以下降,但EVAL的ACC一直是0(编辑距离ACC也是0)。训练100个EPOCH后的模型可以检测出部分文字,但是其ACC低于原始模型。
个人认为paddleocr对宽高比很大的图片的检测模型存在漏洞,能否查一下问题在哪里?
🏃♂️ Environment (运行环境)
windows11
paddleocr2.6.1和paddleocr-main(目前最新)
paddlepaddle 2.5.2/2.4.2/2.6 post116
python 3.9
硬件配置:
32G内存/GTX4060
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
如复现应该可以建立数据集的图片为1600*20左右(宽1600,高20)若干张标注后训练
Beta Was this translation helpful? Give feedback.
All reactions