PP-OCRv5误检测率升高
#15576
Replies: 3 comments
-
您好,感谢您的反馈,我们先自测一下,尝试是否可以通过后处理调节 |
Beta Was this translation helpful? Give feedback.
0 replies
-
@eritpchy v5 的迭代初衷更多希望一个模型解决手写、印刷体、中英文等多个场景,数据的丰富度要比 v4 高很多,所以在不同的场景可能表现差异也比较大。我们在文档场景里测试确实效果会比 V4 好很多。但在您的这个场景确实也带来了更高的误检,可以结合合模型的特点和使用场景调一下后处理的参数,比如我观察到在您的这些场景中误检的框的dt_score都不会很大,而真正字幕的框 dt_score基本都在 0.9 左右。后续我们也会持续优化,争取带来更好的体验,非常感谢您的反馈! |
Beta Was this translation helpful? Give feedback.
0 replies
-
@eritpchy 我在测试指令中加入了 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking
🐛 Bug (问题描述)
@Sunting78 测试案例来了
用例我都写好了, 按下面仓库里面执行就都有了
问题:
problem/output_server_det/test3/processed_test3.mp4_000003.867.jpg
problem/output_server_det/test1/processed_test1.mp4_000012.812.jpg
problem/output_server_det/test1/processed_test1.mp4_000058.885.jpg
problem/output_server_det/test1/processed_test1.mp4_000106.066.jpg
奇怪的问题:


在上面截图中 V5-mobile继承了V4-server 一样的错误, 反过来另外两个却没有这个现象, 所以V5-mobile是基于V4-server学习出来的? (我只是猜测, 并不是很关心)
当然, 上述案例有可能是因为V5(大幅?)增强了手写文字识别导致的, 因此我想问问未来有没有可能出个专门针对印刷体的det (ch-doc-det?)
🏃♂️ Environment (运行环境)
Docker python:3.11 image
paddlepaddle-gpu==3.0.0
paddleocr==3.0.0
cpu, onnxruntime-directml 都一样都测过了
Windows python3.12 + paddleocr==2.10.0 + onnx 表现也一样
以上用例均用命令行进行字幕检测
paddleocr text_detection -i {frames_dir} --save_path={v5_results_dir} --device gpu:0 --model_name {v5_model_name}
paddleocr text_detection -i {frames_dir} --save_path={v4_results_dir} --device gpu:0 --model_name {v4_model_name}
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
https://github.com/eritpchy/PaddleOCR-3.0.0-TestCase/
Beta Was this translation helpful? Give feedback.
All reactions