本地v4模型漏检严重 #15071

Lipurple · 2025-04-25T07:35:18Z

Lipurple
Apr 25, 2025

https://aistudio.baidu.com/community/app/91660/webUI
在线体验了ocr的功能，非常准确无漏检，但是离线调用了ch_PP-OCRv4_server_det，发现有漏检且文字出现的较为明显，请问线上有什么特别的预处理方式吗？
原图：

检测结果：

Answered by GreatV

Apr 25, 2025

你反馈本地调用 ch_PP-OCRv4_server_det 检测文字时有明显漏检，线上体验非常准确，怀疑线上是否有特殊预处理。结合你提供的现象和官方相关讨论，这种情况目前有不少用户反馈，通常与参数设置和预处理流程有关，具体分析建议如下：

1. 线上和线下模型一致性

百度AI Studio在线体验通常会集成更完善的预处理、后处理，且可能针对实测样本做过微调，而本地部署则完全依赖于你的前处理和参数设置。模型本身理论一致，差异多在数据流和参数。

2. 关键参数影响

请重点关注以下检测参数，漏检多数与其设置不合适有关：

det_db_thresh（默认0.3）：阈值偏高会漏检；尝试调低，如0.2甚至0.15。
det_db_box_thresh（默认0.6）：同理，调低可减少漏检，试试0.4到0.5。
det_limit_side_len：如果图片较大或文字很小，建议调高到1280或更大，保证输入图不被压得太小导致细节丢失。
det_db_unclip_ratio：增大（如2.0~2.5）可让检测框更“大方”，对小字、间距小的行检出有帮助。
drop_score：留意最终识别过滤阈值，可适当调低。

参数调整示例

ocr = PaddleOCR(
    use_angle_cls=True, 
    lang="ch",
    det_db_thresh=0.2,
    det_db_box_thresh=0.4,
    det_limit_side_len=1280,
    det_db_unclip_ratio=2.0
)

3. 预处理细节

线上通常有更…

View full answer

GreatV · 2025-04-25T07:41:47Z

GreatV
Apr 25, 2025
Maintainer

你反馈本地调用 ch_PP-OCRv4_server_det 检测文字时有明显漏检，线上体验非常准确，怀疑线上是否有特殊预处理。结合你提供的现象和官方相关讨论，这种情况目前有不少用户反馈，通常与参数设置和预处理流程有关，具体分析建议如下：

1. 线上和线下模型一致性

百度AI Studio在线体验通常会集成更完善的预处理、后处理，且可能针对实测样本做过微调，而本地部署则完全依赖于你的前处理和参数设置。模型本身理论一致，差异多在数据流和参数。

2. 关键参数影响

请重点关注以下检测参数，漏检多数与其设置不合适有关：

det_db_thresh（默认0.3）：阈值偏高会漏检；尝试调低，如0.2甚至0.15。
det_db_box_thresh（默认0.6）：同理，调低可减少漏检，试试0.4到0.5。
det_limit_side_len：如果图片较大或文字很小，建议调高到1280或更大，保证输入图不被压得太小导致细节丢失。
det_db_unclip_ratio：增大（如2.0~2.5）可让检测框更“大方”，对小字、间距小的行检出有帮助。
drop_score：留意最终识别过滤阈值，可适当调低。

参数调整示例

ocr = PaddleOCR(
    use_angle_cls=True, 
    lang="ch",
    det_db_thresh=0.2,
    det_db_box_thresh=0.4,
    det_limit_side_len=1280,
    det_db_unclip_ratio=2.0
)

3. 预处理细节

线上通常有更周全的预处理流程，比如：

自动二值化、锐化、增亮、去噪等（提高弱字可见度）。
自动旋转/纠偏。
针对不同图片尺寸的自适应调整。

如果本地直接输入原图，建议进行如下处理：

适当锐化或增强对比度（可用OpenCV或PIL增强图像质量）。
手动调整图片到合适分辨率（比如较长边1280或更大）。

4. 检查版本差异与模型路径

如线上和本地的模型版本、语言包、后处理配置等有差异，也有可能导致表现不同。务必确保模型为官方最新版，无错误下载或损坏。

5. 相关社区讨论

该问题在官方社区多有讨论，目前大部分建议均为调低检测阈值、扩大unclip_ratio、提升输入分辨率。有用户实际调整后大幅降低漏检概率。

6. 总结操作建议

调低 det_db_thresh、det_db_box_thresh；
提升 det_limit_side_len，使图片更大，保证小字/密集文字保留细节；
适当提高 det_db_unclip_ratio；
预处理图片时可尝试提升对比度、锐度、清晰度；
确认与线上模型版本、权重、配置一致；
多调试几种参数组合，根据实际效果择优。

如仍有问题，建议附限出现问题的原图与检测结果、修改过的参数配置到官方issue区，开发团队会更有针对性地协助排查。

参考讨论：文本检测漏行的情况很多

Response generated by 🤖 feifei-bot | gpt-4.1

⚠️ This is an AI-generated response. Please verify any critical information.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

本地v4模型漏检严重 #15071

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

本地v4模型漏检严重 #15071

Uh oh!

Lipurple Apr 25, 2025

1. 线上和线下模型一致性

2. 关键参数影响

参数调整示例

3. 预处理细节

Replies: 1 comment

Uh oh!

GreatV Apr 25, 2025 Maintainer

1. 线上和线下模型一致性

2. 关键参数影响

参数调整示例

3. 预处理细节

4. 检查版本差异与模型路径

5. 相关社区讨论

6. 总结操作建议

Lipurple
Apr 25, 2025

GreatV
Apr 25, 2025
Maintainer