Replies: 4 comments 1 reply
-
ch_PP-OCRv4 训练数据可能存在不均衡的情况,因此在某些特定字符上的识别效果可能较差。例如,如果训练数据中某些汉字的样本较少,模型在实际识别这些字时可能会产生错误或无法识别。 关于字典的覆盖范围,PaddleOCR 自带的中文识别字典可能并未包含所有区县级或村级的地名,因此对于一些特殊的汉字(如 "垱"),可能无法正确识别。解决方案包括:
如果你希望提高对特定字符的识别效果,可以考虑使用 PaddleOCR 提供的自定义字典和训练接口,来增强模型的适用性。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
-
多谢了 |
Beta Was this translation helpful? Give feedback.
-
多谢了 |
Beta Was this translation helpful? Give feedback.
-
后续会考虑更新ch_PP-OCRv4吗,优化这方面识别问题 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
我使用ch_PP-ocrv4模型识别一些拍照图像,发现有部分文字很容易识别错误,模型训练数据是不是每个标签字典不平衡,部分字数据量很少导致识别错误的,如.

;还有就是中文识别字典能否补全区县到村级地址所涉及的字,如"官垱村"中"垱"字不在字典中

Beta Was this translation helpful? Give feedback.
All reactions