paddleocr的预训练模型,无论是在线版本还是本地离线版本,均无法正确识别法律专业术语“嫖娼”二字,请修复 #14675
-
🔎 Search before asking
🐛 Bug (问题描述)paddleocr的预训练模型无法正确识别法律专业术语“嫖娼”二字,请修复 🏃♂️ Environment (运行环境)win10 🌰 Minimal Reproducible Example (最小可复现问题的Demo) |
Beta Was this translation helpful? Give feedback.
Replies: 3 comments
-
需要自己微调一下识别模型 |
Beta Was this translation helpful? Give feedback.
-
该问题可能与 PaddleOCR 的字符集、训练数据分布或模型的字典文件有关。根据 Issue #14065 的讨论,即使字符表中包含某些字,模型仍可能无法正确识别它们,原因可能包括:
可能的解决方案
如果尝试以上方法后问题仍然存在,可以在 PaddleOCR 官方 GitHub 提交 Issue,附上详细的测试图片、代码以及日志,方便开发者进一步排查。 🔗 相关 Issue: 一个非常奇怪的问题,字符表里面有的字,就是识别不出来 Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
-
您好,目前paddlex的3.0rc版本中的PP-OCRv4_server_rec_doc的模型已经解决你的问题,可以直接用三行代码体验。并且会在下一个版本的paddleocr中集成这个模型。 |
Beta Was this translation helpful? Give feedback.
您好,目前paddlex的3.0rc版本中的PP-OCRv4_server_rec_doc的模型已经解决你的问题,可以直接用三行代码体验。并且会在下一个版本的paddleocr中集成这个模型。