使用PP-OCRv5_server_rec进行文字识别,如何使用自定义字典? #17635
Answered
by
liuhongen1234567
LukeStarwalker
asked this question in
Q&A
-
|
我记得之前的一个版本在实例化PaddleOCR时可以添加参数rec_char_dict_path来自定义字典,从而缩小字符的识别范围。现在我使用paddleocr 3.4这个版本,模型使用PP-OCRv5_server_rec,实例化PaddleOCR时再使用这个参数就报错了。这个参数在现在的版本中已经取消了么?我还尝试过修改该模型的interface.yml和config.json中的字典值,修改之后就报list index out of range的错误了。那么如果现在这个版本我想使用自定义字典,我该怎么做呢?是否有相关的文档或者方法呢?谢谢。 |
Beta Was this translation helpful? Give feedback.
Answered by
liuhongen1234567
Feb 26, 2026
Replies: 1 comment 1 reply
-
|
您好,rec_char_dict_path 应该并没有自定义字典功能,只是单纯地传入字典路径,模型权重和字典是一一绑定的,修改了字典,模型预测类别映射就会出现错误,如果一定要修改字典,建议重新微调模型。 可以参考文档识别模块文档 https://www.paddleocr.ai/latest/version3.x/module_usage/text_recognition.html |
Beta Was this translation helpful? Give feedback.
1 reply
Answer selected by
LukeStarwalker
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
您好,rec_char_dict_path 应该并没有自定义字典功能,只是单纯地传入字典路径,模型权重和字典是一一绑定的,修改了字典,模型预测类别映射就会出现错误,如果一定要修改字典,建议重新微调模型。 可以参考文档识别模块文档 https://www.paddleocr.ai/latest/version3.x/module_usage/text_recognition.html