Replies: 2 comments
-
PP-OCRv4_server_rec_doc 是在 PP-OCRv4_server_rec 的基础上训练而成,支持识别 1.5 万+ 字符,包括部分繁体字、日文和特殊字符。因此,它的字典文件应该不同于 在 PP-OCR 体系中,字典文件通常对应于
根据你的需求,PP-OCRv4_server_rec_doc 应该有一个扩展版本的字典文件,以支持 1.5 万+ 的字符。这通常可以在官方模型下载地址或相关配置文件中找到。你可以检查你使用的模型路径,并查看其中是否包含
或者官方可能会提供:
如果不了解具体的字典文件路径,建议参考 PaddleOCR 官方仓库或文档,获取最新的字典文件名称。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
-
Lines 113 to 115 in 5791d75 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
PP-OCRv4_server_rec_doc是在PP-OCRv4_server_rec的基础上,在更多中文文档数据和PP-OCR训练数据的混合数据训练而成,增加了部分繁体字、日文、特殊字符的识别能力,可支持识别的字符为1.5万+,除文档相关的文字识别能力提升外,也同时提升了通用文字的识别能力。既然可支持识别的字符为1.5万+,那对应的字典文件是哪个?应该不是ppocr_keys_v1.txt吧?它才6K+啊。
Beta Was this translation helpful? Give feedback.
All reactions