Skip to content
Discussion options

You must be logged in to vote

非常感谢对PP-OCRv5模型的肯定,对于您所遇到的问题,当前确实没有特别好的办法,因为PP-OCRv5是数据驱动的模型,我们在训练时用到了2200w以上的数据,包括手写印刷等等,并且这些数据是不会开源的。所以如果想在增加字典的情况下微调,只会在特定场景表现较好,而很难保持PP-OCRv5原有的能力。
不过如果您是对于手写文本要求较高,可以尝试自己收集手写数据,我们数据收集标注流程在之前的直播课中也提到过,可以微信关注飞桨paddlepaddle查看回放。有其他疑问欢迎提问。

Replies: 1 comment

Comment options

You must be logged in to vote
0 replies
Answer selected by figoshi
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
None yet
2 participants