Replies: 2 comments 1 reply
-
建议参考 https://github.com/PaddlePaddle/PaddleOCR/blob/main/doc/doc_ch/finetune.md |
Beta Was this translation helpful? Give feedback.
1 reply
-
各位大佬们,这种弯折文字具体要怎么训练才能检测出来?我看#1966这里提到: 这个修改网络后处理部分,添加多边形输出是要修改哪里? |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
使用V3检测模型ch_PP-OCRv3_det去检测文本区域时,有的图检测不出文本框。
用V3训练模型调用下面的命令:
python3 tools/infer_det.py -c configsChange/det/ch_PP-OCRv3_det_cml.yml -o Global.infer_img="./train_data/det/testData/origin-13000-13999/" Global.pretrained_model="./pretrain_models/V3/ch_PP-OCRv3_det_distill_train/best_accuracy"
用上面的命令检测应用场景的数据集,然后将检测不出来的图挑出来,使用PPOCRLabel手动标注文本区域。由于检测不出来的图大都文字有些弯曲,所以使用了多点标注。
用挑出来的图进行V3检测模型的训练,训练后的模型基本和原来的没什么差别。看output中的文件修改时间发现,best_accuracy大约在40轮后就没有再变过了,后面的400+轮训练似乎都是无效的。
样例图


标注图


训练时输出的文件

请问对于这些识别不了的图,微调检测模型时要怎么做?上面的做法还有什么遗漏的地方?
是不是在微调时,多点标注的数据是需要改代码才能训练的?
Beta Was this translation helpful? Give feedback.
All reactions