PGnet魔改后如何训练 #14558
ChenControl
started this conversation in
Ideas & Features
PGnet魔改后如何训练
#14558
Replies: 1 comment 1 reply
-
PGnet 魔改后如何训练分为以下几个步骤,根据你的问题逐步解答: 问题1:合成训练过程中的 config 配置参考,尤其是预训练学习率(lr)设置根据提供的文档,PGNet 的训练分为两步:
配置参考
配置文件调整在 PaddleOCR 的配置文件中,调整如下: lr:
name: Cosine
learning_rate: 0.00001 # 初始学习率设置为 1e-5
warmup_epoch: 2 # 可设置 warmup 为 2 个 epoch 此外,注意保证以下参数与合成数据训练需求一致:
问题2:如何对固定输入的模型进行预处理?你提到 SynthText 图像整体较扁平,且垂直和水平宽高比与输入尺寸(128×128)不匹配的问题。 预处理方案
其他相关建议
总结
希望以上内容能帮助你顺利完成 PGNet 的魔改训练!如果还有具体问题,欢迎补充! Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
各位,大家好。

原来的Pgnet的backbone采用的是resnet,并且通道数比较多,为了便于部署,特地采用了较小的resnet进行取代,同时以前输入的dynamic dimension的CHW全部进行了固定,如下图所示,输入: float32[DynamicDimension.0,3,128,128]
参考 https://paddlepaddle.github.io/PaddleOCR/main/algorithm/end_to_end/algorithm_e2e_pgnet.html
如上文所述
PGNet训练分为两个步骤:step1: 在合成数据上训练,得到预训练模型,此时模型精度依然较低;step2: 加载预训练模型,在totaltext数据集上训练;为快速训练,我们直接提供了step1的预训练模型。
问题1,在合成训练过程中的config配置能否借鉴一下进行参考,尤其预训练lr要1e-5左右有看到过提示。
问题2,如何对固定输入的模型进行预处理?
之所以问这个问题是发现SynthText图像都很扁平,当垂直和水平宽高比与输入尺寸不匹配时如何处理?是强制调整大小吗?
谢谢!
Beta Was this translation helpful? Give feedback.
All reactions