字典文件新增字符后，是不是一定需要重头训练模型？ #14991

daijun-hub · 2025-04-09T06:43:45Z

daijun-hub
Apr 9, 2025

1、目前我在字典文件新增字符后，使用预训练模型训练的时候会进行报错，因为字符新增后模型参数维度变了
这个时候我是不是只能重头训练模型？
2、如果重头训练模型，我是不是得把预训练模型的数据源下载下来，和我自己的数据集一起训练？
3、能否不重头训练依旧使用预训练模型

GreatV · 2025-04-09T06:49:18Z

GreatV
Apr 9, 2025
Maintainer

当字典文件中新增字符后，会导致模型的全连接层输出维度改变，因此直接加载之前的预训练模型时会出现维度不匹配报错。针对你的问题，具体回答如下：

字典文件新增字符后，是不是只能重头训练模型？

不是必须完全“重头训练”，但由于新增字符会导致识别模型的输出类别数增加，涉及到模型的最后一层参数（如全连接层），这部分参数在结构发生变化后无法加载。因此，虽然不能直接加载完整的预训练模型但仍然可以加载除最后一层外的其他层的参数，进行“微调”训练。从严格意义上讲，这也属于从头开始训练最后一层，但整个模型并不是完全从零开始训练。

文档中也明确提到：“如果在训练时修改了自定义字典，由于无法加载最后一层FC的参数，在迭代初期acc=0是正常的情况，不必担心，加载预训练模型依然可以加快模型收敛。”

如果需要重新训练，我是不是要下载预训练模型的数据源，结合我自己的数据集一起训练？

不需要下载预训练模型对应的训练数据源。你只需要下载官方提供的预训练模型（如 PP-OCRv3 系列），并将它作为新的训练的初始参数加载。之后用你的自有数据进行微调训练即可，可以适当加入官方建议的一些通用场景数据（如 LSVT、RCTW）来提升泛化能力。

如果字典变更幅度较大，为达到较好效果，建议准备较大规模（比如上万张）的训练数据。

能否不重头训练依旧使用预训练模型？

你可以使用预训练模型作为基础，但由于字符集变化导致输出维度改变，模型最后一层无法直接复用原参数，因此还是需要重新训练模型的最后一层。实际操作中：

保留预训练模型其他层参数（网络主体结构）
修改字典和输出层结构
加载预训练模型时忽略输出层（报错提示维度不一致即可忽略）
用你自己的数据进行继续训练（通常称为迁移学习或微调）

这并不是从零开始训练整个模型，而是利用预训练参数加速新任务的收敛过程。

总结：

字典改动后模型输出会改变，需要重新训练模型的最后一层；
可加载预训练模型的主体部分，加快收敛；
不必下载训练预训练模型的数据，只需下载其模型权重并用自己的数据微调；
不属于完全“重头训练”，但确实无法直接使用原模型推理新字符。

Response generated by 🤖 feifei-bot | chatgpt-4o-latest

⚠️ This is an AI-generated response. Please verify any critical information.

2 replies

daijun-hub Apr 9, 2025
Author

非常感谢回答
再请教一下，虽然不能直接加载完整的预训练模型但仍然可以加载除最后一层外的其他层的参数，这一步是否需要调整代码，或者配置文件，如果不调整，报错的话，是否不需要管它

daijun-hub Apr 9, 2025
Author

能请教一下如何修改代码吗

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

字典文件新增字符后，是不是一定需要重头训练模型？ #14991

Uh oh!

{{title}}

Uh oh!

Replies: 1 comment 2 replies

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

字典文件新增字符后，是不是一定需要重头训练模型？ #14991

Uh oh!

daijun-hub Apr 9, 2025

Replies: 1 comment · 2 replies

Uh oh!

GreatV Apr 9, 2025 Maintainer

Uh oh!

daijun-hub Apr 9, 2025 Author

Uh oh!

daijun-hub Apr 9, 2025 Author

daijun-hub
Apr 9, 2025

Replies: 1 comment 2 replies

GreatV
Apr 9, 2025
Maintainer

daijun-hub Apr 9, 2025
Author

daijun-hub Apr 9, 2025
Author