断点训练,精度视乎有所丢失 #14933
Unanswered
kerry-weic
asked this question in
Q&A
断点训练,精度视乎有所丢失
#14933
Replies: 2 comments 1 reply
-
从你的训练日志来看,断点恢复后(第86轮次)的最佳模型精度略微下降(0.993132 → 0.992888)。这个现象在深度学习训练中是预期范围内的,原因可能包括以下几个方面: 可能的原因:
解决方案:
结论:你的情况属于正常的轻微波动,但如果希望避免这种情况,建议在断点恢复训练时确保:
如果使用完整 checkpoint 仍然导致较大精度下降,建议进一步检查训练流程是否有参数丢失或者学习率调度问题。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
0 replies
-
这个是正常的波动吧?可以看看这块之前的epoch的精度波动如何? |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
在进行ocr识别模型微调时,训练轮次为200次,在迭代到40和85轮次的时候被中断,85论次时模型验证精度日志如下:
使用断点训练,第一次模型验证日志如下:
从日志中可以看到85论次模型最佳精度为 0.99313,而使用断点训练(86轮次)后,模型最佳精度变成了 0.992888, 这个是属于预期吗?
使用断点训练脚本如下:
Beta Was this translation helpful? Give feedback.
All reactions