latex公式识别
#14487
Replies: 2 comments 1 reply
-
图片中是每隔200步记录一次的 |
Beta Was this translation helpful? Give feedback.
0 replies
-
从你的描述来看,问题的核心是模型在训练时表现良好,但在测试阶段(无论是测试集还是训练集)预测结果与真实值严重不符,输出乱码。这种情况通常是由以下几种原因之一导致的: 1. 解码器或后处理逻辑问题
2. 数据预处理不一致
3. 训练过程中过拟合或漂移
4. 模型权重保存或加载错误
5. 损失函数或指标计算问题
6. 字符字典及Tokenization问题
具体推荐操作根据你的描述,建议按以下顺序操作:
结论从你的描述中,最可能的原因是测试阶段的解码器逻辑或字符字典的使用不一致。建议优先从解码器和字典入手排查。如果仍然无法解决,可以尝试将训练日志和更多上下文(如修改的代码段)提供出来,以便更具体地定位问题。 希望对你有所帮助! Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
在原来基础上改了些代码,现在训练时的效果特别好,第一个epoch_rate就已经达到0.9。在训练时指标看着也没有过拟合的迹象,但是在测试模型时输出的预测结果和真实的结果完全 不一样。并且我使用训练集来进行测试,结果也是一样的,预测 ['{{{{{{{{{{{{{{{{{', '\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,']

真实 ['\sigma(42)=96=3\times4\times8=\sigma(2)\times\sigma(3)\times\sigma(7)=1+2+3+6+7+14+21+42', 't\rightarrow t+\xi^{t}(x,X^{a})\,,\quad x^{m}\rightarrow x^{m}+\xi^{m}(x,X),\quad X^{a}\rightarrow X^{a}+\xi^{a}(X)\,,']。
我把 训练日志也传上来,现在不知道到底是什么情况,说是解码器中评估时生成预测输出的代码有问题吧,但是弄到源码中去又能识别出来一些,不会像现在这样乱七八糟的。有没有大佬能看出来是什么问题吗?
train.log
Beta Was this translation helpful? Give feedback.
All reactions