你好,感谢您的代码分享,非常棒的工作! 在将DLB迁移到我的工作时,我发现损失函数好像一些问题。 dlb_model.py中的第45行代码,使用了交叉熵损失来计算前后batch之间的损失,但是交叉熵损失传入的第二个参数是一个软标签,导致运行错误。 请问这里是不是有什么问题呢? 非常期待您的回复~