Skip to content

蒸馏损失函数问题 #1

@colinzhaoxp

Description

@colinzhaoxp

你好,感谢您的代码分享,非常棒的工作!

在将DLB迁移到我的工作时,我发现损失函数好像一些问题。
dlb_model.py中的第45行代码,使用了交叉熵损失来计算前后batch之间的损失,但是交叉熵损失传入的第二个参数是一个软标签,导致运行错误。
请问这里是不是有什么问题呢?

非常期待您的回复~

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions