System Info / 系統信息
@zionzhyang
请观察一下这行代码:
result = big_tensor[0:tensor_len, 0:tensor_len].clone()
clone() 调用会导致训练时机器内存【不是显存】缓慢泄露,建议删除。 自己尝试训练时这行代码把训练机器都给卡死了,去掉之后目前是正常的。
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
Reproduction / 复现过程
Just train the flow model with this code
Expected behavior / 期待表现
fixit