### Description / 描述 如图第一步loss为500多,在其他模型刚开始的时候都是3-4左右 <img width="2216" height="676" alt="Image" src="https://github.com/user-attachments/assets/eb91dcdb-ba54-45ca-a1ba-a764aadcba6e" /> ### Case Explaination / 案例解释 _No response_