Skip to content

为什么这个模型训练出来只会预测出下一个token?但是... #49

@buaacarzp

Description

@buaacarzp

为什么这个模型训练出来只会预测出下一个token?但是qwen这种模型可以直接回答用户的问题?
比如我问 猫是什么颜色的? 这个模型会接着回答预测下一个token,而qwen是回答答案。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions