Skip to content

对于源码没有给出的模型(如DeepSeek-R1-Distill-Qwen-1.5B)该如何使用这个方法? #220

@yabuke

Description

@yabuke

我看源码中需要使用到model.py文件中的modelArgs,但我想要在DeepSeek的模型上使用这个方法,该如何实践?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions