|
1 | 1 | # 命令行参数 |
| 2 | + |
2 | 3 | ## 目录 |
| 4 | + |
3 | 5 | - [sft 参数](#sft-参数) |
4 | 6 | - [dpo 参数](#dpo-参数) |
5 | 7 | - [merge-lora infer 参数](#merge-lora-infer-参数) |
6 | 8 | - [app-ui 参数](#app-ui-参数) |
7 | 9 | - [deploy 参数](#deploy-参数) |
8 | 10 |
|
9 | 11 | ## sft 参数 |
| 12 | + |
10 | 13 | - `--model_type`: 表示你选择的模型类型, 默认是`None`. 如果没有指定`model_id_or_path`, 则抛出异常. 如果指定了`model_id_or_path`, 则会根据`model_id_or_path`以及`MODEL_MAPPING`推断`model_type`. `model_type`和`model_id_or_path`这两个参数不能同时指定. 可以选择的`model_type`可以查看`MODEL_MAPPING.keys()`. |
11 | 14 | - `--model_id_or_path`: 表示模型在ModelScope Hub中的`model_id`, 不区分大小写, 默认为`None`. 如果`--model_id_or_path`未被注册, 则会抛出异常. 你可以使用`model_type`的方式指定模型类型, 也可以通过`model_id_or_path`的方式指定模型类型. |
12 | 15 | - `--model_revision`: 表示模型在ModelScope Hub中对应`model_id`的版本号, 默认为`None`. `model_revision`指定为`None`, 则使用注册在`MODEL_MAPPING`中的revision. 否则强制使用命令行传入的`model_revision`. |
|
96 | 99 | - `--gpu_memory_fraction`: 默认为None. 该参数旨在指定显卡最大可用显存比例的情况下运行训练,用于极限测试. |
97 | 100 | - `--train_dataset_mix_ratio`: 默认为0. 该参数定义了如何进行数据集打混训练. 指定该参数时, 训练集会以`train_dataset_mix_ratio`倍数混合`train_dataset_mix_ds`指定的通用知识数据集, 使整体数据集长度达到`train_dataset_sample`. |
98 | 101 | - `--train_dataset_mix_ds`: 默认为`ms-bench`. 用于防止知识遗忘的通用知识数据集. |
99 | | -- `--use_loss_scale`: 默认为True. 生效时会讲Agent的部分字段(Action/Action Input部分)的loss权重加强以强化CoT, 对普通SFT场景没有任何效果. |
| 102 | +- `--use_loss_scale`: 默认为False. 生效时会将Agent的部分字段(Action/Action Input部分)的loss权重加强以强化CoT, 对普通SFT场景没有任何效果. |
100 | 103 |
|
101 | 104 | ### AdaLoRA微调参数 |
102 | 105 |
|
@@ -130,8 +133,8 @@ dpo参数继承了sft参数, 除此之外增加了以下参数: |
130 | 133 | - `--loss_type`: DPOloss类型, 支持'sigmoid', 'hinge', 'ipo', 'kto_pair', 默认值'sigmoid'. |
131 | 134 | - `--sft_beta`: 是否在DPO中加入sft loss, 默认为0.1, 支持[0, 1)区间,最后的loss为(1-sft_beta)*KL_loss + sft_beta * sft_loss. |
132 | 135 |
|
133 | | - |
134 | 136 | ## merge-lora infer 参数 |
| 137 | + |
135 | 138 | - `--model_type`: 默认值为`None`, 具体的参数介绍可以在`sft.sh命令行参数`中查看. |
136 | 139 | - `--model_id_or_path`: 默认值为`None`, 具体的参数介绍可以在`sft.sh命令行参数`中查看. 推荐使用model_type的方式指定. |
137 | 140 | - `--model_revision`: 默认值为`None`. 具体的参数介绍可以在`sft.sh命令行参数`中查看. 如果`model_id_or_path`为None或者是本地的模型目录, 则该参数失效. |
@@ -176,7 +179,6 @@ dpo参数继承了sft参数, 除此之外增加了以下参数: |
176 | 179 | - `--gpu_memory_utilization`: 初始化vllm引擎`EngineArgs`的参数, 默认为`0.9`. 该参数只有在使用vllm时才生效. |
177 | 180 | - `--tensor_parallel_size`: 初始化vllm引擎`EngineArgs`的参数, 默认为`1`. 该参数只有在使用vllm时才生效. |
178 | 181 |
|
179 | | - |
180 | 182 | ## app-ui 参数 |
181 | 183 |
|
182 | 184 | app-ui参数继承了infer参数, 除此之外增加了以下参数: |
|
0 commit comments