Skip to content

Commit 9ebd2c6

Browse files
committed
doc
1 parent 0e8fc84 commit 9ebd2c6

File tree

2 files changed

+5
-0
lines changed

2 files changed

+5
-0
lines changed

doc/collective_mode.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -53,3 +53,7 @@ python -m paddle.distributed.launch --ips="xx.xx.xx.xx,yy.yy.yy.yy" --gpus 0,1,2
5353
# 静态图执行训练
5454
python -m paddle.distributed.launch --ips="xx.xx.xx.xx,yy.yy.yy.yy" --gpus 0,1,2,3,4,5,6,7 ../../../tools/static_trainer.py -m config.yaml
5555
```
56+
57+
## 修改reader
58+
目前我们paddlerec模型默认使用的reader都是继承自paddle.io.IterableDataset,在reader的__iter__函数中拆分文件,按行处理数据。当 paddle.io.DataLoader 中 num_workers > 0 时,每个子进程都会遍历全量的数据集返回全量样本,所以数据集会重复 num_workers 次,也就是每张卡都会获得全部的数据。您在训练时可能需要调整学习率等参数以保证训练效果。
59+
如果需要数据集样本不会重复,可通过 [paddle.io.get_worker_info](https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/fluid/dataloader/dataloader_iter/get_worker_info_cn.html#get-worker-info) 获取各子进程的信息。并在 __iter__ 函数中划分各子进程的数据。[paddle.io.IterableDataset](https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/fluid/dataloader/dataset/IterableDataset_cn.html#iterabledataset)的相关信息以及划分数据的示例可以点击这里获取。

doc/yaml.md

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -24,6 +24,7 @@
2424
| use_inference | bool | True/False || 是否使用save_inference_model接口保存 |
2525
| save_inference_feed_varnames | list[string] | 组网中指定Variable的name || 预测模型的入口变量name |
2626
| save_inference_fetch_varnames | list[string] | 组网中指定Variable的name || 预测模型的出口变量name |
27+
| use_fleet | bool | True/False || 指定是否使用分布式运行单机多卡或多机多卡 |
2728

2829

2930
## hyper_parameters变量

0 commit comments

Comments
 (0)