Skip to content

Commit 0e8fc84

Browse files
committed
doc
1 parent c42434d commit 0e8fc84

File tree

2 files changed

+5
-1
lines changed

2 files changed

+5
-1
lines changed

doc/collective_mode.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -6,6 +6,7 @@
66

77
## 设置config.yaml
88
首先需要在模型的yaml配置中,加入use_fleet参数,并把值设置成True。
9+
同时设置use_gpu为True
910
```yaml
1011
runner:
1112
# 通用配置不再赘述
@@ -41,6 +42,9 @@ def create_optimizer(self, strategy=None):
4142

4243
## 多机多卡训练
4344
使用多机多卡训练,您需要另外一台或多台能够互相ping通的机器。每台机器中都需要安装paddlepaddle-2.0.0-rc-gpu及以上版本的飞桨开源框架,同时将需要运行的paddlerec模型,数据集复制到每一台机器上。
45+
- 首先确保各个节点之间是联通的,相互之间通过IP可访问
46+
- 在每个节点上都需要持有代码与数据
47+
- 在每个节点上执行命令
4448
从单机多卡到多机多卡训练,在代码上不需要做任何改动,只需再额外指定ips参数即可。其内容为多机的ip列表,命令如下所示:
4549
```bash
4650
# 动态图

models/rank/wide_deep/config.yaml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -17,7 +17,7 @@
1717
runner:
1818
train_data_dir: "data/sample_data/train"
1919
train_reader_path: "criteo_reader" # importlib format
20-
use_gpu: True
20+
use_gpu: False
2121
use_auc: True
2222
train_batch_size: 50
2323
epochs: 3

0 commit comments

Comments
 (0)