Skip to content

Commit ccc284e

Browse files
committed
Merge remote-tracking branch 'upstream/develop' into fix1009
2 parents 4819087 + 025be1d commit ccc284e

File tree

2 files changed

+22
-23
lines changed

2 files changed

+22
-23
lines changed

docs/api/paddle/distributed/Strategy_cn.rst

Lines changed: 13 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -35,11 +35,11 @@ sharding
3535

3636
优化器分片策略,包含以下配置项:
3737

38-
- **``enable``** (bool) - 是否启用优化器分片策略。默认:False。
38+
- **enable** (bool) - 是否启用优化器分片策略。默认:False。
3939

40-
- **``stage``** (int) - 可以设置为 1、2 或 3。1 表示切分优化器状态,2 代表切分优化器状态和梯度,3 表示切分优化器状态、梯度和参数。默认:1。
40+
- **stage** (int) - 可以设置为 1、2 或 3。1 表示切分优化器状态,2 代表切分优化器状态和梯度,3 表示切分优化器状态、梯度和参数。默认:1。
4141

42-
- **``degree``** (int) - 分片的数量。默认:8。
42+
- **degree** (int) - 分片的数量。默认:8。
4343

4444
**代码示例**
4545

@@ -51,11 +51,11 @@ fused_passes
5151

5252
计算融合策略,包含以下配置项:
5353

54-
- **``enable``** (bool) - 是否启用计算融合策略。默认:False。
54+
- **enable** (bool) - 是否启用计算融合策略。默认:False。
5555

56-
- **``gemm_epilogue``** (bool) - 是否融合 ``Linear`` 层中的 ``matmul`` 和 ``add`` 计算。默认:False。
56+
- **gemm_epilogue** (bool) - 是否融合 ``Linear`` 层中的 ``matmul`` 和 ``add`` 计算。默认:False。
5757

58-
- **``dropout_add``** (bool) - 是否融合 ``dropout`` 和 ``add`` 计算。默认:False。
58+
- **dropout_add** (bool) - 是否融合 ``dropout`` 和 ``add`` 计算。默认:False。
5959

6060
**代码示例**
6161

@@ -67,11 +67,11 @@ gradient_merge
6767

6868
梯度融合策略,包含以下配置项:
6969

70-
- **``enable``** (bool) - 是否启用梯度融合策略。默认:False。
70+
- **enable** (bool) - 是否启用梯度融合策略。默认:False。
7171

72-
- **``k_steps``** (int) - 梯度融合的步数。默认:1。
72+
- **k_steps** (int) - 梯度融合的步数。默认:1。
7373

74-
- **``avg``** (bool) - 是否平均梯度。默认:True。
74+
- **avg** (bool) - 是否平均梯度。默认:True。
7575

7676
**代码示例**
7777

@@ -83,13 +83,13 @@ pipeline
8383

8484
流水线并行策略,包含以下配置项:
8585

86-
- **``enable``** (bool) - 是否启用流水线并行策略。默认:False。
86+
- **enable** (bool) - 是否启用流水线并行策略。默认:False。
8787

88-
- **``schedule_mode``** (str) - 流水线并行的调度模式。默认:1F1B。
88+
- **schedule_mode** (str) - 流水线并行的调度模式。默认:1F1B。
8989

90-
- **``micro_batch_size``** (int) - mini-batch 中包含的每个 micro-batch 的大小。默认:1。
90+
- **micro_batch_size** (int) - mini-batch 中包含的每个 micro-batch 的大小。默认:1。
9191

92-
- **``accumulate_steps``** (int) - 累积步数。默认:1。
92+
- **accumulate_steps** (int) - 累积步数。默认:1。
9393

9494
**代码示例**
9595

docs/api/paddle/distributed/fleet/UtilBase_cn.rst

Lines changed: 9 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -9,43 +9,43 @@ UtilBase
99
方法
1010
::::::::::::
1111
all_reduce(input, mode="sum", comm_world="worker")
12-
'''''''''
12+
''''''''''''''''''''''''''''''''''''''''''''''''''
1313
在指定的通信集合间进行归约操作,并将归约结果返回给集合中每个实例。
1414

1515
**参数**
1616

1717
- **input** (list|tuple|numpy.array) – 归约操作的输入。
1818
- **mode** (str) - 归约操作的模式,包含求和,取最大值和取最小值,默认为求和归约。
19-
- **comm_world** (str) - 归约操作的通信集合,包含:server 集合(``server``),worker 集合(``worker``)及所有节点集合(``all``),默认为 worker 集合。
19+
- **comm_world** (str) - 归约操作的通信集合,包含:server 集合 (``server``),worker 集合 (``worker``) 及所有节点集合 (``all``),默认为 worker 集合。
2020

2121
**返回**
2222

23-
Numpy.array|None:一个和``input``形状一致的 numpy 数组或 None。
23+
Numpy.array|None:一个和 ``input`` 形状一致的 numpy 数组或 None。
2424

2525
**代码示例**
2626

2727
COPY-FROM: paddle.distributed.fleet.UtilBase.all_reduce
2828

2929
barrier(comm_world="worker")
30-
'''''''''
30+
''''''''''''''''''''''''''''
3131
在指定的通信集合间进行阻塞操作,以实现集合间进度同步。
3232

3333
**参数**
3434

35-
- **comm_world** (str) - 阻塞操作的通信集合,包含:server 集合(``server``),worker 集合(``worker``)及所有节点集合(``all``),默认为 worker 集合。
35+
- **comm_world** (str) - 阻塞操作的通信集合,包含:server 集合 (``server``),worker 集合 (``worker``) 及所有节点集合 (``all``),默认为 worker 集合。
3636

3737
**代码示例**
3838

3939
COPY-FROM: paddle.distributed.fleet.UtilBase.barrier
4040

4141
all_gather(input, comm_world="worker")
42-
'''''''''
42+
''''''''''''''''''''''''''''''''''''''''
4343
在指定的通信集合间进行聚合操作,并将聚合的结果返回给集合中每个实例。
4444

4545
**参数**
4646

4747
- **input** (int|float) - 聚合操作的输入。
48-
- **comm_world** (str) - 聚合操作的通信集合,包含:server 集合(``server``),worker 集合(``worker``)及所有节点集合(``all``),默认为 worker 集合。
48+
- **comm_world** (str) - 聚合操作的通信集合,包含:server 集合 (``server``),worker 集合 (``worker``) 及所有节点集合 (``all``),默认为 worker 集合。
4949

5050
**返回**
5151

@@ -56,7 +56,7 @@ all_gather(input, comm_world="worker")
5656
COPY-FROM: paddle.distributed.fleet.UtilBase.all_gather
5757

5858
get_file_shard(files)
59-
'''''''''
59+
'''''''''''''''''''''
6060
在数据并行的分布式训练中,获取属于当前训练节点的文件列表。
6161

6262
.. code-block:: text
@@ -77,8 +77,7 @@ get_file_shard(files)
7777
COPY-FROM: paddle.distributed.fleet.UtilBase.get_file_shard
7878

7979
print_on_rank(message, rank_id)
80-
'''''''''
81-
80+
'''''''''''''''''''''''''''''''''
8281
在编号为 `rank_id` 的节点上打印指定信息。
8382

8483
**参数**

0 commit comments

Comments
 (0)