diff --git a/docs/api/paddle/distributed/ParallelEnv_cn.rst b/docs/api/paddle/distributed/ParallelEnv_cn.rst index ef37f309a15..3d5f07dc364 100644 --- a/docs/api/paddle/distributed/ParallelEnv_cn.rst +++ b/docs/api/paddle/distributed/ParallelEnv_cn.rst @@ -6,7 +6,7 @@ ParallelEnv .. py:class:: paddle.distributed.ParallelEnv() .. note:: - 不推荐使用这个 API,如果需要获取 rank 和 world_size,建议使用 ``paddle.distributed.get_rank()`` 和 ``paddle.distributed.get_world_size()`` 。 + 不推荐使用这个 API,如果需要获取 rank 和 world_size,建议使用 ``paddle.distributed.get_rank()`` 和 ``paddle.distributed.get_world_size()`` 。 这个类用于获取动态图模型并行执行所需的环境变量值。 @@ -24,7 +24,7 @@ rank 当前训练进程的编号。 -此属性的值等于环境变量 `PADDLE_TRAINER_ID` 的值。默认值是 0。 +此属性的值等于环境变量 ``PADDLE_TRAINER_ID`` 的值。默认值是 0。 **代码示例** @@ -35,7 +35,7 @@ world_size 参与训练进程的数量,一般也是训练所使用 GPU 卡的数量。 -此属性的值等于环境变量 `PADDLE_TRAINERS_NUM` 的值。默认值为 1。 +此属性的值等于环境变量 ``PADDLE_TRAINERS_NUM`` 的值。默认值为 1。 **代码示例** @@ -46,7 +46,7 @@ device_id 当前用于并行训练的 GPU 的编号。 -此属性的值等于环境变量 `FLAGS_selected_gpus` 的值。默认值是 0。 +此属性的值等于环境变量 ``FLAGS_selected_gpus`` 的值。默认值是 0。 **代码示例** @@ -57,7 +57,7 @@ current_endpoint 当前训练进程的终端节点 IP 与相应端口,形式为(机器节点 IP:端口号)。例如:127.0.0.1:6170。 -此属性的值等于环境变量 `PADDLE_CURRENT_ENDPOINT` 的值。默认值为空字符串""。 +此属性的值等于环境变量 ``PADDLE_CURRENT_ENDPOINT`` 的值。默认值为空字符串""。 **代码示例** @@ -68,7 +68,7 @@ trainer_endpoints 当前任务所有参与训练进程的终端节点 IP 与相应端口,用于在 NCCL2 初始化的时候建立通信,广播 NCCL ID。 -此属性的值等于环境变量 `PADDLE_TRAINER_ENDPOINTS` 的值。默认值为空字符串""。 +此属性的值等于环境变量 ``PADDLE_TRAINER_ENDPOINTS`` 的值。默认值为空字符串""。 **代码示例** diff --git a/docs/api/paddle/distributed/Strategy_cn.rst b/docs/api/paddle/distributed/Strategy_cn.rst index 2f4909104ba..b7f7655d43e 100644 --- a/docs/api/paddle/distributed/Strategy_cn.rst +++ b/docs/api/paddle/distributed/Strategy_cn.rst @@ -35,11 +35,11 @@ sharding 优化器分片策略,包含以下配置项: - - **``enable``** (bool) - 是否启用优化器分片策略。默认:False。 + - **enable** (bool) - 是否启用优化器分片策略。默认:False。 - - **``stage``** (int) - 可以设置为 1、2 或 3。1 表示切分优化器状态,2 代表切分优化器状态和梯度,3 表示切分优化器状态、梯度和参数。默认:1。 + - **stage** (int) - 可以设置为 1、2 或 3。1 表示切分优化器状态,2 代表切分优化器状态和梯度,3 表示切分优化器状态、梯度和参数。默认:1。 - - **``degree``** (int) - 分片的数量。默认:8。 + - **degree** (int) - 分片的数量。默认:8。 **代码示例** @@ -51,11 +51,11 @@ fused_passes 计算融合策略,包含以下配置项: - - **``enable``** (bool) - 是否启用计算融合策略。默认:False。 + - **enable** (bool) - 是否启用计算融合策略。默认:False。 - - **``gemm_epilogue``** (bool) - 是否融合 ``Linear`` 层中的 ``matmul`` 和 ``add`` 计算。默认:False。 + - **gemm_epilogue** (bool) - 是否融合 ``Linear`` 层中的 ``matmul`` 和 ``add`` 计算。默认:False。 - - **``dropout_add``** (bool) - 是否融合 ``dropout`` 和 ``add`` 计算。默认:False。 + - **dropout_add** (bool) - 是否融合 ``dropout`` 和 ``add`` 计算。默认:False。 **代码示例** @@ -67,11 +67,11 @@ gradient_merge 梯度融合策略,包含以下配置项: - - **``enable``** (bool) - 是否启用梯度融合策略。默认:False。 + - **enable** (bool) - 是否启用梯度融合策略。默认:False。 - - **``k_steps``** (int) - 梯度融合的步数。默认:1。 + - **k_steps** (int) - 梯度融合的步数。默认:1。 - - **``avg``** (bool) - 是否平均梯度。默认:True。 + - **avg** (bool) - 是否平均梯度。默认:True。 **代码示例** @@ -83,13 +83,13 @@ pipeline 流水线并行策略,包含以下配置项: - - **``enable``** (bool) - 是否启用流水线并行策略。默认:False。 + - **enable** (bool) - 是否启用流水线并行策略。默认:False。 - - **``schedule_mode``** (str) - 流水线并行的调度模式。默认:1F1B。 + - **schedule_mode** (str) - 流水线并行的调度模式。默认:1F1B。 - - **``micro_batch_size``** (int) - mini-batch 中包含的每个 micro-batch 的大小。默认:1。 + - **micro_batch_size** (int) - mini-batch 中包含的每个 micro-batch 的大小。默认:1。 - - **``accumulate_steps``** (int) - 累积步数。默认:1。 + - **accumulate_steps** (int) - 累积步数。默认:1。 **代码示例** diff --git a/docs/api/paddle/distributed/parallelize_cn.rst b/docs/api/paddle/distributed/parallelize_cn.rst index 48fcdc01c14..e6297a1d3f5 100644 --- a/docs/api/paddle/distributed/parallelize_cn.rst +++ b/docs/api/paddle/distributed/parallelize_cn.rst @@ -20,7 +20,7 @@ parallelize - **mesh** (paddle.distributed.ProcessMesh,可选) - 模型与优化器(如提供)并行所发生的进程空间。最佳用法:在调用本 API 之前,通过 调用 ``paddle.distributed.set_mesh`` 方法来配置 mesh 信息,并将本 API 的 mesh 参数设置为 None。注意,如果您通过本 API 传递 了 mesh 信息,传入的 mesh 会覆盖外部设置的 mesh。 - - **config** (dict,可选) - 用来指导并行化的配置。该配置是一个字典,键的值可以从``dp_config``,``mp_config`` 与 + - **config** (dict,可选) - 用来指导并行化的配置。该配置是一个字典,键的值可以从 ``dp_config``,``mp_config`` 与 ``pp_config`` 中进行选择,分别来指导数据并行、模型并行与流水线并行的并行化。一个合法的 config 可以是: ``{"dp_config": 请参考本文档 dp_config 部分以获取更多内容, "mp_config": 请参考本文档 mp_config 部分以获取更多内容, "pp_config": 请参考本文档 pp_config 部分以获取更多内容}``。