3
3
## 环境准备
4
4
5
5
* ** Linux 版本 (64 bit)**
6
- * ** CentOS 7 (GPU 版本支持 CUDA 11.0 - 12.0 )**
7
- * ** Ubuntu 18 .04 (GPU 版本支持 CUDA 11.0 - 12.0 )**
8
- * ** Ubuntu 20 .04 (GPU 版本支持 CUDA 11.0 - 12.0 )**
9
- * ** Python 版本 3.8/3. 9/3.10/3.11/3.12 (64 bit)**
6
+ * ** Ubuntu 20.04 (GPU 版本支持 CUDA 11.8 - 12.9 )**
7
+ * ** Ubuntu 22 .04 (GPU 版本支持 CUDA 11.8 - 12.9 )**
8
+ * ** Ubuntu 24 .04 (GPU 版本支持 CUDA 11.8 - 12.9 )**
9
+ * ** Python 版本 3.9/3.10/3.11/3.12/3.13 (64 bit)**
10
10
11
11
## 选择 CPU/GPU
12
12
@@ -65,7 +65,7 @@ cd Paddle
65
65
66
66
* GPU 版的 PaddlePaddle:
67
67
```
68
- docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2
68
+ docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:cuda126 -dev
69
69
```
70
70
71
71
如果您的机器不在中国大陆地区,可以直接从 [DockerHub 中的 paddle 镜像仓库](https://hub.docker.com/r/paddlepaddle/paddle/tags) 拉取镜像:
@@ -77,10 +77,10 @@ cd Paddle
77
77
78
78
* GPU 版的 PaddlePaddle(**建议使用较新的镜像,并确保已经成功安装 NVIDIA Container Toolkit**):
79
79
```
80
- docker pull paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2
80
+ docker pull paddlepaddle/paddle:cuda126 -dev
81
81
```
82
82
83
- 上例中,`latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 ` 仅作示意用,表示安装 GPU 版的镜像。如果您还想安装其他 cuda/cudnn 版本的镜像,可以将其替换成其他版本(建议拉取最新的 GPU 版本)。
83
+ 上例中,`cuda126 -dev` 仅作示意用,表示安装 GPU 版的镜像。如果您还想安装其他 cuda/cudnn 版本的镜像,可以将其替换成其他版本(建议拉取最新的 GPU 版本)。
84
84
您可以访问[DockerHub](https://hub.docker.com/r/paddlepaddle/paddle/tags/)获取与您机器适配的镜像。
85
85
86
86
@@ -110,7 +110,7 @@ cd Paddle
110
110
111
111
用从百度拉取的镜像创建容器
112
112
```
113
- docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 /bin/bash
113
+ docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:cuda126 -dev /bin/bash
114
114
```
115
115
116
116
- `--gpus all`: 在 Docker 容器中允许使用 gpu;
@@ -121,11 +121,11 @@ cd Paddle
121
121
122
122
- `-it`: 与宿主机保持交互状态;
123
123
124
- - `ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 `:使用名为`ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 `的镜像创建 Docker 容器,/bin/bash 进入容器后启动/bin/bash 命令。
124
+ - `ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:cuda126 -dev`:使用名为`ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:cuda126 -dev`的镜像创建 Docker 容器,/bin/bash 进入容器后启动/bin/bash 命令。
125
125
126
126
若使用的是从 DockerHub 拉取的镜像创建容器,则修改镜像名即可:
127
127
```
128
- docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it paddlepaddle/paddle:latest -dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 /bin/bash
128
+ docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it paddlepaddle/paddle:cuda126 -dev /bin/bash
129
129
```
130
130
131
131
注意:
@@ -145,7 +145,7 @@ cd /paddle
145
145
git checkout develop
146
146
```
147
147
148
- paddle 支持 Python 3.8 以上版本
148
+ paddle 支持 Python 3.9 以上版本
149
149
150
150
#### 7. 创建并进入/paddle/build 路径下:
151
151
@@ -160,7 +160,7 @@ mkdir -p /paddle/build && cd /paddle/build
160
160
pip3.10 install -r /paddle/python/requirements.txt
161
161
```
162
162
163
- 注意:以上用 Python3.10 命令来举例,如您的 Python 版本为 3.8/3. 9/3.11/3.12,请将上述命令中的 pip3.10 改成 pip3.8/pip3. 9/pip3.11/pip3.12
163
+ 注意:以上用 Python3.10 命令来举例,如您的 Python 版本为 3.9/3.11/3.12/3.13 ,请将上述命令中的 pip3.10 改成 pip3.9/pip3.11/pip3.12/pip3.13
164
164
165
165
#### 9. 执行 cmake:
166
166
@@ -171,7 +171,7 @@ pip3.10 install -r /paddle/python/requirements.txt
171
171
172
172
* 对于需要编译**GPU 版本 PaddlePaddle**的用户:
173
173
```
174
- cmake .. -DPY_VERSION=3.10 -DWITH_GPU=ON
174
+ cmake .. -DPY_VERSION=3.10 -DWITH_GPU=ON -DWITH_DISTRIBUTE=ON
175
175
```
176
176
- 具体编译选项含义请参见[编译选项表](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/install/Tables.html#Compile)
177
177
@@ -205,7 +205,7 @@ pip3.10 install -U [whl 包的名字]
205
205
```
206
206
207
207
注意:
208
- 以上用 Python3.10 命令来举例,如您的 Python 版本为 3.8/3. 9/3.11/3.12,请将上述命令中的 pip3.10 改成 pip3.8/pip3. 9/pip3.11/pip3.12。
208
+ 以上用 Python3.10 命令来举例,如您的 Python 版本为 3.9/3.11/3.12/3.13 ,请将上述命令中的 pip3.10 改成 pip3.9/pip3.11/pip3.12/pip3.13 。
209
209
210
210
#### 恭喜,至此您已完成 PaddlePaddle 的编译安装。您只需要进入 Docker 容器后运行 PaddlePaddle,即可开始使用。更多 Docker 使用请参见[Docker 官方文档](https://docs.docker.com)
211
211
@@ -246,17 +246,15 @@ uname -m && cat /etc/*release
246
246
247
247
#### 3. 安装 NCCL(可选)
248
248
249
- * 如果您需要使用 GPU 多卡,请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.2 ,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA[官方网站](https://developer.nvidia.com/nccl)):
249
+ * 如果您需要使用 GPU 多卡,请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.8 ,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA[官方网站](https://developer.nvidia.com/nccl)):
250
250
251
251
252
252
```
253
- rm -f /usr/local/lib/libnccl.so
254
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-2.10.3-1+cuda11.4.x86_64.rpm
255
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
256
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
257
- rpm -ivh libnccl-2.10.3-1+cuda11.4.x86_64.rpm
258
- rpm -ivh libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
259
- rpm -ivh libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
253
+ wget -q https://nccl2-deb.cdn.bcebos.com/nccl_2.16.2-1+cuda11.8_x86_64.txz --no-check-certificate --no-proxy
254
+ tar xf nccl_2.16.2-1+cuda11.8_x86_64.txz
255
+ cp -a nccl_2.16.2-1+cuda11.8_x86_64/include/* /usr/include/
256
+ cp -a nccl_2.16.2-1+cuda11.8_x86_64/lib/* /usr/lib64
257
+ rm -rf nccl_2.16.2-1+cuda11.8_x86_64 nccl_2.16.2-1+cuda11.8_x86_64.txz
260
258
```
261
259
262
260
@@ -319,13 +317,13 @@ make -j8 && make install
319
317
320
318
(请参照 Python 官方流程安装)
321
319
322
- * c.(Only For Python3)设置 Python3 相关的环境变量,这里以 python3.10 版本示例,请替换成您使用的版本(3.8、3. 9、3.10、3.11、3.12):
320
+ * c.(Only For Python3)设置 Python3 相关的环境变量,这里以 python3.10 版本示例,请替换成您使用的版本(3.9、3.10、3.11、3.12、3.13 ):
323
321
324
322
1. 首先使用
325
323
```
326
324
find `dirname $(dirname $(which python3))` -name "libpython3.so"
327
325
```
328
- 找到 Python lib 的路径,如果是 3.8、3. 9、3.10、3.11、3.12,请将`python3`改成`python3.8`、`python3. 9`,`python3.10`,`python3.11`,`python3.12`,然后将下面[python-lib-path]替换为找到文件路径
326
+ 找到 Python lib 的路径,如果是 3.9、3.10、3.11、3.12、3.13 ,请将`python3`改成`python3.9`,`python3.10`,`python3.11`,`python3.12`,`python3.13 `,然后将下面[python-lib-path]替换为找到文件路径
329
327
330
328
2. 设置 PYTHON_LIBRARIES:
331
329
```
@@ -349,7 +347,7 @@ make -j8 && make install
349
347
```
350
348
(这里将[python-lib-path]的最后两级目录替换为/bin/)
351
349
352
- * d. 安装虚环境`virtualenv`以及`virtualenvwrapper`并创建名为`paddle-venv`的虚环境:(请注意对应 python 版本的 pip3 的命令,如 pip3.8、pip3. 9、pip3.10、pip3.11、pip3.12)
350
+ * d. 安装虚环境`virtualenv`以及`virtualenvwrapper`并创建名为`paddle-venv`的虚环境:(请注意对应 python 版本的 pip3 的命令,如 pip3.9、pip3.10、pip3.11、pip3.12、pip3.13 )
353
351
354
352
1. 安装`virtualenv`
355
353
```
@@ -432,7 +430,7 @@ mkdir build && cd build
432
430
pip3.10 install -r /paddle/python/requirements.txt
433
431
```
434
432
435
- 注意:以上用 Python3.10 命令来举例,如您的 Python 版本为 3.8/3. 9/3.11/3.12,请将上述命令中的 pip3.10 改成 pip3.8/pip3. 9/pip3.11/pip3.12
433
+ 注意:以上用 Python3.10 命令来举例,如您的 Python 版本为 3.9/3.11/3.12/3.13 ,请将上述命令中的 pip3.10 改成 pip3.9/pip3.11/pip3.12/pip3.13
436
434
437
435
#### 12. 执行 cmake:
438
436
@@ -450,19 +448,17 @@ pip3.10 install -r /paddle/python/requirements.txt
450
448
> 请注意 PY_VERSION 参数更换为您需要的 python 版本
451
449
452
450
453
- * 对于需要编译**GPU 版本 PaddlePaddle**的用户:(** CUDA11.0 - CUDA12.0 **)
451
+ * 对于需要编译**GPU 版本 PaddlePaddle**的用户:(** CUDA11.8 - CUDA12.9 **)
454
452
455
- 1. 请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.2 ,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA[官方网站](https://developer.nvidia.com/nccl)):
453
+ 1. 请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.8 ,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA[官方网站](https://developer.nvidia.com/nccl)):
456
454
457
455
458
456
```
459
- rm -f /usr/local/lib/libnccl.so
460
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-2.10.3-1+cuda11.4.x86_64.rpm
461
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
462
- wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
463
- rpm -ivh libnccl-2.10.3-1+cuda11.4.x86_64.rpm
464
- rpm -ivh libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
465
- rpm -ivh libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
457
+ wget -q https://nccl2-deb.cdn.bcebos.com/nccl_2.16.2-1+cuda11.8_x86_64.txz --no-check-certificate --no-proxy
458
+ tar xf nccl_2.16.2-1+cuda11.8_x86_64.txz
459
+ cp -a nccl_2.16.2-1+cuda11.8_x86_64/include/* /usr/include/
460
+ cp -a nccl_2.16.2-1+cuda11.8_x86_64/lib/* /usr/lib64
461
+ rm -rf nccl_2.16.2-1+cuda11.8_x86_64 nccl_2.16.2-1+cuda11.8_x86_64.txz
466
462
```
467
463
468
464
@@ -471,10 +467,10 @@ pip3.10 install -r /paddle/python/requirements.txt
471
467
2. 如果您已经正确安装了`nccl2`,就可以开始 cmake 了:(*For Python3: 请给 PY_VERSION 参数配置正确的 python 版本*)
472
468
473
469
```
474
- cmake .. -DPYTHON_EXECUTABLE:FILEPATH=[您可执行的 Python3 的路径] -DPYTHON_INCLUDE_DIR:PATH=[之前的 PYTHON_INCLUDE_DIRS] -DPYTHON_LIBRARY:FILEPATH=[之前的 PYTHON_LIBRARY] -DWITH_GPU=ON
470
+ cmake .. -DPYTHON_EXECUTABLE:FILEPATH=[您可执行的 Python3 的路径] -DPYTHON_INCLUDE_DIR:PATH=[之前的 PYTHON_INCLUDE_DIRS] -DPYTHON_LIBRARY:FILEPATH=[之前的 PYTHON_LIBRARY] -DWITH_GPU=ON -DWITH_DISTRIBUTE=ON
475
471
```
476
472
477
- 注意:以上涉及 Python3 的命令,用 Python3.10 来举例,如您的 Python 版本为 3.8/3. 9/3.11/3.12,请将上述命令中的 Python3.10 改成 Python3.8/Python3. 9/Python3.11/Python3.12
473
+ 注意:以上涉及 Python3 的命令,用 Python3.10 来举例,如您的 Python 版本为 3.9/3.11/3.12/3.13 ,请将上述命令中的 Python3.10 改成 Python3.9/Python3.11/Python3.12/Python3.13
478
474
479
475
480
476
0 commit comments