[Test] Add Deepseek3.2-exp-w8a8 nightly test

zhangxinyuehfad · zhangxinyuehfad · commit 5df52199e53e · 2025-11-09T19:25:21.000+08:00
Signed-off-by: hfadzxy &lt;starmoon_zhang@163.com&gt;
diff --git a/.github/workflows/vllm_ascend_test_nightly_a3.yaml b/.github/workflows/vllm_ascend_test_nightly_a3.yaml
@@ -106,6 +106,9 @@ jobs:
           - name: multi-node-qwen3-dp
             config_file_path: Qwen3-235B-A3B.yaml
             size: 2
+          - name: multi-node-deepseek3.2-exp-dp
+            config_file_path: tests/e2e/nightly/multi_node/config/models/DeepSeek3_2-Exp-W8A8.yaml
+            size: 2
           - name: multi-node-dpsk-4node-pd
             config_file_path: DeepSeek-R1-W8A8.yaml
             size: 4
diff --git a/tests/e2e/nightly/multi_node/config/models/DeepSeek3_2-Exp-W8A8.yaml b/tests/e2e/nightly/multi_node/config/models/DeepSeek3_2-Exp-W8A8.yaml
@@ -0,0 +1,86 @@
+test_name: "test DeepSeek-V3.2-Exp-W8A8 disaggregated_prefill"
+model: "vllm-ascend/DeepSeek-V3.2-Exp-W8A8"
+num_nodes: 2
+npu_per_node: 16
+env_common:
+  VLLM_USE_MODELSCOPE: true
+  OMP_PROC_BIND: false
+  OMP_NUM_THREADS: 100
+  HCCL_BUFFSIZE: 1024
+  SERVER_PORT: 8080
+disaggregated_prefill:
+  enabled: true
+  prefiller_host_index: [0]
+  decoder_host_index: [1]
+
+deployment:
+  -
+    server_cmd: >
+        vllm serve "vllm-ascend/DeepSeek-V3.2-Exp-W8A8"
+        --host 0.0.0.0
+        --port $SERVER_PORT
+        --data-parallel-size 2
+        --data-parallel-size-local 2
+        --tensor-parallel-size 8
+        --seed 1024
+        --enable-expert-parallel
+        --max-num-seqs 16
+        --max-model-len 8192
+        --max-num-batched-tokens 8192
+        --quantization ascend
+        --trust-remote-code
+        --no-enable-prefix-caching
+        --gpu-memory-utilization 0.9
+        --kv-transfer-config
+        '{"kv_connector": "MooncakeConnector",
+        "kv_role": "kv_producer",
+        "kv_port": "30000",
+        "engine_id": "0",
+        "kv_connector_module_path": "vllm_ascend.distributed.mooncake_connector",
+        "kv_connector_extra_config": {
+                  "prefill": {
+                          "dp_size": 2,
+                          "tp_size": 8
+                  },
+                  "decode": {
+                          "dp_size": 2,
+                          "tp_size": 8
+                  }
+            }
+        }'
+
+  -
+    server_cmd: >
+        vllm serve "vllm-ascend/DeepSeek-V3.2-Exp-W8A8"
+        --host 0.0.0.0
+        --port $SERVER_PORT
+        --data-parallel-size 2
+        --data-parallel-size-local 2
+        --tensor-parallel-size 8
+        --seed 1024
+        --quantization ascend
+        --max-num-seqs 16
+        --max-model-len 8192
+        --max-num-batched-tokens 8192
+        --enable-expert-parallel
+        --trust-remote-code
+        --no-enable-prefix-caching
+        --gpu-memory-utilization 0.9
+        --kv-transfer-config
+        '{"kv_connector": "MooncakeConnector",
+        "kv_role": "kv_consumer",
+        "kv_port": "30200",
+        "engine_id": "1",
+        "kv_connector_module_path": "vllm_ascend.distributed.mooncake_connector",
+        "kv_connector_extra_config": {
+                  "prefill": {
+                          "dp_size": 2,
+                          "tp_size": 8
+                  },
+                  "decode": {
+                          "dp_size": 2,
+                          "tp_size": 8
+                  }
+            }
+        }'
+benchmarks:
diff --git a/tests/e2e/nightly/multi_node/scripts/run.sh b/tests/e2e/nightly/multi_node/scripts/run.sh
@@ -107,6 +107,90 @@ install_ais_bench() {
     cd -
 }
 
+install_go() {
+    # Check if Go is already installed
+    if command -v go &> /dev/null; then
+        GO_VERSION=$(go version | awk '{print $3}')
+        if [[ "$GO_VERSION" == "go$GOVER" ]]; then
+            echo -e "${YELLOW}Go $GOVER is already installed. Skipping...${NC}"
+        else
+            echo -e "${YELLOW}Found Go $GO_VERSION. Will install Go $GOVER...${NC}"
+            download_go
+        fi
+    else
+        download_go
+    fi
+
+    # Add Go to PATH if not already there
+    if ! grep -q "export PATH=\$PATH:/usr/local/go/bin" ~/.bashrc; then
+        echo -e "${YELLOW}Adding Go to your PATH in ~/.bashrc${NC}"
+        echo 'export PATH=$PATH:/usr/local/go/bin' >> ~/.bashrc
+        echo -e "${YELLOW}Please run 'source ~/.bashrc' or start a new terminal to use Go${NC}"
+    fi
+    export PATH=$PATH:/usr/local/go/bin
+}
+
+install_extra_components() {
+    echo "====> Installing extra components for DeepSeek-R1-W8A8"
+    
+    mkdir -p /vllm-workspace/CANN
+    
+    if ! wget -q https://vllm-ascend.obs.cn-north-4.myhuaweicloud.com/vllm-ascend/a3/CANN-custom_ops-sfa-linux.aarch64.run; then
+        echo "Failed to download CANN-custom_ops-sfa-linux.aarch64.run"
+        return 1
+    fi
+    chmod +x ./CANN-custom_ops-sfa-linux.aarch64.run
+    ./CANN-custom_ops-sfa-linux.aarch64.run --quiet
+    
+    export ASCEND_CUSTOM_OPP_PATH=/usr/local/Ascend/ascend-toolkit/latest/opp/vendors/customize:${ASCEND_CUSTOM_OPP_PATH}
+    export LD_LIBRARY_PATH=/usr/local/Ascend/ascend-toolkit/latest/opp/vendors/customize/op_api/lib/:${LD_LIBRARY_PATH}
+    
+    if ! wget -q https://vllm-ascend.obs.cn-north-4.myhuaweicloud.com/vllm-ascend/a3/custom_ops-1.0-cp311-cp311-linux_aarch64.whl; then
+        echo "Failed to download custom_ops wheel"
+        return 1
+    fi
+    pip install custom_ops-1.0-cp311-cp311-linux_aarch64.whl
+    
+    if ! wget -q https://vllm-ascend.obs.cn-north-4.myhuaweicloud.com/vllm-ascend/a3/CANN-custom_ops-mlapo-linux.aarch64.run; then
+        echo "Failed to download CANN-custom_ops-mlapo-linux.aarch64.run"
+        return 1
+    fi
+    chmod +x ./CANN-custom_ops-mlapo-linux.aarch64.run 
+    ./CANN-custom_ops-mlapo-linux.aarch64.run --quiet --install-path=/vllm-workspace/CANN
+    
+    if ! wget -q https://vllm-ascend.obs.cn-north-4.myhuaweicloud.com/vllm-ascend/a3/torch_npu-2.7.1%2Bgitb7c90d0-cp311-cp311-linux_aarch64.whl; then
+        echo "Failed to download torch_npu wheel"
+        return 1
+    fi
+    pip install torch_npu-2.7.1+gitb7c90d0-cp311-cp311-linux_aarch64.whl
+    
+    if ! wget -q https://vllm-ascend.obs.cn-north-4.myhuaweicloud.com/vllm-ascend/a3/libopsproto_rt2.0.so; then
+        echo "Failed to download libopsproto_rt2.0.so"
+        return 1
+    fi
+    cp libopsproto_rt2.0.so /usr/local/Ascend/ascend-toolkit/8.2.RC1/opp/built-in/op_proto/lib/linux/aarch64/libopsproto_rt2.0.so
+    
+    source /vllm-workspace/CANN/vendors/customize/bin/set_env.bash
+    export LD_PRELOAD=/vllm-workspace/CANN/vendors/customize/op_proto/lib/linux/aarch64/libcust_opsproto_rt2.0.so:${LD_PRELOAD}
+    
+    cat >> ~/.bashrc << 'EOF'
+
+# Extra components for DeepSeek-R1-W8A8
+export ASCEND_CUSTOM_OPP_PATH=/usr/local/Ascend/ascend-toolkit/latest/opp/vendors/customize:${ASCEND_CUSTOM_OPP_PATH}
+export LD_LIBRARY_PATH=/usr/local/Ascend/ascend-toolkit/latest/opp/vendors/customize/op_api/lib/:${LD_LIBRARY_PATH}
+source /vllm-workspace/CANN/vendors/customize/bin/set_env.bash
+export LD_PRELOAD=/vllm-workspace/CANN/vendors/customize/op_proto/lib/linux/aarch64/libcust_opsproto_rt2.0.so:${LD_PRELOAD}
+EOF
+    
+    rm -f CANN-custom_ops-sfa-linux.aarch64.run \
+          custom_ops-1.0-cp311-cp311-linux_aarch64.whl \
+          CANN-custom_ops-mlapo-linux.aarch64.run \
+          torch_npu-2.7.1+gitb7c90d0-cp311-cp311-linux_aarch64.whl \
+          libopsproto_rt2.0.so
+    
+    echo "====> Extra components installation completed"
+}
+
 kill_npu_processes() {
   pgrep python3 | xargs -r kill -9
   pgrep VLLM | xargs -r kill -9
@@ -140,6 +224,9 @@ main() {
     checkout_src
     install_sys_dependencies
     install_vllm
+    if [[ "$CONFIG_YAML_PATH" == *"DeepSeek-R1-W8A8.yaml" ]]; then
+        install_extra_components
+    fi
     install_ais_bench
     cd "$WORKSPACE/source_code"
     . $SRC_DIR/vllm-ascend/tests/e2e/nightly/multi_node/scripts/build_mooncake.sh