vllm-project
diff --git a/‎examples/disaggregated_prefill_v1/load_balance_proxy_layerwise_server_example.py‎
Lines changed: 576 additions & 0 deletions b/‎examples/disaggregated_prefill_v1/load_balance_proxy_layerwise_server_example.py‎
Lines changed: 576 additions & 0 deletions
diff --git a/‎examples/disaggregated_prefill_v1/load_balance_proxy_server_example.py‎
Lines changed: 1 addition & 1 deletion b/‎examples/disaggregated_prefill_v1/load_balance_proxy_server_example.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/ut/distributed/test_parallel_state.py‎
Lines changed: 7 additions & 2 deletions b/‎tests/ut/distributed/test_parallel_state.py‎
Lines changed: 7 additions & 2 deletions
@@ -544,4 +544,4 @@ async def healthcheck():
     global global_args
     global_args = parse_args()
     import uvicorn
-    uvicorn.run(app, host=global_args.host, port=global_args.port)
+    uvicorn.run(app, host=global_args.host, port=global_args.port)
@@ -4,8 +4,9 @@
 from vllm.config import ParallelConfig
 
 from vllm_ascend.distributed.parallel_state import (
-    _LMTP, _MC2, _OTP, destroy_ascend_model_parallel, get_lmhead_tp_group,
-    get_mc2_group, get_otp_group, init_ascend_model_parallel)
+    _LMTP, _MC2, _OTP, _P_TP, destroy_ascend_model_parallel,
+    get_lmhead_tp_group, get_mc2_group, get_otp_group, get_p_tp_group,
+    init_ascend_model_parallel)
 
 
 @pytest.fixture
@@ -30,6 +31,7 @@ def test_init_ascend_model_parallel(mock_distributed, parallel_config):
     mock_ascend_config = MagicMock()
     mock_ascend_config.lmhead_tensor_parallel_size = 2
     mock_ascend_config.oproj_tensor_parallel_size = 2
+    mock_ascend_config.pd_tp_ratio = 2
     with patch('vllm_ascend.distributed.parallel_state.model_parallel_initialized', return_value=False), \
          patch('vllm_ascend.distributed.parallel_state.init_model_parallel_group'), \
          patch('vllm_ascend.distributed.parallel_state.get_ascend_config', return_value=mock_ascend_config):
@@ -38,11 +40,14 @@ def test_init_ascend_model_parallel(mock_distributed, parallel_config):
         mc2_group = get_mc2_group()
         lmheadtp_group = get_lmhead_tp_group()
         otp_group = get_otp_group()
+        p_tp_group = get_p_tp_group()
         assert mc2_group is not None
         assert otp_group is not None
         assert lmheadtp_group is not None
+        assert p_tp_group is not None
 
         destroy_ascend_model_parallel()
         assert _MC2 is None
         assert _LMTP is None
         assert _OTP is None
+        assert _P_TP is None