fix unittest

jaedeok-nvidia · jaedeok-nvidia · commit 570a8e60d416 · 2026-01-03T10:34:11.000+09:00
Signed-off-by: Jaedeok Kim &lt;jaedeokk@nvidia.com&gt;
diff --git a/tests/unittest/_torch/test_model_config.py b/tests/unittest/_torch/test_model_config.py
@@ -69,20 +69,20 @@ def test_get_bindings_model_config_attention_dp_attn_tp_override(
     bindings_cfg = model_config.get_bindings_model_config(tokens_per_block=tokens_per_block)
 
     # bindings hidden_size is sharded by attn_tp_size and attn_cp_size.
-    assert bindings_cfg.num_heads == cfg.num_attention_heads // (
-        mapping.attn_tp_size * mapping.attn_cp_size
-    )
-    # bindings hidden_size is sharded by tp_size (not attention TP size).
+    attn_tp_size = mapping.attn_tp_size if not mapping.enable_attention_dp else 1
+    attn_cp_size = mapping.attn_cp_size
+    assert bindings_cfg.num_heads == cfg.num_attention_heads // (attn_tp_size * attn_cp_size)
+    # bindings hidden_size is sharded by attn_tp_size.
     assert bindings_cfg.hidden_size == cfg.hidden_size // mapping.tp_size
     if isinstance(cfg.num_key_value_heads, (list, tuple)):
         expected_num_kv_heads_per_layer = [
-            kv // (mapping.attn_tp_size * mapping.attn_cp_size) for kv in cfg.num_key_value_heads
+            kv // (attn_tp_size * attn_cp_size) for kv in cfg.num_key_value_heads
         ]
         assert list(bindings_cfg.num_kv_heads_per_layer) == expected_num_kv_heads_per_layer
         assert bindings_cfg.num_kv_heads(0) == expected_num_kv_heads_per_layer[0]
     else:
         assert bindings_cfg.num_kv_heads(0) == cfg.num_key_value_heads // (
-            mapping.attn_tp_size * mapping.attn_cp_size
+            attn_tp_size * attn_cp_size
         )
 
     # tp_size-dependent value (uses mapping.tp_size, not attn_tp_size).