fix qwen3_moe normalize_qkv

NicholasTao · NicholasTao · commit 7d701cd1de64 · 2025-08-11T11:44:05.000+08:00
Signed-off-by: taoyuxiang &lt;oui.nicholas.tao@gmail.com&gt;
diff --git a/vllm_ascend/models/qwen3_moe.py b/vllm_ascend/models/qwen3_moe.py
@@ -226,9 +226,9 @@ def forward(
             hidden_states: torch.Tensor,
             kv_cache: Optional[torch.Tensor] = None,
             attn_metadata: Optional[AttentionMetadata] = None) -> torch.Tensor:
-        q, k, v = self.normalize_qkv(self.qkv_proj(hidden_states), self.q_size,
-                                     self.kv_size, self.head_dim,
-                                     self.rms_norm_eps)
+        qkv, _ = self.qkv_proj(hidden_states)
+        q, k, v = self.normalize_qkv(qkv, self.q_size, self.kv_size,
+                                     self.head_dim, self.rms_norm_eps)
 
         if (self.torchair_graph_enabled and attn_metadata is not None and
                 attn_metadata.attn_state == AscendAttentionState.DecodeOnly):