[bugfix] fix dimension mismatch in CogView4 attention

OleehyO · OleehyO · commit 6a3a07fcee38 · 2025-01-28T17:36:24.000Z
diff --git a/src/diffusers/models/attention_processor.py b/src/diffusers/models/attention_processor.py
@@ -2837,9 +2837,9 @@ def __call__(
         inner_dim = key.shape[-1]
         head_dim = inner_dim // attn.heads
 
-        query = query.view(batch_size, -1, attn.heads, head_dim).transpose(1, 2)
-        key = key.view(batch_size, -1, attn.heads, head_dim).transpose(1, 2)
-        value = value.view(batch_size, -1, attn.heads, head_dim).transpose(1, 2)
+        query = query.view(batch_size, -1, attn.heads, head_dim)
+        key = key.view(batch_size, -1, attn.heads, head_dim)
+        value = value.view(batch_size, -1, attn.heads, head_dim)
 
         ###############################################3
         # TODO: 直接用qkv_weight算出qkv（注意要先分出num_heads, head_dim），再在head_dims上拆出qkv
@@ -2850,7 +2850,6 @@ def __call__(
         qkv = qkv.view(batch_size, -1, attn.heads, head_dim * 3)
         query, key, value = qkv.chunk(3, dim=-1)
 
-
         # TODO: 校验rope是否apply正确(目前有25%的误差)
         ###############################################3