[bugfix] kvcomp for qwen (#594)

wangwenxin0312 · web-flow · commit c24be03f3a02 · 2025-12-29T11:01:05.000+08:00
diff --git a/ucm/sparse/kvcomp/kvcomp_hbm.py b/ucm/sparse/kvcomp/kvcomp_hbm.py
@@ -250,8 +250,9 @@ def attention_begin(
                 k_hash_compute = self.hash_encoder.compute_hash(key).view(
                     torch.bfloat16
                 )
+                valid_k_hash_token = attn_metadata.slot_mapping.flatten().numel()
                 reshape_and_cache_khash_triton(
-                    k_hash_compute,
+                    k_hash_compute[:valid_k_hash_token],
                     attn_metadata.slot_mapping.flatten(),
                     k_hash,
                     block_size=self.block_size,