Use layer_types instead of full_attn_idxs

tdakhran · tdakhran · commit 2ddfa277f8f9 · 2025-07-10T18:27:43.000+02:00
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -6971,7 +6971,10 @@ def _add_feed_forward_length(self):
 
     def set_gguf_parameters(self):
         # set num_key_value_heads only for attention layers
-        self.hparams["num_key_value_heads"] = [(self.hparams["num_key_value_heads"] if x in self.hparams["full_attn_idxs"] else 0) for x in range(self.block_count)]
+        self.hparams["num_key_value_heads"] = [
+            self.hparams["num_key_value_heads"] if layer_type == "full_attention" else 0
+            for layer_type in self.hparams["layer_types"]
+        ]
 
         super().set_gguf_parameters()
         self.gguf_writer.add_vocab_size(self.hparams["vocab_size"])