fix: Remove unnecessary duplicate keys in converter

gabe-l-hart · gabe-l-hart · commit e53632b664db · 2025-07-10T16:08:18.000-06:00
Co-authored-by: Francis Couture-Harpin &lt;git@compilade.net&gt;

(thanks for the sharp eyes and patience!)

Branch: GraniteFour

Signed-off-by: Gabe Goodhart &lt;ghart@us.ibm.com&gt;
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -6552,23 +6552,11 @@ def set_gguf_parameters(self):
         specific to this model. The result is some duplication of how the params
         get set. The following warnings are expected during conversion:
 
-        WARNING:Duplicated key name 'granitehybrid.embedding_length'
-        WARNING:Duplicated key name 'granitehybrid.block_count'
-        WARNING:Duplicated key name 'granitehybrid.vocab_size'
-        WARNING:Duplicated key name 'granitehybrid.feed_forward_length'
-        WARNING:Duplicated key name 'granitehybrid.attention.head_count'
         WARNING:Duplicated key name 'granitehybrid.attention.head_count_kv'
-        WARNING:Duplicated key name 'granitehybrid.attention.layer_norm_rms_epsilon'
         WARNING:Duplicated key name 'granitehybrid.context_length'
         """
         GraniteMoeModel.set_gguf_parameters(self)
 
-        ## General Params ##
-        self.gguf_writer.add_embedding_length(self.d_model)
-        self.gguf_writer.add_block_count(self.block_count)
-        self.gguf_writer.add_vocab_size(self.hparams["vocab_size"])
-        self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
-
         ## Mamba mixer params ##
         self.gguf_writer.add_ssm_conv_kernel(self.find_hparam(["conv_kernel", "d_conv"]))
         self.gguf_writer.add_ssm_state_size(self.find_hparam(["state_size", "d_state"]))
@@ -6585,14 +6573,8 @@ def set_gguf_parameters(self):
         ]
         if rope_dim := self.hparams.get("attn_rotary_emb"):
             self.gguf_writer.add_rope_dimension_count(rope_dim)
-        self.gguf_writer.add_head_count(self.hparams["num_attention_heads"])
         self.gguf_writer.add_head_count_kv(head_count_kv_vec)
 
-        ## Feed Forward Params ##
-        self.gguf_writer.add_layer_norm_rms_eps(
-            self.find_hparam(["layer_norm_epsilon", "rms_norm_eps"], optional=True) or 1e-5
-        )
-
         ## If Bamba, use rope, otherwise don't
         use_rope = "BambaForCausalLM" in self.hparams["architectures"]
         self.gguf_writer.add_rope_scaling_finetuned(use_rope)