remove leftover code

stevenkuang-tencent · stevenkuang-tencent · commit 3ecc5d3ce5f2 · 2025-07-27T01:08:40.000+08:00
Signed-off-by: stevenkuang &lt;stevenkuang@tencent.com&gt;
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -7389,11 +7389,6 @@ def set_gguf_parameters(self):
 class HunYuanMoEModel(TextModel):
     model_arch = gguf.MODEL_ARCH.HUNYUAN_MOE
 
-    def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs)
-        # For handling tied embeddings
-        self._tok_embd = None
-
     def set_vocab(self):
         from transformers import AutoTokenizer
         tokenizer = AutoTokenizer.from_pretrained(self.dir_model, trust_remote_code=True)
@@ -7487,9 +7482,6 @@ def set_gguf_parameters(self):
     _experts: list[dict[str, Tensor]] | None = None
 
     def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
-        if name == "model.embed_tokens.weight":
-            self._tok_embd = data_torch.clone()
-
         if name == "lm_head.weight":
             if self.hparams.get("tie_word_embeddings", False):
                 logger.info("Skipping tied output layer 'lm_head.weight'")
@@ -7538,11 +7530,6 @@ def prepare_tensors(self):
 class HunYuanModel(TextModel):
     model_arch = gguf.MODEL_ARCH.HUNYUAN_DENSE
 
-    def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs)
-        # For handling tied embeddings
-        self._tok_embd = None
-
     def set_vocab(self):
         if (self.dir_model / "tokenizer.json").is_file():
             self._set_vocab_gpt2()
@@ -7602,8 +7589,6 @@ def set_gguf_parameters(self):
         super().set_gguf_parameters()
         hparams = self.hparams
 
-        self.gguf_writer.add_expert_shared_feed_forward_length(hparams["intermediate_size"])
-
         # Rope
         rope_scaling = hparams.get("rope_scaling", {})
         if rope_scaling.get("type") == "dynamic":
@@ -7624,12 +7609,7 @@ def set_gguf_parameters(self):
             assert base == 10000.0 and self.hparams["max_position_embeddings"] in [32 * 1024, 256 * 1024] , \
                 "HunYuan dynamic RoPE scaling assumptions changed, please update the logic or context length manually"
 
-    _experts: list[dict[str, Tensor]] | None = None
-
     def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
-        if name == "model.embed_tokens.weight":
-            self._tok_embd = data_torch.clone()
-
         if name == "lm_head.weight":
             if self.hparams.get("tie_word_embeddings", False):
                 logger.info("Skipping tied output layer 'lm_head.weight'")
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -1746,7 +1746,7 @@ void llama_model::load_hparams(llama_model_loader & ml) {
             } break;
         case LLM_ARCH_HUNYUAN_DENSE:
             {
-                ml.get_key(LLM_KV_ATTENTION_LAYERNORM_RMS_EPS,       hparams.f_norm_rms_eps);
+                ml.get_key(LLM_KV_ATTENTION_LAYERNORM_RMS_EPS, hparams.f_norm_rms_eps);
 
                 switch (hparams.n_embd) {
                     case 1024: type = LLM_TYPE_0_5B; break;

Original file line number	Diff line number	Diff line change
`@@ -1746,7 +1746,7 @@ void llama_model::load_hparams(llama_model_loader & ml) {`
`1746`	`1746`	`} break;`
`1747`	`1747`	`case LLM_ARCH_HUNYUAN_DENSE:`
`1748`	`1748`	`{`
`1749`		`- ml.get_key(LLM_KV_ATTENTION_LAYERNORM_RMS_EPS, hparams.f_norm_rms_eps);`
	`1749`	`+ ml.get_key(LLM_KV_ATTENTION_LAYERNORM_RMS_EPS, hparams.f_norm_rms_eps);`
`1750`	`1750`
`1751`	`1751`	`switch (hparams.n_embd) {`
`1752`	`1752`	`case 1024: type = LLM_TYPE_0_5B; break;`