Revert "phi-4-mm TEXT-ONLY for now"

ngxson · ngxson · commit 5283a150205f · 2025-03-02T13:22:37.000+01:00
This reverts commit 21aa2f5.
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -2718,7 +2718,7 @@ def set_gguf_parameters(self):
         self.gguf_writer.add_add_bos_token(False)
 
 
-@Model.register("Phi3ForCausalLM", "Phi4MMForCausalLM")
+@Model.register("Phi3ForCausalLM")
 class Phi3MiniModel(Model):
     model_arch = gguf.MODEL_ARCH.PHI3
 
@@ -2729,7 +2729,7 @@ def set_vocab(self):
             with open(tokenizer_config_file, "r", encoding="utf-8") as f:
                 tokenizer_config_json = json.load(f)
                 tokenizer_class = tokenizer_config_json['tokenizer_class']
-                if tokenizer_class == 'GPT2Tokenizer' or tokenizer_class == 'GPT2TokenizerFast':
+                if tokenizer_class == 'GPT2Tokenizer':
                     return self._set_vocab_gpt2()
 
         from sentencepiece import SentencePieceProcessor
@@ -2895,16 +2895,6 @@ def generate_extra_tensors(self) -> Iterable[tuple[str, Tensor]]:
         yield (self.format_tensor_name(gguf.MODEL_TENSOR.ROPE_FACTORS_LONG), torch.tensor(long_factors, dtype=torch.float32))
         yield (self.format_tensor_name(gguf.MODEL_TENSOR.ROPE_FACTORS_SHORT), torch.tensor(short_factors, dtype=torch.float32))
 
-    def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
-        if "base_layer" in name:
-            name = name.replace("base_layer.", "")
-        # TODO: a big TODO, for simplification, we are skipping multimodal tensors for now
-        if name.startswith("model.embed_tokens_extend") or "lora_" in name:
-            logger.error(f"Skipping multimodal tensor: {name!r}")
-            return []
-        else:
-            return super().modify_tensors(data_torch, name, bid)
-
 
 @Model.register("PhiMoEForCausalLM")
 class PhiMoeModel(Phi3MiniModel):