removed tensor mappings -> handled by smolvlm

ryan-mangeno · ryan-mangeno · commit 3f4c53225fd2 · 2025-07-10T10:44:13.000-04:00
diff --git a/gguf-py/gguf/tensor_mapping.py b/gguf-py/gguf/tensor_mapping.py
@@ -32,7 +32,6 @@ class TensorNameMap:
             "model.word_embeddings",                     # bailingmoe
             "language_model.model.embed_tokens",         # llama4
             "encoder",                                   # neobert
-            "model.text_model.embed_tokens",             # smoldocling
         ),
 
         # Token type embeddings
@@ -137,7 +136,6 @@ class TensorNameMap:
             "model.layers.{bid}.ln1",                               # rwkv7
             "model.layers.{bid}.input_layernorm",                   # llama4
             "transformer_encoder.{bid}.attention_norm",             # neobert
-            "model.text_model.layers.{bid}.input_layernorm",        # smoldocling
         ),
 
         # Attention norm 2
@@ -181,7 +179,6 @@ class TensorNameMap:
             "transformer.decoder_layer.{bid}.multi_head_attention.query",# Grok
             "transformer.h.{bid}.attn.attention.q_proj",                 # exaone
             "model.layers.{bid}.self_attn.q_proj",                       # llama4
-            "model.text_model.layers.{bid}.self_attn.q_proj",            # smoldocling
         ),
 
         # Attention key
@@ -198,7 +195,6 @@ class TensorNameMap:
             "transformer.decoder_layer.{bid}.multi_head_attention.key",# Grok
             "transformer.h.{bid}.attn.attention.k_proj",               # exaone
             "model.layers.{bid}.self_attn.k_proj",                     # llama4
-            "model.text_model.layers.{bid}.self_attn.k_proj",          # smoldocling
         ),
 
         # Attention value
@@ -214,7 +210,6 @@ class TensorNameMap:
             "transformer.decoder_layer.{bid}.multi_head_attention.value",# Grok
             "transformer.h.{bid}.attn.attention.v_proj",                 # exaone
             "model.layers.{bid}.self_attn.v_proj",                       # llama4
-            "model.text_model.layers.{bid}.self_attn.v_proj",            # smoldocling
         ),
 
         # Attention output
@@ -245,7 +240,6 @@ class TensorNameMap:
             "transformer.h.{bid}.attn.attention.out_proj",                  # exaone
             "model.layers.{bid}.self_attn.o_proj",                          # llama4
             "transformer_encoder.{bid}.wo",                                 # neobert
-            "model.text_model.layers.{bid}.self_attn.o_proj",               # smoldocling
         ),
 
         # Attention output norm
@@ -260,7 +254,6 @@ class TensorNameMap:
         MODEL_TENSOR.ATTN_POST_NORM: (
             "model.layers.{bid}.post_attention_layernorm",                   # gemma2 olmo2    # ge
             "model.layers.{bid}.post_self_attn_layernorm",                   # glm-4-0414
-            "model.text_model.layers.{bid}.post_attention_layernorm",        # smoldocling
         ),
 
         # Rotary embeddings
@@ -358,7 +351,6 @@ class TensorNameMap:
             "transformer.h.{bid}.mlp.c_fc_1",                         # exaone
             "model.layers.{bid}.feed_forward.up_proj",                # llama4 jamba
             "transformer_encoder.{bid}.ffn.w12",                      # neobert
-            "model.text_model.layers.{bid}.mlp.up_proj",              # smoldocling
         ),
 
         MODEL_TENSOR.FFN_UP_EXP: (
@@ -398,7 +390,6 @@ class TensorNameMap:
             "model.layers.{bid}.residual_mlp.w1",                   # arctic
             "transformer.h.{bid}.mlp.c_fc_0",                       # exaone
             "model.layers.{bid}.feed_forward.gate_proj",            # llama4 jamba
-            "model.text_model.layers.{bid}.mlp.gate_proj",          # smoldocling
         ),
 
         MODEL_TENSOR.FFN_GATE_EXP: (
@@ -446,7 +437,6 @@ class TensorNameMap:
             "model.layers.h.{bid}.mlp.c_proj",                        # exaone
             "model.layers.{bid}.feed_forward.down_proj",              # llama4 jamba
             "transformer_encoder.{bid}.ffn.w3",                       # neobert
-            "model.text_model.layers.{bid}.mlp.down_proj",            # smoldocling
         ),
 
         MODEL_TENSOR.FFN_DOWN_EXP: (
@@ -1034,7 +1024,7 @@ class TensorNameMap:
         ),
 
         MODEL_TENSOR.V_MMPROJ_FC: (
-            "model.connector.modality_projection.proj",        # SmolVLM smoldocling
+            "model.connector.modality_projection.proj",        # SmolVLM
         ),
 
         MODEL_TENSOR.V_MMPROJ_MLP: (