remove dead padding code that got readded in merge

CISC · web-flow · commit 958eea664bdb · 2025-05-29T22:29:34.000+02:00
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -3870,14 +3870,6 @@ def _xlmroberta_set_vocab(self) -> None:
                 scores[token_id] = score
                 toktypes[token_id] = toktype
 
-        if vocab_size > len(tokens):
-            pad_count = vocab_size - len(tokens)
-            logger.debug(f"Padding vocab with {pad_count} token(s) - [PAD1] through [PAD{pad_count}]")
-            for i in range(1, pad_count + 1):
-                tokens.append(bytes(f"[PAD{i}]", encoding="utf-8"))
-                scores.append(-1000.0)
-                toktypes.append(SentencePieceTokenTypes.UNUSED)
-
         if isinstance(tokenizer, SentencePieceProcessor):
             # realign tokens (see HF tokenizer code)
             tokens = [b'<s>', b'<pad>', b'</s>', b'<unk>'] + tokens[3:-1]