@@ -1107,7 +1107,6 @@ void llm_load_vocab(llama_model_loader & ml, llama_model & model) {
11071107 vocab.special_unk_id = LLAMA_TOKEN_NULL;
11081108 vocab.special_sep_id = LLAMA_TOKEN_NULL;
11091109 vocab.special_pad_id = LLAMA_TOKEN_NULL;
1110- vocab.special_cls_id = LLAMA_TOKEN_NULL;
11111110 vocab.special_mask_id = LLAMA_TOKEN_NULL;
11121111 vocab.linefeed_id = LLAMA_TOKEN_NULL;
11131112
@@ -1128,18 +1127,16 @@ void llm_load_vocab(llama_model_loader & ml, llama_model & model) {
11281127 vocab.special_unk_id = 0 ;
11291128 vocab.special_sep_id = LLAMA_TOKEN_NULL;
11301129 vocab.special_pad_id = LLAMA_TOKEN_NULL;
1131- vocab.special_cls_id = LLAMA_TOKEN_NULL;
11321130 vocab.special_mask_id = LLAMA_TOKEN_NULL;
11331131 } else if (tokenizer_model == " bert" ) {
11341132 vocab.type = LLAMA_VOCAB_TYPE_WPM;
11351133
11361134 // default special tokens
1137- vocab.special_bos_id = LLAMA_TOKEN_NULL ;
1135+ vocab.special_bos_id = 101 ;
11381136 vocab.special_eos_id = LLAMA_TOKEN_NULL;
11391137 vocab.special_unk_id = 100 ;
11401138 vocab.special_sep_id = 102 ;
11411139 vocab.special_pad_id = 0 ;
1142- vocab.special_cls_id = 101 ;
11431140 vocab.special_mask_id = 103 ;
11441141 } else if (tokenizer_model == " gpt2" ) {
11451142 vocab.type = LLAMA_VOCAB_TYPE_BPE;
@@ -1174,7 +1171,6 @@ void llm_load_vocab(llama_model_loader & ml, llama_model & model) {
11741171 vocab.special_unk_id = LLAMA_TOKEN_NULL;
11751172 vocab.special_sep_id = LLAMA_TOKEN_NULL;
11761173 vocab.special_pad_id = LLAMA_TOKEN_NULL;
1177- vocab.special_cls_id = LLAMA_TOKEN_NULL;
11781174 vocab.special_mask_id = LLAMA_TOKEN_NULL;
11791175 } else if (tokenizer_model == " t5" ) {
11801176 vocab.type = LLAMA_VOCAB_TYPE_UGM;
@@ -1185,7 +1181,6 @@ void llm_load_vocab(llama_model_loader & ml, llama_model & model) {
11851181 vocab.special_unk_id = 2 ;
11861182 vocab.special_sep_id = LLAMA_TOKEN_NULL;
11871183 vocab.special_pad_id = 0 ;
1188- vocab.special_cls_id = LLAMA_TOKEN_NULL;
11891184 vocab.special_mask_id = LLAMA_TOKEN_NULL;
11901185
11911186 const int precompiled_charsmap_keyidx = gguf_find_key (ctx, kv (LLM_KV_TOKENIZER_PRECOMPILED_CHARSMAP).c_str ());
@@ -1464,7 +1459,6 @@ void llm_load_vocab(llama_model_loader & ml, llama_model & model) {
14641459 { LLM_KV_TOKENIZER_UNK_ID, vocab.special_unk_id },
14651460 { LLM_KV_TOKENIZER_SEP_ID, vocab.special_sep_id },
14661461 { LLM_KV_TOKENIZER_PAD_ID, vocab.special_pad_id },
1467- { LLM_KV_TOKENIZER_CLS_ID, vocab.special_cls_id },
14681462 { LLM_KV_TOKENIZER_MASK_ID, vocab.special_mask_id },
14691463 { LLM_KV_TOKENIZER_FIM_PRE_ID, vocab.special_fim_pre_id },
14701464 { LLM_KV_TOKENIZER_FIM_SUF_ID, vocab.special_fim_suf_id },
@@ -1899,7 +1893,6 @@ void llm_load_print_meta(llama_model_loader & ml, llama_model & model) {
18991893 if (vocab.special_unk_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: UNK token = %d '%s'\n " , __func__, vocab.special_unk_id , vocab.id_to_token [vocab.special_unk_id ].text .c_str () ); }
19001894 if (vocab.special_sep_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: SEP token = %d '%s'\n " , __func__, vocab.special_sep_id , vocab.id_to_token [vocab.special_sep_id ].text .c_str () ); }
19011895 if (vocab.special_pad_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: PAD token = %d '%s'\n " , __func__, vocab.special_pad_id , vocab.id_to_token [vocab.special_pad_id ].text .c_str () ); }
1902- if (vocab.special_cls_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: CLS token = %d '%s'\n " , __func__, vocab.special_cls_id , vocab.id_to_token [vocab.special_cls_id ].text .c_str () ); }
19031896 if (vocab.special_mask_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: MASK token = %d '%s'\n " , __func__, vocab.special_mask_id , vocab.id_to_token [vocab.special_mask_id ].text .c_str () ); }
19041897
19051898 if (vocab.linefeed_id != LLAMA_TOKEN_NULL) { LLAMA_LOG_INFO ( " %s: LF token = %d '%s'\n " , __func__, vocab.linefeed_id , vocab.id_to_token [vocab.linefeed_id ].text .c_str () ); }
0 commit comments