@@ -79,47 +79,6 @@ extern "C" {
7979 LLAMA_VOCAB_TYPE_RWKV = 5 , // RWKV tokenizer based on greedy tokenization
8080 };
8181
82- // pre-tokenization types
83- enum llama_vocab_pre_type {
84- LLAMA_VOCAB_PRE_TYPE_DEFAULT = 0 ,
85- LLAMA_VOCAB_PRE_TYPE_LLAMA3 = 1 ,
86- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK_LLM = 2 ,
87- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK_CODER = 3 ,
88- LLAMA_VOCAB_PRE_TYPE_FALCON = 4 ,
89- LLAMA_VOCAB_PRE_TYPE_MPT = 5 ,
90- LLAMA_VOCAB_PRE_TYPE_STARCODER = 6 ,
91- LLAMA_VOCAB_PRE_TYPE_GPT2 = 7 ,
92- LLAMA_VOCAB_PRE_TYPE_REFACT = 8 ,
93- LLAMA_VOCAB_PRE_TYPE_COMMAND_R = 9 ,
94- LLAMA_VOCAB_PRE_TYPE_STABLELM2 = 10 ,
95- LLAMA_VOCAB_PRE_TYPE_QWEN2 = 11 ,
96- LLAMA_VOCAB_PRE_TYPE_OLMO = 12 ,
97- LLAMA_VOCAB_PRE_TYPE_DBRX = 13 ,
98- LLAMA_VOCAB_PRE_TYPE_SMAUG = 14 ,
99- LLAMA_VOCAB_PRE_TYPE_PORO = 15 ,
100- LLAMA_VOCAB_PRE_TYPE_CHATGLM3 = 16 ,
101- LLAMA_VOCAB_PRE_TYPE_CHATGLM4 = 17 ,
102- LLAMA_VOCAB_PRE_TYPE_VIKING = 18 ,
103- LLAMA_VOCAB_PRE_TYPE_JAIS = 19 ,
104- LLAMA_VOCAB_PRE_TYPE_TEKKEN = 20 ,
105- LLAMA_VOCAB_PRE_TYPE_SMOLLM = 21 ,
106- LLAMA_VOCAB_PRE_TYPE_CODESHELL = 22 ,
107- LLAMA_VOCAB_PRE_TYPE_BLOOM = 23 ,
108- LLAMA_VOCAB_PRE_TYPE_GPT3_FINNISH = 24 ,
109- LLAMA_VOCAB_PRE_TYPE_EXAONE = 25 ,
110- LLAMA_VOCAB_PRE_TYPE_CHAMELEON = 26 ,
111- LLAMA_VOCAB_PRE_TYPE_MINERVA = 27 ,
112- LLAMA_VOCAB_PRE_TYPE_DEEPSEEK3_LLM = 28 ,
113- LLAMA_VOCAB_PRE_TYPE_GPT4O = 29 ,
114- LLAMA_VOCAB_PRE_TYPE_SUPERBPE = 30 ,
115- LLAMA_VOCAB_PRE_TYPE_TRILLION = 31 ,
116- LLAMA_VOCAB_PRE_TYPE_BAILINGMOE = 32 ,
117- LLAMA_VOCAB_PRE_TYPE_LLAMA4 = 33 ,
118- LLAMA_VOCAB_PRE_TYPE_PIXTRAL = 34 ,
119- LLAMA_VOCAB_PRE_TYPE_SEED_CODER = 35 ,
120- LLAMA_VOCAB_PRE_TYPE_HUNYUAN = 36 ,
121- };
122-
12382 enum llama_rope_type {
12483 LLAMA_ROPE_TYPE_NONE = -1 ,
12584 LLAMA_ROPE_TYPE_NORM = 0 ,
0 commit comments