add more rnn models supported

LostRuins · LostRuins · commit 5d89a48a50be · 2025-09-24T18:14:59.000+08:00
diff --git a/gpttype_adapter.cpp b/gpttype_adapter.cpp
@@ -484,8 +484,8 @@ void ContextRewind(std::vector<int> &embd, std::vector<int> &current_context_tok
         printf("\nWARNING: Don't use context rewind when in batch processing phase!\n");
         return;
     }
-    bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBA
-    || file_format_meta.model_architecture==GGUFArch::ARCH_RWKV || file_format_meta.model_architecture==GGUFArch::ARCH_JAMBA));
+    bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBALIKE
+    || file_format_meta.model_architecture==GGUFArch::ARCH_RWKV));
     if(file_format == FileFormat::RWKV_1 || file_format==FileFormat::RWKV_2 || is_recurrent)
     {
         printf("\nWARNING: RNN models do not support context rewind!\n");
@@ -3747,8 +3747,8 @@ generation_outputs gpttype_generate(const generation_inputs inputs)
         printf("%s\n", RemoveBell(outstr).c_str());
     }
 
-    bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBA
-    || file_format_meta.model_architecture==GGUFArch::ARCH_RWKV || file_format_meta.model_architecture==GGUFArch::ARCH_JAMBA));
+    bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBALIKE
+    || file_format_meta.model_architecture==GGUFArch::ARCH_RWKV));
     bool blank_prompt = (addedmemory=="" && kcpp_data->prompt=="");
 
     if (file_format == FileFormat::RWKV_1 || file_format==FileFormat::RWKV_2 || is_recurrent)
diff --git a/model_adapter.cpp b/model_adapter.cpp
@@ -367,13 +367,9 @@ std::string gguf_get_model_arch(const std::string & gguf_filename)
             {
                 fileformatmeta->model_architecture = GGUFArch::ARCH_FALCON;
             }
-            else if(modelarch=="mamba")
+            else if(modelarch=="mamba" || modelarch=="mamba2" || modelarch=="nemotron_h" || modelarch=="jamba") //lazy approach, put all RNN models
             {
-                fileformatmeta->model_architecture = GGUFArch::ARCH_MAMBA;
-            }
-            else if(modelarch=="jamba")
-            {
-                fileformatmeta->model_architecture = GGUFArch::ARCH_JAMBA;
+                fileformatmeta->model_architecture = GGUFArch::ARCH_MAMBALIKE;
             }
             else if(modelarch=="llama" && freq_base_train==10000.0f && (n_tensors==435 || n_tensors==611))
             {
diff --git a/model_adapter.h b/model_adapter.h
@@ -55,16 +55,15 @@ enum GGUFArch
     ARCH_DEFAULT = 0, //used for llama3 and other generic gguf
     ARCH_FALCON = 1,
     ARCH_PHI = 2,
-    ARCH_MAMBA = 3,
+    ARCH_MAMBALIKE = 3,
     ARCH_SOLAR = 4,
     ARCH_QWEN2 = 5,
     ARCH_RWKV = 6,
     ARCH_QWEN2VL = 7,
     ARCH_GEMMA3 = 8,
     ARCH_GLM4 = 9,
     ARCH_GEMMA3N = 10,
-    ARCH_JAMBA = 11,
-    ARCH_GPTOSS = 12,
+    ARCH_GPTOSS = 11,
 };
 
 struct FileFormatExtraMeta

Original file line number	Diff line number	Diff line change
`@@ -484,8 +484,8 @@ void ContextRewind(std::vector<int> &embd, std::vector<int> &current_context_tok`
`484`	`484`	`printf("\nWARNING: Don't use context rewind when in batch processing phase!\n");`
`485`	`485`	`return;`
`486`	`486`	`}`
`487`		`- bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBA`
`488`		`- \|\| file_format_meta.model_architecture==GGUFArch::ARCH_RWKV \|\| file_format_meta.model_architecture==GGUFArch::ARCH_JAMBA));`
	`487`	`+ bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBALIKE`
	`488`	`+ \|\| file_format_meta.model_architecture==GGUFArch::ARCH_RWKV));`
`489`	`489`	`if(file_format == FileFormat::RWKV_1 \|\| file_format==FileFormat::RWKV_2 \|\| is_recurrent)`
`490`	`490`	`{`
`491`	`491`	`printf("\nWARNING: RNN models do not support context rewind!\n");`
`@@ -3747,8 +3747,8 @@ generation_outputs gpttype_generate(const generation_inputs inputs)`
`3747`	`3747`	`printf("%s\n", RemoveBell(outstr).c_str());`
`3748`	`3748`	`}`
`3749`	`3749`
`3750`		`- bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBA`
`3751`		`- \|\| file_format_meta.model_architecture==GGUFArch::ARCH_RWKV \|\| file_format_meta.model_architecture==GGUFArch::ARCH_JAMBA));`
	`3750`	`+ bool is_recurrent = (file_format == FileFormat::GGUF_GENERIC && (file_format_meta.model_architecture==GGUFArch::ARCH_MAMBALIKE`
	`3751`	`+ \|\| file_format_meta.model_architecture==GGUFArch::ARCH_RWKV));`
`3752`	`3752`	`bool blank_prompt = (addedmemory=="" && kcpp_data->prompt=="");`
`3753`	`3753`
`3754`	`3754`	`if (file_format == FileFormat::RWKV_1 \|\| file_format==FileFormat::RWKV_2 \|\| is_recurrent)`
Original file line number	Diff line number	Diff line change
`@@ -367,13 +367,9 @@ std::string gguf_get_model_arch(const std::string & gguf_filename)`
`367`	`367`	`{`
`368`	`368`	`fileformatmeta->model_architecture = GGUFArch::ARCH_FALCON;`
`369`	`369`	`}`
`370`		`- else if(modelarch=="mamba")`
	`370`	`+ else if(modelarch=="mamba" \|\| modelarch=="mamba2" \|\| modelarch=="nemotron_h" \|\| modelarch=="jamba") //lazy approach, put all RNN models`
`371`	`371`	`{`
`372`		`- fileformatmeta->model_architecture = GGUFArch::ARCH_MAMBA;`
`373`		`- }`
`374`		`- else if(modelarch=="jamba")`
`375`		`- {`
`376`		`- fileformatmeta->model_architecture = GGUFArch::ARCH_JAMBA;`
	`372`	`+ fileformatmeta->model_architecture = GGUFArch::ARCH_MAMBALIKE;`
`377`	`373`	`}`
`378`	`374`	`else if(modelarch=="llama" && freq_base_train==10000.0f && (n_tensors==435 \|\| n_tensors==611))`
`379`	`375`	`{`