foldl
diff --git a/‎CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎README.md‎
Lines changed: 1 addition & 0 deletions b/‎README.md‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎convert.py‎
Lines changed: 39 additions & 2 deletions b/‎convert.py‎
Lines changed: 39 additions & 2 deletions
diff --git a/‎docs/models.md‎
Lines changed: 2 additions & 0 deletions b/‎docs/models.md‎
Lines changed: 2 additions & 0 deletions
@@ -113,6 +113,7 @@ set(core_files src/backend.cpp
     models/phi.cpp
     models/qwen.cpp
     models/reka.cpp
+    models/rnj.cpp
     models/seed.cpp
     models/siglip.cpp
     models/smol.cpp
 
@@ -33,6 +33,7 @@ LittleAcademia[<a href="https://github.com/foldl/little-academia"   style="text-
 
 **What's New:**
 
+* 2025-12-15: Rnj-1
 * 2025-12-08: Ministral-3
 * 2025-11-06: Maya1
 * 2025-11-03: Ouro
 
@@ -150,6 +150,7 @@ class ModelType(Enum):
     Gemma       = 0x1300
     Gemma2      = 0x1301
     Gemma3      = 0x1302
+    RNJ_1       = 0x1303
 
     CohereCommand       = 0x1400
     CohereAya23         = 0x1401
@@ -5613,7 +5614,6 @@ def get_weight_names(config):
 
 class Gemma3Converter(BaseConverter):
     MODEL_TYPE = ModelType.Gemma3
-    FILE_VERSION = 1
 
     @classmethod
     def pp(cls, config, name: str, tensor):
@@ -5786,6 +5786,40 @@ def get_weight_names(config):
 
         return weight_names
 
+class RNJ_1Converter(BaseConverter):
+    MODEL_TYPE = ModelType.RNJ_1
+
+    @classmethod
+    def state_dict_pp(cls, config, state_dict):
+        return Gemma3Converter.state_dict_pp(config, state_dict)
+
+    @staticmethod
+    def dump_config(f, config, ggml_type):
+        final_logit_softcapping = config.final_logit_softcapping
+        attn_logit_softcapping  = config.attn_logit_softcapping
+        rope_scaling = config.rope_scaling
+        config.rope_scaling = None
+        config.final_logit_softcapping = None
+        config.attn_logit_softcapping  = None
+
+        Gemma3Converter.dump_config(f, config, ggml_type)
+
+        config_values = [
+            rope_scaling['attn_factor'],
+            rope_scaling['beta_fast'],
+            rope_scaling['beta_slow'],
+            rope_scaling['extrapolation_factor'],
+            rope_scaling['factor'],
+            rope_scaling['original_max_position_embeddings'],
+            final_logit_softcapping if final_logit_softcapping is not None else -1.0,
+            attn_logit_softcapping if attn_logit_softcapping is not None else -1.0,
+        ]
+        f.write(struct.pack("<" + "fffffiff", *config_values))
+
+    @staticmethod
+    def get_weight_names(config):
+        return Gemma3Converter.get_weight_names(config)
+
 class Grok1Converter(BaseConverter):
     MODEL_TYPE = ModelType.Grok1
     tensor_map = []
@@ -8844,7 +8878,10 @@ def main():
     elif arch == 'Gemma2ForCausalLM':
         Gemma2Converter.convert(config, model_files, vocab, ggml_type, args.save_path)
     elif arch == 'Gemma3ForCausalLM':
-        Gemma3Converter.convert(config, model_files, vocab, ggml_type, args.save_path)
+        if config.rope_scaling and (config.rope_scaling['rope_type'] == 'yarn'):
+            RNJ_1Converter.convert(config, model_files, vocab, ggml_type, args.save_path)
+        else:
+            Gemma3Converter.convert(config, model_files, vocab, ggml_type, args.save_path)
     elif arch == 'Gemma3ForConditionalGeneration':
         if config.vision_config is not None:
             Gemma3Converter.MODEL_TYPE = ModelType.Gemma3Vis
 
@@ -80,6 +80,8 @@
 
     Note: Only download `tokenizer.model` and DO NOT download `tokenizer.json` when converting.
 
+    * [x] Rnj-1: [Intruct](https://huggingface.co/EssentialAI/rnj-1-instruct/tree/2360f0368eec9bcf6d51aec66f6341503a6934f0)
+
 * GPT (`GptOssForCausalLM`)
     * [x] OSS: [20B](https://huggingface.co/openai/gpt-oss-20b/tree/cbf31f62664d4b1360b3a78427f7b3c3ed8f0fa8), [120B](https://huggingface.co/openai/gpt-oss-120b/tree/bc75b44b8a2a116a0e4c6659bcd1b7969885f423)