Patch conversion script qwen3 moe (#2425)

kanpuriyanawab · web-flow · commit 704a44a1fdc8 · 2025-10-06T09:29:35.000-07:00
* chore- save preset

* format fix

* comments
diff --git a/tools/checkpoint_conversion/convert_qwen3_moe_checkpoints.py b/tools/checkpoint_conversion/convert_qwen3_moe_checkpoints.py
@@ -21,6 +21,7 @@
 
 PRESET_MAP = {
     "qwen3_moe_30b_a3b_en": "Qwen/Qwen3-30B-A3B",
+    "qwen3_moe_235b_a22b_en": "Qwen/Qwen3-235B-A22B",
 }
 
 FLAGS = flags.FLAGS
@@ -85,21 +86,11 @@ def test_tokenizer(keras_hub_tokenizer, hf_tokenizer):
     np.testing.assert_equal(keras_hub_output, hf_output)
 
 
-def validate_output(
-    keras_hub_model, keras_hub_tokenizer, hf_model, hf_tokenizer
-):
+def validate_output(qwen3_moe_lm, hf_model, hf_tokenizer):
     input_str = "What is Keras?"
     length = 32
 
-    # KerasHub
-    preprocessor = keras_hub.models.Qwen3MoeCausalLMPreprocessor(
-        keras_hub_tokenizer
-    )
-    qwen_moe_lm = keras_hub.models.Qwen3MoeCausalLM(
-        backbone=keras_hub_model, preprocessor=preprocessor, sampler="greedy"
-    )
-
-    keras_output = qwen_moe_lm.generate([input_str], max_length=length)
+    keras_output = qwen3_moe_lm.generate([input_str], max_length=length)
     keras_output = keras_output[0]
     print("🔶 KerasHub output:", keras_output)
 
@@ -150,11 +141,16 @@ def main(_):
     test_tokenizer(keras_hub_tokenizer, hf_tokenizer)
     test_model(keras_hub_model, keras_hub_tokenizer, hf_model, hf_tokenizer)
 
-    # == Validate model.generate output ==
-    validate_output(
-        keras_hub_model, keras_hub_tokenizer, hf_model, hf_tokenizer
+    preprocessor = keras_hub.models.Qwen3MoeCausalLMPreprocessor(
+        keras_hub_tokenizer
     )
+    qwen3_moe_lm = keras_hub.models.Qwen3MoeCausalLM(
+        backbone=keras_hub_model, preprocessor=preprocessor, sampler="greedy"
+    )
+    # == Validate model.generate output ==
+    validate_output(qwen3_moe_lm, hf_model, hf_tokenizer)
     print("\n-> Tests passed!")
+    qwen3_moe_lm.save_to_preset(f"./{preset}")
 
 
 if __name__ == "__main__":