Add and Register the Qwen3_MoE Presets to Hub (#2429)

laxmareddyp · gemini-code-assist[bot] · web-flow · commit 6f722084dabe · 2025-10-09T10:49:48.000-07:00
* Register and add the qwen3_moe presets to hub

* Update keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py

Co-authored-by: gemini-code-assist[bot] &lt;176961590+gemini-code-assist[bot]@users.noreply.github.com&gt;

* Update keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py

Co-authored-by: gemini-code-assist[bot] &lt;176961590+gemini-code-assist[bot]@users.noreply.github.com&gt;

* Fix format issues

---------

Co-authored-by: gemini-code-assist[bot] &lt;176961590+gemini-code-assist[bot]@users.noreply.github.com&gt;
diff --git a/keras_hub/src/models/qwen3_moe/__init__.py b/keras_hub/src/models/qwen3_moe/__init__.py
@@ -0,0 +1,5 @@
+from keras_hub.src.models.qwen3_moe.qwen3_moe_backbone import Qwen3MoeBackbone
+from keras_hub.src.models.qwen3_moe.qwen3_moe_presets import backbone_presets
+from keras_hub.src.utils.preset_utils import register_presets
+
+register_presets(backbone_presets, Qwen3MoeBackbone)
diff --git a/keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py b/keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py
@@ -0,0 +1,30 @@
+"""Qwen3 MoE model preset configurations."""
+
+backbone_presets = {
+    "qwen3_moe_30b_a3b_en": {
+        "metadata": {
+            "description": (
+                " Mixture-of-Experts (MoE) model has 30.5 billion total"
+                " parameters with 3.3 billion activated, built on 48 layers"
+                " and utilizes 32 query and 4 key/value attention heads"
+                " with 128 experts (8 active)."
+            ),
+            "params": 30532122624,
+            "path": "qwen3_moe",
+        },
+        "kaggle_handle": "kaggle://keras/qwen-3-moe/keras/qwen3_moe_30b_a3b_en/2",
+    },
+    "qwen3_moe_235b_a22b_en": {
+        "metadata": {
+            "description": (
+                " Mixture-of-Experts (MoE) model has 235 billion"
+                " total parameters with 22 billion activated, built on 94"
+                " layers and utilizes 64 query and 4 key/value attention heads"
+                " with 128 experts (8 active)."
+            ),
+            "params": 235093634560,
+            "path": "qwen3_moe",
+        },
+        "kaggle_handle": "kaggle://keras/qwen-3-moe/keras/qwen3_moe_235b_a22b_en/1",
+    },
+}