keras-team · sachinprasadhs · Oct 9, 2025 · Oct 8, 2025 · Oct 8, 2025 · Oct 8, 2025
diff --git a/keras_hub/src/models/qwen3_moe/__init__.py b/keras_hub/src/models/qwen3_moe/__init__.py
@@ -0,0 +1,5 @@
+from keras_hub.src.models.qwen3_moe.qwen3_moe_backbone import Qwen3MoeBackbone
+from keras_hub.src.models.qwen3_moe.qwen3_moe_presets import backbone_presets
+from keras_hub.src.utils.preset_utils import register_presets
+
+register_presets(backbone_presets, Qwen3MoeBackbone)
diff --git a/keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py b/keras_hub/src/models/qwen3_moe/qwen3_moe_presets.py
@@ -0,0 +1,30 @@
+"""Qwen3 model preset configurations."""
+
+backbone_presets = {
+    "qwen3_moe_30b_a3b_en": {
+        "metadata": {
+            "description": (
+                "Mixture-of-Experts (MoE) model has 30.5 billion total parameters"
+                " with 3.3 billion activated, built on 48 layers, and utilizes 32 query "
+                "and 4 key/value attention heads with 128 experts (8 active)"
+                "efficiency and fast inference on resource-constrained devices."
+            ),
+            "params": 30532122624,
+            "path": "qwen3_moe",
+        },
+        "kaggle_handle": "kaggle://keras/qwen-3-moe/keras/qwen3_moe_30b_a3b_en/2",
+    },
+    "qweqwen3_moe_235b_a22b_en": {
+        "metadata": {
+            "description": (
+                "Mixture-of-Experts (MoE) model has 235 billion total parameters,"
+                " with 22 billion activated, built on 94 layers, and utilizes 64 query "
+                "and 4 key/value attention heads with 128 experts (8 active)."
+            ),
+            "params": 235093634560,
+            "path": "qwen3_moe",
+        },
+        "kaggle_handle": "kaggle://keras/qwen-3-moe/keras/qwen3_moe_235b_a22b_en/1",
+    },
+
+}