[gpt-oss] fix model config with hf_config (vllm-project#22401)

zyongye · diegocastanibm · commit 8735824c7e94 · 2025-08-15T11:43:24.000-04:00
Signed-off-by: Yongye Zhu &lt;zyy1102000@gmail.com&gt;
Signed-off-by: Diego-Castan &lt;diego.castan@ibm.com&gt;
diff --git a/vllm/model_executor/models/gpt_oss.py b/vllm/model_executor/models/gpt_oss.py
@@ -61,9 +61,9 @@ def __init__(
                 "original_max_position_embeddings":
                 config.rope_scaling["original_max_position_embeddings"],
                 "beta_fast":
-                config.rope_ntk_beta,
+                config.rope_scaling["beta_fast"],
                 "beta_slow":
-                config.rope_ntk_alpha,
+                config.rope_scaling["beta_slow"],
             },
             is_neox_style=True,
         )
@@ -154,7 +154,7 @@ def __init__(
                                       dtype=torch.bfloat16)
         assert config.intermediate_size % self.world_size == 0
         self.experts = FusedMoE(num_experts=config.num_local_experts,
-                                top_k=config.num_experts_per_token,
+                                top_k=config.num_experts_per_tok,
                                 hidden_size=config.hidden_size,
                                 intermediate_size=config.intermediate_size,
                                 reduce_results=True,