[#10513][fix] AutoDeploy: removed self.mlp_type leftovers from last moe refactor (#10512)

MrGeva · web-flow · commit 489dd60312e3 · 2026-01-08T14:49:40.000-05:00
Signed-off-by: Eran Geva &lt;19514940+MrGeva@users.noreply.github.com&gt;
diff --git a/tensorrt_llm/_torch/auto_deploy/transform/library/sharding.py b/tensorrt_llm/_torch/auto_deploy/transform/library/sharding.py
@@ -646,7 +646,6 @@ def apply(self, gm: GraphModule, node: Node) -> None:
             gm,
             node,
             self.config,
-            self.mlp_type,
             scale_names=self.scale_names(),
         )
 
@@ -664,7 +663,7 @@ def scale_names(self) -> List[str]:
         return ["input_scale", "weight_scale", "alpha"]
 
     def apply(self, gm: GraphModule, node: Node) -> None:
-        _insert_sharded_moe(gm, node, self.config, self.mlp_type, scale_names=self.scale_names())
+        _insert_sharded_moe(gm, node, self.config, scale_names=self.scale_names())
 
 
 EP_SHARDING_RULES = [