PaddlePaddle
diff --git a/‎paddlenlp/transformers/deepseek_v2/modeling_pp.py
Lines changed: 7 additions & 1 deletion b/‎paddlenlp/transformers/deepseek_v2/modeling_pp.py
Lines changed: 7 additions & 1 deletion
@@ -1235,7 +1235,13 @@ def build_schedule_node(self):
             if self.mlp.using_flex_token:
                 if DSV3_USE_FP8_GEMM:
                     attn_and_gate_node = ScheduleNode(self.attn_compute_for_fusion, name="attn_and_gate_node")
-                    fp8_fusion_moe_node = FusionMoeNode(self.mlp, name="fp8_fusion_moe_node")
+                    fp8_fusion_moe_node = FusionMoeNode(
+                        self.mlp,
+                        recompute_fwd_gate_up=self.config.recompute_fwd_gate_up,
+                        dequant_input=self.config.dequant_input,
+                        is_split_group_gemm=self.config.is_split_group_gemm,
+                        name="fp8_fusion_moe_node",
+                    )
                     post_process_node = PostProcessNode(
                         self.config.send_mtp_embed,
                         self.mlp.training,