not redundent compute

garyzhang99 · garyzhang99 · commit e221c8a8fef7 · 2025-12-04T10:24:55.000+08:00
diff --git a/trinity/algorithm/policy_loss_fn/ppo_policy_loss.py b/trinity/algorithm/policy_loss_fn/ppo_policy_loss.py
@@ -99,7 +99,8 @@ def __call__(  # type: ignore
         pg_losses = torch.where(advantages < 0, clip_pg_losses2, clip_pg_losses1)
 
         # Apply sequence mask to the losses
-        pg_losses = pg_losses * sequence_mask
+        if self.enable_sequence_masking:
+            pg_losses = pg_losses * sequence_mask
 
         pg_loss = aggregate_loss(pg_losses, action_mask, loss_agg_mode=self.loss_agg_mode)
         metrics = {