[bugfix] pass callbacks arg for ppo_trainer (#5637)

kiritoxkiriko · web-flow · commit aa29050e2b7f · 2025-09-04T18:33:50.000+08:00
diff --git a/swift/trainers/rlhf_trainer/ppo_trainer.py b/swift/trainers/rlhf_trainer/ppo_trainer.py
@@ -39,7 +39,7 @@ def __init__(self, model: PreTrainedModel, ref_model: PreTrainedModel, *_args, *
             new_kwargs = {
                 k: v
                 for k, v in kwargs.items()
-                if k in ['train_dataset', 'data_collator', 'reward_model', 'value_model', 'eval_dataset']
+                if k in ['train_dataset', 'data_collator', 'reward_model', 'value_model', 'eval_dataset', 'callbacks']
             }
             parameters = inspect.signature(ppo_trainer_init).parameters
             if 'config' in parameters:

Original file line number	Diff line number	Diff line change
`@@ -39,7 +39,7 @@ def __init__(self, model: PreTrainedModel, ref_model: PreTrainedModel, _args, `
`39`	`39`	`new_kwargs = {`
`40`	`40`	`k: v`
`41`	`41`	`for k, v in kwargs.items()`
`42`		`- if k in ['train_dataset', 'data_collator', 'reward_model', 'value_model', 'eval_dataset']`
	`42`	`+ if k in ['train_dataset', 'data_collator', 'reward_model', 'value_model', 'eval_dataset', 'callbacks']`
`43`	`43`	`}`
`44`	`44`	`parameters = inspect.signature(ppo_trainer_init).parameters`
`45`	`45`	`if 'config' in parameters:`