Support JSON string parsing of teacher_model_init_kwargs in MiniLLMConfig (#5259)

albertvillanova · web-flow · commit 3fd447aab2db · 2026-03-10T20:31:48.000+01:00
diff --git a/trl/experimental/minillm/minillm_config.py b/trl/experimental/minillm/minillm_config.py
@@ -47,6 +47,8 @@ class MiniLLMConfig(GRPOConfig):
             Whether to apply length normalization to the rewards.
     """
 
+    _VALID_DICT_FIELDS = TrainingArguments._VALID_DICT_FIELDS + ["teacher_model_init_kwargs"]
+
     teacher_model_init_kwargs: dict[str, Any] | None = field(
         default=None,
         metadata={