Update tokenizer parameter in sfttrainer across multiple examples (#2664)

gapsong · web-flow · commit a795199ffaea · 2025-07-23T15:30:28.000+02:00
* REFAC Update tokenizer parameter to processing_class in SFTTrainer instances across multiple examples

* REFAC Replace tokenizer parameter with processing_class in Trainer instances across documentation and examples

* Refactor tokenizer parameter to processing_class in various examples

- Updated the Trainer initialization in corda_finetuning.py to use processing_class instead of tokenizer.
- Changed the execution_count to null in image_classification_peft_lora.ipynb.
- Modified the tokenizer parameter to processing_class in image_classification_peft_lora.ipynb.
- Adjusted the tokenizer parameter to processing_class in peft_bnb_whisper_large_v2_training.ipynb.
- Updated the README.md in lorafa_finetune to reflect the change from tokenizer to processing_class in Trainer initialization.

* REFAC Update tokenizer parameter to processing_class in Seq2SeqTrainer instantiation

* REFAC Replace tokenizer parameter with processing_class in README and notebook examples
diff --git a/docs/source/accelerate/deepspeed.md b/docs/source/accelerate/deepspeed.md
@@ -134,7 +134,7 @@ The first thing to know is that the script uses DeepSpeed for distributed traini
 # trainer
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
diff --git a/docs/source/accelerate/fsdp.md b/docs/source/accelerate/fsdp.md
@@ -114,7 +114,7 @@ The first thing to know is that the script uses FSDP for distributed training as
 # trainer
 trainer = SFTTrainer(
     model=model,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
diff --git a/docs/source/conceptual_guides/oft.md b/docs/source/conceptual_guides/oft.md
@@ -123,7 +123,7 @@ trainer = SFTTrainer(
     model=model,
     train_dataset=ds['train'],
     peft_config=peft_config,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
     args=training_arguments,
     data_collator=collator,
 )
diff --git a/docs/source/quicktour.md b/docs/source/quicktour.md
@@ -90,7 +90,7 @@ trainer = Trainer(
     args=training_args,
     train_dataset=tokenized_datasets["train"],
     eval_dataset=tokenized_datasets["test"],
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
     data_collator=data_collator,
     compute_metrics=compute_metrics,
 )
diff --git a/docs/source/task_guides/lora_based_methods.md b/docs/source/task_guides/lora_based_methods.md
@@ -281,7 +281,7 @@ trainer = Trainer(
     args,
     train_dataset=train_ds,
     eval_dataset=val_ds,
-    tokenizer=image_processor,
+    processing_class=image_processor,
     data_collator=collate_fn,
 )
 trainer.train()
diff --git a/examples/bone_finetuning/README.md b/examples/bone_finetuning/README.md
@@ -33,7 +33,7 @@ trainer = SFTTrainer(
     model=peft_model,
     args=training_args,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("bone-llama-2-7b")
diff --git a/examples/bone_finetuning/bone_finetuning.py b/examples/bone_finetuning/bone_finetuning.py
@@ -90,7 +90,7 @@ class ScriptArguments(SFTConfig):
     model=peft_model,
     args=script_args,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 trainer.save_state()
diff --git a/examples/conditional_generation/peft_prompt_tuning_seq2seq_with_generate.ipynb b/examples/conditional_generation/peft_prompt_tuning_seq2seq_with_generate.ipynb
@@ -447,7 +447,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
+   "execution_count": null,
    "id": "6b3a4090",
    "metadata": {
     "ExecuteTime": {
@@ -567,7 +567,7 @@
     ")\n",
     "trainer = Seq2SeqTrainer(\n",
     "    model=model,\n",
-    "    tokenizer=tokenizer,\n",
+    "    processing_class=tokenizer,\n",
     "    args=training_args,\n",
     "    train_dataset=train_dataset,\n",
     "    eval_dataset=eval_dataset,\n",
diff --git a/examples/corda_finetuning/README.md b/examples/corda_finetuning/README.md
@@ -114,7 +114,7 @@ trainer = SFTTrainer(
     model=peft_model,
     args=training_args,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("corda-llama-2-7b")
diff --git a/examples/corda_finetuning/corda_finetuning.py b/examples/corda_finetuning/corda_finetuning.py
@@ -266,7 +266,7 @@ def train():
         "train_dataset": train_dataset,
         "data_collator": data_collator,
     }
-    trainer = Trainer(model=model, tokenizer=tokenizer, args=script_args, **data_module)
+    trainer = Trainer(model=model, processing_class=tokenizer, args=script_args, **data_module)
     trainer.train()
     trainer.save_state()
     model.save_pretrained(os.path.join(script_args.output_dir, "ft"))
diff --git a/examples/image_classification/image_classification_peft_lora.ipynb b/examples/image_classification/image_classification_peft_lora.ipynb
@@ -1142,7 +1142,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": null,
    "metadata": {
     "colab": {
      "base_uri": "https://localhost:8080/",
@@ -1747,7 +1747,7 @@
     "    args,\n",
     "    train_dataset=train_ds,\n",
     "    eval_dataset=val_ds,\n",
-    "    tokenizer=image_processor,\n",
+    "    processing_class=image_processor,\n",
     "    compute_metrics=compute_metrics,\n",
     "    data_collator=collate_fn,\n",
     ")\n",
diff --git a/examples/int8_training/peft_bnb_whisper_large_v2_training.ipynb b/examples/int8_training/peft_bnb_whisper_large_v2_training.ipynb
@@ -1323,7 +1323,7 @@
     "    eval_dataset=common_voice[\"test\"],\n",
     "    data_collator=data_collator,\n",
     "    # compute_metrics=compute_metrics,\n",
-    "    tokenizer=processor.feature_extractor,\n",
+    "    processing_class=processor.feature_extractor,\n",
     "    callbacks=[SavePeftModelCallback],\n",
     ")\n",
     "model.config.use_cache = False  # silence the warnings. Please re-enable for inference!"
diff --git a/examples/lorafa_finetune/README.md b/examples/lorafa_finetune/README.md
@@ -41,7 +41,7 @@ trainer = transformers.Trainer(
     train_dataset=dataset,
     dataset_text_field="text",
     max_seq_length=2048,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
     optimizers=(optimizer, None),
 )
 trainer.train()
diff --git a/examples/olora_finetuning/README.md b/examples/olora_finetuning/README.md
@@ -22,7 +22,7 @@ training_args = SFTConfig(dataset_text_field="text", max_seq_length=128)
 trainer = SFTTrainer(
     model=peft_model,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("olora-opt-350m")
diff --git a/examples/pissa_finetuning/README.md b/examples/pissa_finetuning/README.md
@@ -27,7 +27,7 @@ trainer = SFTTrainer(
     model=peft_model,
     args=training_args,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("pissa-llama-2-7b")
diff --git a/examples/pissa_finetuning/pissa_finetuning.py b/examples/pissa_finetuning/pissa_finetuning.py
@@ -128,7 +128,7 @@ class ScriptArguments(SFTConfig):
     model=peft_model,
     args=script_args,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 trainer.save_state()
diff --git a/examples/poly/peft_poly_seq2seq_with_generate.ipynb b/examples/poly/peft_poly_seq2seq_with_generate.ipynb
@@ -983,7 +983,7 @@
     ")\n",
     "trainer = Seq2SeqTrainer(\n",
     "    model=model,\n",
-    "    tokenizer=tokenizer,\n",
+    "    processing_class=tokenizer,\n",
     "    args=training_args,\n",
     "    train_dataset=superglue_train_dataset,\n",
     "    eval_dataset=superglue_eval_dataset,\n",
diff --git a/examples/randlora_finetuning/README.md b/examples/randlora_finetuning/README.md
@@ -21,7 +21,7 @@ trainer = transformers.Trainer(
     train_dataset=dataset,
     dataset_text_field="text",
     max_seq_length=2048,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("randlora-llama-7b")
diff --git a/examples/shira_finetuning/README.md b/examples/shira_finetuning/README.md
@@ -22,7 +22,7 @@ training_args = SFTConfig(dataset_text_field="text", max_seq_length=128)
 trainer = SFTTrainer(
     model=peft_model,
     train_dataset=dataset,
-    tokenizer=tokenizer,
+    processing_class=tokenizer,
 )
 trainer.train()
 peft_model.save_pretrained("shira-opt-350m")
diff --git a/examples/token_classification/peft_lora_ner.ipynb b/examples/token_classification/peft_lora_ner.ipynb
@@ -553,7 +553,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 24,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
@@ -713,7 +713,7 @@
     "    train_dataset=tokenized_datasets[\"train\"],\n",
     "    eval_dataset=tokenized_datasets[\"validation\"],\n",
     "    data_collator=data_collator,\n",
-    "    tokenizer=tokenizer,\n",
+    "    processing_class=tokenizer,\n",
     "    compute_metrics=compute_metrics\n",
     ")\n",
     "trainer.train()"

Original file line number	Diff line number	Diff line change
`@@ -123,7 +123,7 @@ trainer = SFTTrainer(`
`123`	`123`	`model=model,`
`124`	`124`	`train_dataset=ds['train'],`
`125`	`125`	`peft_config=peft_config,`
`126`		`- tokenizer=tokenizer,`
	`126`	`+ processing_class=tokenizer,`
`127`	`127`	`args=training_arguments,`
`128`	`128`	`data_collator=collator,`
`129`	`129`	`)`
Original file line number	Diff line number	Diff line change
`@@ -90,7 +90,7 @@ trainer = Trainer(`
`90`	`90`	`args=training_args,`
`91`	`91`	`train_dataset=tokenized_datasets["train"],`
`92`	`92`	`eval_dataset=tokenized_datasets["test"],`
`93`		`- tokenizer=tokenizer,`
	`93`	`+ processing_class=tokenizer,`
`94`	`94`	`data_collator=data_collator,`
`95`	`95`	`compute_metrics=compute_metrics,`
`96`	`96`	`)`
Original file line number	Diff line number	Diff line change
`@@ -281,7 +281,7 @@ trainer = Trainer(`
`281`	`281`	`args,`
`282`	`282`	`train_dataset=train_ds,`
`283`	`283`	`eval_dataset=val_ds,`
`284`		`- tokenizer=image_processor,`
	`284`	`+ processing_class=image_processor,`
`285`	`285`	`data_collator=collate_fn,`
`286`	`286`	`)`
`287`	`287`	`trainer.train()`
Original file line number	Diff line number	Diff line change
`@@ -33,7 +33,7 @@ trainer = SFTTrainer(`
`33`	`33`	`model=peft_model,`
`34`	`34`	`args=training_args,`
`35`	`35`	`train_dataset=dataset,`
`36`		`- tokenizer=tokenizer,`
	`36`	`+ processing_class=tokenizer,`
`37`	`37`	`)`
`38`	`38`	`trainer.train()`
`39`	`39`	`peft_model.save_pretrained("bone-llama-2-7b")`
Original file line number	Diff line number	Diff line change
`@@ -90,7 +90,7 @@ class ScriptArguments(SFTConfig):`
`90`	`90`	`model=peft_model,`
`91`	`91`	`args=script_args,`
`92`	`92`	`train_dataset=dataset,`
`93`		`- tokenizer=tokenizer,`
	`93`	`+ processing_class=tokenizer,`
`94`	`94`	`)`
`95`	`95`	`trainer.train()`
`96`	`96`	`trainer.save_state()`
Original file line number	Diff line number	Diff line change
`@@ -114,7 +114,7 @@ trainer = SFTTrainer(`
`114`	`114`	`model=peft_model,`
`115`	`115`	`args=training_args,`
`116`	`116`	`train_dataset=dataset,`
`117`		`- tokenizer=tokenizer,`
	`117`	`+ processing_class=tokenizer,`
`118`	`118`	`)`
`119`	`119`	`trainer.train()`
`120`	`120`	`peft_model.save_pretrained("corda-llama-2-7b")`
Original file line number	Diff line number	Diff line change
`@@ -266,7 +266,7 @@ def train():`
`266`	`266`	`"train_dataset": train_dataset,`
`267`	`267`	`"data_collator": data_collator,`
`268`	`268`	`}`
`269`		`- trainer = Trainer(model=model, tokenizer=tokenizer, args=script_args, **data_module)`
	`269`	`+ trainer = Trainer(model=model, processing_class=tokenizer, args=script_args, **data_module)`
`270`	`270`	`trainer.train()`
`271`	`271`	`trainer.save_state()`
`272`	`272`	`model.save_pretrained(os.path.join(script_args.output_dir, "ft"))`