[ESM] add accepts_loss_kwargs=False to EsmPreTrainedModel (#41006)

pstjohn · SunMarc · web-flow · commit 2a596f5b2f3d · 2025-09-30T12:06:47.000Z
add accepts_loss_kwargs=False to EsmPreTrainedModel

Signed-off-by: Peter St. John &lt;pstjohn@nvidia.com&gt;
Co-authored-by: Marc Sun &lt;57196510+SunMarc@users.noreply.github.com&gt;
diff --git a/src/transformers/models/esm/modeling_esm.py b/src/transformers/models/esm/modeling_esm.py
@@ -589,6 +589,7 @@ class EsmPreTrainedModel(PreTrainedModel):
     config: EsmConfig
     base_model_prefix = "esm"
     supports_gradient_checkpointing = True
+    accepts_loss_kwargs = False
     _no_split_modules = ["EsmLayer", "EsmFoldTriangularSelfAttentionBlock", "EsmEmbeddings"]
     _keys_to_ignore_on_load_unexpected = ["position_embeddings.weight"]
     _supports_flash_attn = True