Fixing transformers typing

monoxgas · monoxgas · commit 736dccd38780 · 2025-11-13T15:24:28.000-07:00
diff --git a/rigging/generator/transformers_.py b/rigging/generator/transformers_.py
@@ -80,21 +80,23 @@ def llm(self) -> AutoModelForCausalLM:
                     "load_in_4bit",
                 },
             )
-            self._llm = AutoModelForCausalLM.from_pretrained(self.model, **llm_kwargs)  # type: ignore [no-untyped-call, unused-ignore] # nosec
+            self._llm = AutoModelForCausalLM.from_pretrained(self.model, **llm_kwargs)  # type: ignore [no-untyped-call, assignment, unused-ignore] # nosec
+            if self._llm is None:
+                raise ValueError(f"Failed to load model '{self.model}'")
         return self._llm
 
     @property
     def tokenizer(self) -> AutoTokenizer:
         """The underlying `AutoTokenizer` instance."""
         if self._tokenizer is None:
-            self._tokenizer = AutoTokenizer.from_pretrained(self.model)  # nosec
+            self._tokenizer = AutoTokenizer.from_pretrained(self.model)  # type: ignore [no-untyped-call, unused-ignore] # nosec
         return self._tokenizer
 
     @property
     def pipeline(self) -> TextGenerationPipeline:
         """The underlying `TextGenerationPipeline` instance."""
         if self._pipeline is None:
-            self._pipeline = transformers.pipeline(  # type: ignore [attr-defined, assignment, unused-ignore]
+            self._pipeline = transformers.pipeline(  # type: ignore [attr-defined, call-overload, assignment, unused-ignore]
                 "text-generation",
                 return_full_text=False,
                 model=self.llm,  # type: ignore [arg-type, unused-ignore]
@@ -160,7 +162,7 @@ def _generate(
         if any(k in kwargs for k in ["temperature", "top_k", "top_p"]):
             kwargs["do_sample"] = True
 
-        outputs = self.pipeline(inputs, **kwargs)
+        outputs = self.pipeline(inputs, **kwargs)  # type: ignore [call-overload]
 
         # TODO: We do strip() here as it's often needed, but I think
         # we should return and standardize this behavior.
diff --git a/rigging/tokenizer/transformers_.py b/rigging/tokenizer/transformers_.py
@@ -36,7 +36,7 @@ class TransformersTokenizer(Tokenizer):
     def tokenizer(self) -> "PreTrainedTokenizer":
         """The underlying `PreTrainedTokenizer` instance."""
         if self._tokenizer is None:
-            self._tokenizer = AutoTokenizer.from_pretrained(self.model)  # nosec
+            self._tokenizer = AutoTokenizer.from_pretrained(self.model)  # type: ignore[no-untyped-call] # nosec
         return self._tokenizer
 
     @classmethod