fix: fix SentenceTransformerRerank init (#19756)

lainconn · web-flow · commit 5dc7374e08ce · 2025-08-31T20:34:36.000+02:00
* fix: fix SentenceTransformerRerank init

* style: fixed linting
diff --git a/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/llama_index/postprocessor/sbert_rerank/base.py b/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/llama_index/postprocessor/sbert_rerank/base.py
@@ -18,12 +18,22 @@
 
 
 class SentenceTransformerRerank(BaseNodePostprocessor):
+    """
+    HuggingFace class for cross encoding two sentences/texts.
+
+    Args:
+        model (str): A model name from Hugging Face Hub that can be loaded with AutoModel, or a path to a local model.
+        device (str, optional): Device (like “cuda”, “cpu”, “mps”, “npu”) that should be used for computation.
+            If None, checks if a GPU can be used.
+        cache_folder (str, Path, optional): Path to the folder where cached files are stored. Defaults to None.
+        top_n (int): Number of nodes to return sorted by score. Defaults to 2.
+        keep_retrieval_score (bool, optional): Whether to keep the retrieval score in metadata. Defaults to False.
+        cross_encoder_kwargs (dict, optional): Additional keyword arguments for CrossEncoder initialization. Defaults to None.
+
+    """
+
     model: str = Field(description="Sentence transformer model name.")
     top_n: int = Field(description="Number of nodes to return sorted by score.")
-    device: str = Field(
-        default="cpu",
-        description="Device to use for sentence transformer.",
-    )
     keep_retrieval_score: bool = Field(
         default=False,
         description="Whether to keep the retrieval score in metadata.",
@@ -34,14 +44,15 @@ class SentenceTransformerRerank(BaseNodePostprocessor):
         "device and model should not be included here.",
     )
     _model: Any = PrivateAttr()
+    _device: str = PrivateAttr()
 
     def __init__(
         self,
-        top_n: int = 2,
         model: str = "cross-encoder/stsb-distilroberta-base",
         device: Optional[str] = None,
+        cache_folder: Optional[Union[str, Path]] = None,
+        top_n: int = 2,
         keep_retrieval_score: Optional[bool] = False,
-        cache_dir: Optional[Union[str, Path]] = None,
         cross_encoder_kwargs: Optional[dict] = None,
     ):
         try:
@@ -74,11 +85,13 @@ def __init__(
         # Explicit arguments from the constructor take precedence over kwargs
         resolved_device = infer_torch_device() if device is None else device
         init_kwargs["device"] = resolved_device
-        if cache_dir:
-            init_kwargs["cache_dir"] = cache_dir
+        self._device = resolved_device
+
+        if cache_folder:
+            init_kwargs["cache_folder"] = cache_folder
 
         self._model = CrossEncoder(
-            model_name=model,
+            model_name_or_path=model,
             **init_kwargs,
         )
 
diff --git a/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/pyproject.toml b/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/pyproject.toml
@@ -22,11 +22,12 @@ dev = [
     "codespell[toml]>=v2.2.6",
     "diff-cover>=9.2.0",
     "pytest-cov>=6.1.1",
+    "sentence-transformers>=5.1.0",
 ]
 
 [project]
 name = "llama-index-postprocessor-sbert-rerank"
-version = "0.4.0"
+version = "0.4.1"
 description = "llama-index postprocessor sbert rerank integration"
 authors = [{name = "Your Name", email = "you@example.com"}]
 requires-python = ">=3.9,<4.0"
diff --git a/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/tests/test_postprocessor_sbert_rerank.py b/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/tests/test_postprocessor_sbert_rerank.py
@@ -1,7 +1,17 @@
 from llama_index.core.postprocessor.types import BaseNodePostprocessor
 from llama_index.postprocessor.sbert_rerank import SentenceTransformerRerank
+from llama_index.core.utils import infer_torch_device
 
 
 def test_class():
     names_of_base_classes = [b.__name__ for b in SentenceTransformerRerank.__mro__]
     assert BaseNodePostprocessor.__name__ in names_of_base_classes
+
+
+def test_init():
+    assert SentenceTransformerRerank()
+
+
+def test_device():
+    device = infer_torch_device() or "cpu"
+    assert SentenceTransformerRerank()._device == device
diff --git a/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/uv.lock b/llama-index-integrations/postprocessor/llama-index-postprocessor-sbert-rerank/uv.lock