Implement reviews on tests and typing

CeliaBenquet · CeliaBenquet · commit c5dc011e0504 · 2025-04-25T20:48:13.000+02:00
diff --git a/cebra/data/base.py b/cebra/data/base.py
@@ -197,7 +197,7 @@ def configure_for(self, model: "cebra.models.Model"):
         """Configure the dataset offset for the provided model.
 
         Call this function before indexing the dataset. This sets the
-        ``offset`` attribute of the dataset.
+        :py:attr:`offset` attribute of the dataset.
 
         Args:
             model: The model to configure the dataset for.
diff --git a/cebra/data/datasets.py b/cebra/data/datasets.py
@@ -353,7 +353,7 @@ def configure_for(self, model: "Model"):
         """Configure the dataset offset for the provided model.
 
         Call this function before indexing the dataset. This sets the
-        ``offset`` attribute of the dataset.
+        :py:attr:`offset` attribute of the dataset.
 
         Args:
             model: The model to configure the dataset for.
diff --git a/cebra/data/multi_session.py b/cebra/data/multi_session.py
@@ -31,6 +31,7 @@
 import cebra.distributions
 from cebra.data.datatypes import Batch
 from cebra.data.datatypes import BatchIndex
+from cebra.models import Model
 
 __all__ = [
     "MultiSessionDataset",
@@ -104,17 +105,18 @@ def load_batch(self, index: BatchIndex) -> List[Batch]:
             ) for session_id, session in enumerate(self.iter_sessions())
         ]
 
-    def configure_for(self, model: "cebra.models.Model"):
+    def configure_for(self, model: "Model"):
         """Configure the dataset offset for the provided model.
 
         Call this function before indexing the dataset. This sets the
-        ``offset`` attribute of the dataset.
+        :py:attr:`cebra.data.Dataset.offset` attribute of the dataset.
 
         Args:
             model: The model to configure the dataset for.
         """
-        for i, session in enumerate(self.iter_sessions()):
-            session.configure_for(model[i])
+        self.offset = model.get_offset()
+        for session in self.iter_sessions():
+            session.configure_for(model)
 
 
 @dataclasses.dataclass
diff --git a/cebra/integrations/sklearn/cebra.py b/cebra/integrations/sklearn/cebra.py
@@ -22,7 +22,6 @@
 """Define the CEBRA model."""
 
 import itertools
-import warnings
 from typing import (Callable, Dict, Iterable, List, Literal, Optional, Tuple,
                     Union)
 
@@ -687,7 +686,7 @@ def _get_dataset_multi(X: List[Iterable], y: List[Iterable]):
             if not _are_sessions_equal(X, y):
                 raise ValueError(
                     "Invalid number of samples or labels sessions: provide one session for single-session training, "
-                    "and make sure the number of samples in X and y need match, "
+                    "and make sure the number of samples in X and y match, "
                     f"got {len(X)} and {[len(y_i) for y_i in y]}.")
             is_multisession = False
             dataset = _get_dataset(X, y)
@@ -1255,67 +1254,6 @@ def transform(self,
 
         return output.detach().cpu().numpy()
 
-    #NOTE: Deprecated: transform is now handled in the solver but the original
-    #      method is kept here for testing.
-    def transform_deprecated(self,
-                             X: Union[npt.NDArray, torch.Tensor],
-                             session_id: Optional[int] = None) -> npt.NDArray:
-        """Transform an input sequence and return the embedding.
-
-        Args:
-            X: A numpy array or torch tensor of size ``time x dimension``.
-            session_id: The session ID, an :py:class:`int` between 0 and :py:attr:`num_sessions` for
-                multisession, set to ``None`` for single session.
-
-        Returns:
-            A :py:func:`numpy.array` of size ``time x output_dimension``.
-
-        Example:
-
-            >>> import cebra
-            >>> import numpy as np
-            >>> dataset =  np.random.uniform(0, 1, (1000, 30))
-            >>> cebra_model = cebra.CEBRA(max_iterations=10)
-            >>> cebra_model.fit(dataset)
-            CEBRA(max_iterations=10)
-            >>> embedding = cebra_model.transform(dataset)
-
-        """
-        warnings.warn(
-            "The method `transform_deprecated` is deprecated "
-            "but kept for testing puroposes."
-            "We recommend using `transform` instead.",
-            DeprecationWarning,
-            stacklevel=2)
-
-        sklearn_utils_validation.check_is_fitted(self, "n_features_")
-        model, offset = self._select_model(X, session_id)
-
-        # Input validation
-        X = sklearn_utils.check_input_array(X, min_samples=len(self.offset_))
-        input_dtype = X.dtype
-
-        with torch.no_grad():
-            model.eval()
-
-            if self.pad_before_transform:
-                X = np.pad(X, ((offset.left, offset.right - 1), (0, 0)),
-                           mode="edge")
-            X = torch.from_numpy(X).float().to(self.device_)
-
-            if isinstance(model, cebra.models.ConvolutionalModelMixin):
-                # Fully convolutional evaluation, switch (T, C) -> (1, C, T)
-                X = X.transpose(1, 0).unsqueeze(0)
-                output = model(X).cpu().numpy().squeeze(0).transpose(1, 0)
-            else:
-                # Standard evaluation, (T, C, dt)
-                output = model(X).cpu().numpy()
-
-        if input_dtype == "float64":
-            return output.astype(input_dtype)
-
-        return output
-
     def fit_transform(
         self,
         X: Union[npt.NDArray, torch.Tensor],
diff --git a/cebra/solver/base.py b/cebra/solver/base.py
@@ -52,7 +52,7 @@
 
 def _check_indices(batch_start_idx: int, batch_end_idx: int,
                    offset: cebra.data.Offset, num_samples: int):
-    """Check that indexes in a batch are in a correct range.
+    """Check that indices in a batch are in a correct range.
 
     First and last index must be positive integers, smaller than
     the total length of inputs in the dataset, the first index
diff --git a/cebra/solver/multiobjective.py b/cebra/solver/multiobjective.py
@@ -456,56 +456,6 @@ def validation(
         self.log.setdefault(("sum_loss_val",), []).append(sum_loss_valid)
         return stats_val
 
-    # NOTE: Deprecated: batched transform can now be performed (more memory efficient)
-    #       using the transform method of the model, and handling padding is implemented
-    #       directly in the base Solver. This method is kept for testing purposes.
-    @torch.no_grad()
-    def transform_deprecated(self, inputs: torch.Tensor) -> torch.Tensor:
-        """Transform the input data using the model.
-
-        Args:
-            inputs: The input data to transform.
-
-        Returns:
-            The transformed data.
-        """
-
-        warnings.warn(
-            "The method `transform_deprecated` is deprecated "
-            "but kept for testing puroposes."
-            "We recommend using `transform` instead.",
-            DeprecationWarning,
-            stacklevel=2)
-
-        offset = self.model.get_offset()
-        self.model.eval()
-        X = inputs.cpu().numpy()
-        X = np.pad(X, ((offset.left, offset.right - 1), (0, 0)), mode="edge")
-        X = torch.from_numpy(X).float().to(self.device)
-
-        if isinstance(self.model.module, cebra.models.ConvolutionalModelMixin):
-            # Fully convolutional evaluation, switch (T, C) -> (1, C, T)
-            X = X.transpose(1, 0).unsqueeze(0)
-            outputs = self.model(X)
-
-            # switch back from (1, C, T) -> (T, C)
-            if isinstance(outputs, torch.Tensor):
-                assert outputs.dim() == 3 and outputs.shape[0] == 1
-                outputs = outputs.squeeze(0).transpose(1, 0)
-            elif isinstance(outputs, tuple):
-                assert all(tensor.dim() == 3 and tensor.shape[0] == 1
-                           for tensor in outputs)
-                outputs = (
-                    output.squeeze(0).transpose(1, 0) for output in outputs)
-                outputs = tuple(outputs)
-            else:
-                raise ValueError("Invalid condition in solver.transform")
-        else:
-            # Standard evaluation, (T, C, dt)
-            outputs = self.model(X)
-
-        return outputs
-
 
 @register("supervised-solver-xcebra")
 @dataclasses.dataclass
diff --git a/cebra/solver/single_session.py b/cebra/solver/single_session.py
@@ -285,10 +285,7 @@ def _select_model(
         self._check_is_inputs_valid(inputs, session_id=session_id)
 
         model = self.model.module
-        if hasattr(model, 'get_offset'):
-            offset = model.get_offset()
-        else:
-            offset = None
+        offset = model.get_offset()
         return model, offset
 
 
diff --git a/tests/_utils_deprecated.py b/tests/_utils_deprecated.py
@@ -0,0 +1,127 @@
+import warnings
+from typing import Optional, Union
+
+import numpy as np
+import numpy.typing as npt
+import sklearn.utils.validation as sklearn_utils_validation
+import torch
+
+import cebra
+import cebra.integrations.sklearn.utils as sklearn_utils
+import cebra.models
+import cebra.solvers
+
+
+#NOTE: Deprecated: transform is now handled in the solver but the original
+#      method is kept here for testing.
+def cebra_transform_deprecated(cebra_model,
+                               X: Union[npt.NDArray, torch.Tensor],
+                               session_id: Optional[int] = None) -> npt.NDArray:
+    """Transform an input sequence and return the embedding.
+
+    Args:
+        cebra_model: The CEBRA model to use for the transform.
+        X: A numpy array or torch tensor of size ``time x dimension``.
+        session_id: The session ID, an :py:class:`int` between 0 and :py:attr:`num_sessions` for
+            multisession, set to ``None`` for single session.
+
+    Returns:
+        A :py:func:`numpy.array` of size ``time x output_dimension``.
+
+    Example:
+
+        >>> import cebra
+        >>> import numpy as np
+        >>> dataset =  np.random.uniform(0, 1, (1000, 30))
+        >>> cebra_model = cebra.CEBRA(max_iterations=10)
+        >>> cebra_model.fit(dataset)
+        CEBRA(max_iterations=10)
+        >>> embedding = cebra_model.transform(dataset)
+
+    """
+    warnings.warn(
+        "The method is deprecated "
+        "but kept for testing puroposes."
+        "We recommend using `transform` instead.",
+        DeprecationWarning,
+        stacklevel=2)
+
+    sklearn_utils_validation.check_is_fitted(cebra_model, "n_features_")
+    model, offset = cebra_model._select_model(X, session_id)
+
+    # Input validation
+    X = sklearn_utils.check_input_array(X, min_samples=len(cebra_model.offset_))
+    input_dtype = X.dtype
+
+    with torch.no_grad():
+        model.eval()
+
+        if cebra_model.pad_before_transform:
+            X = np.pad(X, ((offset.left, offset.right - 1), (0, 0)),
+                       mode="edge")
+        X = torch.from_numpy(X).float().to(cebra_model.device_)
+
+        if isinstance(model, cebra.models.ConvolutionalModelMixin):
+            # Fully convolutional evaluation, switch (T, C) -> (1, C, T)
+            X = X.transpose(1, 0).unsqueeze(0)
+            output = model(X).cpu().numpy().squeeze(0).transpose(1, 0)
+        else:
+            # Standard evaluation, (T, C, dt)
+            output = model(X).cpu().numpy()
+
+    if input_dtype == "float64":
+        return output.astype(input_dtype)
+
+    return output
+
+
+# NOTE: Deprecated: batched transform can now be performed (more memory efficient)
+#       using the transform method of the model, and handling padding is implemented
+#       directly in the base Solver. This method is kept for testing purposes.
+@torch.no_grad()
+def multiobjective_transform_deprecated(solver: cebra.solvers.Solver,
+                                        inputs: torch.Tensor) -> torch.Tensor:
+    """Transform the input data using the model.
+
+    Args:
+        solver: The solver containing the model and device.
+        inputs: The input data to transform.
+
+    Returns:
+        The transformed data.
+    """
+
+    warnings.warn(
+        "The method is deprecated "
+        "but kept for testing puroposes."
+        "We recommend using `transform` instead.",
+        DeprecationWarning,
+        stacklevel=2)
+
+    offset = solver.model.get_offset()
+    solver.model.eval()
+    X = inputs.cpu().numpy()
+    X = np.pad(X, ((offset.left, offset.right - 1), (0, 0)), mode="edge")
+    X = torch.from_numpy(X).float().to(solver.device)
+
+    if isinstance(solver.model.module, cebra.models.ConvolutionalModelMixin):
+        # Fully convolutional evaluation, switch (T, C) -> (1, C, T)
+        X = X.transpose(1, 0).unsqueeze(0)
+        outputs = solver.model(X)
+
+        # switch back from (1, C, T) -> (T, C)
+        if isinstance(outputs, torch.Tensor):
+            assert outputs.dim() == 3 and outputs.shape[0] == 1
+            outputs = outputs.squeeze(0).transpose(1, 0)
+        elif isinstance(outputs, tuple):
+            assert all(tensor.dim() == 3 and tensor.shape[0] == 1
+                       for tensor in outputs)
+            outputs = (output.squeeze(0).transpose(1, 0) for output in outputs)
+            outputs = tuple(outputs)
+        else:
+            raise ValueError("Invalid condition in solver.transform")
+    else:
+        # Standard evaluation, (T, C, dt)
+        outputs = solver.model(X)
+
+    return outputs
diff --git a/tests/test_integration_xcebra.py b/tests/test_integration_xcebra.py
@@ -1,5 +1,6 @@
 import pickle
 
+import _utils_deprecated
 import numpy as np
 import pytest
 import torch
@@ -173,8 +174,8 @@ def test_synthetic_data_training(synthetic_data, device):
                        atol=1e-4)
 
     # Test and compare the previous transform (transform_deprecated)
-    deprecated_transform_embedding = solver.transform_deprecated(
-        data.neural.to(device))
+    deprecated_transform_embedding = _utils_deprecated.multiobjective_transform_deprecated(
+        solver, data.neural.to(device))
     assert np.allclose(embedding,
                        deprecated_transform_embedding,
                        rtol=1e-4,
diff --git a/tests/test_sklearn.py b/tests/test_sklearn.py
diff --git a/tests/test_solver.py b/tests/test_solver.py