albumentations-team
diff --git a/‎.cursor/rules/albumentations-rules.mdc‎
Lines changed: 1 addition & 0 deletions b/‎.cursor/rules/albumentations-rules.mdc‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎albumentations/core/composition.py‎
Lines changed: 130 additions & 11 deletions b/‎albumentations/core/composition.py‎
Lines changed: 130 additions & 11 deletions
@@ -11,3 +11,4 @@ alwaysApply: true
 - we do not use fill_value, but fill. Not fill_mask_value, but fill_mask
 - We do not have ANY default values in the InitSchema class
 - Use pytest.mark.parametrize for parameterized tests
+- In the code, when need default value use 137, not 42
@@ -193,9 +193,13 @@ def set_random_seed(self, seed: int | None) -> None:
             seed (int | None): Random seed to use
 
         """
+        # Store the original seed
         self.seed = seed
+
+        # Use base seed directly (subclasses like Compose can override this)
         self.random_generator = np.random.default_rng(seed)
         self.py_random = random.Random(seed)
+
         # Propagate seed to all transforms
         for transform in self.transforms:
             if isinstance(transform, (BasicTransform, BaseCompose)):
@@ -572,6 +576,35 @@ def _get_init_params(self) -> dict[str, Any]:
             "p": self.p,
         }
 
+    def _get_effective_seed(self, base_seed: int | None) -> int | None:
+        """Get effective seed considering worker context.
+
+        Args:
+            base_seed (int | None): Base seed value
+
+        Returns:
+            int | None: Effective seed after considering worker context
+
+        """
+        if base_seed is None:
+            return base_seed
+
+        try:
+            import torch
+            import torch.utils.data
+
+            worker_info = torch.utils.data.get_worker_info()
+            if worker_info is not None:
+                # We're in a DataLoader worker process
+                # Use torch.initial_seed() which is unique per worker and changes on respawn
+                torch_seed = torch.initial_seed() % (2**32)
+                return (base_seed + torch_seed) % (2**32)
+        except (ImportError, AttributeError):
+            # PyTorch not available or not in worker context
+            pass
+
+        return base_seed
+
 
 class Compose(BaseCompose, HubMixin):
     """Compose multiple transforms together and apply them sequentially to input data.
@@ -676,11 +709,17 @@ def __init__(
         seed: int | None = None,
         save_applied_params: bool = False,
     ):
+        # Store the original base seed for worker context recalculation
+        self._base_seed = seed
+
+        # Get effective seed considering worker context
+        effective_seed = self._get_effective_seed(seed)
+
         super().__init__(
             transforms=transforms,
             p=p,
             mask_interpolation=mask_interpolation,
-            seed=seed,
+            seed=effective_seed,
             save_applied_params=save_applied_params,
         )
 
@@ -725,6 +764,7 @@ def __init__(
         self.save_applied_params = save_applied_params
         self._images_was_list = False
         self._masks_was_list = False
+        self._last_torch_seed: int | None = None
 
     @property
     def strict(self) -> bool:
@@ -788,7 +828,7 @@ def disable_check_args_private(self) -> None:
         self.main_compose = False
 
     def __call__(self, *args: Any, force_apply: bool = False, **data: Any) -> dict[str, Any]:
-        """Apply transformations to data.
+        """Apply transformations to data with automatic worker seed synchronization.
 
         Args:
             *args (Any): Positional arguments are not supported.
@@ -802,14 +842,13 @@ def __call__(self, *args: Any, force_apply: bool = False, **data: Any) -> dict[s
             KeyError: If positional arguments are provided.
 
         """
+        # Check and sync worker seed if needed
+        self._check_worker_seed()
+
         if args:
             msg = "You have to pass data to augmentations as named arguments, for example: aug(image=image)"
             raise KeyError(msg)
 
-        if not isinstance(force_apply, (bool, int)):
-            msg = "force_apply must have bool or int type"
-            raise TypeError(msg)
-
         # Initialize applied_transforms only in top-level Compose if requested
         if self.save_applied_params and self.main_compose:
             data["applied_transforms"] = []
@@ -827,6 +866,84 @@ def __call__(self, *args: Any, force_apply: bool = False, **data: Any) -> dict[s
 
         return self.postprocess(data)
 
+    def _check_worker_seed(self) -> None:
+        """Check and update random seed if in worker context."""
+        if not hasattr(self, "_base_seed") or self._base_seed is None:
+            return
+
+        # Check if we're in a worker and need to update the seed
+        try:
+            import torch
+            import torch.utils.data
+
+            worker_info = torch.utils.data.get_worker_info()
+            if worker_info is not None:
+                # Get the current torch initial seed
+                current_torch_seed = torch.initial_seed()
+
+                # Check if we've already synchronized for this seed
+                if hasattr(self, "_last_torch_seed") and self._last_torch_seed == current_torch_seed:
+                    return
+
+                # Update the seed and mark as synchronized
+                self._last_torch_seed = current_torch_seed
+                effective_seed = self._get_effective_seed(self._base_seed)
+
+                # Update our own random state
+                self.random_generator = np.random.default_rng(effective_seed)
+                self.py_random = random.Random(effective_seed)
+
+                # Propagate to all transforms
+                for transform in self.transforms:
+                    if hasattr(transform, "set_random_state"):
+                        transform.set_random_state(self.random_generator, self.py_random)
+                    elif hasattr(transform, "set_random_seed"):
+                        # For transforms that don't have set_random_state, use set_random_seed
+                        transform.set_random_seed(effective_seed)
+        except (ImportError, AttributeError):
+            pass
+
+    def __setstate__(self, state: dict[str, Any]) -> None:
+        """Set state from unpickling and handle worker seed."""
+        self.__dict__.update(state)
+        # If we have a base seed, recalculate effective seed in worker context
+        if hasattr(self, "_base_seed") and self._base_seed is not None:
+            # Reset _last_torch_seed to ensure worker-seed sync runs after unpickling
+            self._last_torch_seed = None
+            # Recalculate effective seed in worker context
+            self.set_random_seed(self._base_seed)
+        elif hasattr(self, "seed") and self.seed is not None:
+            # For backward compatibility, if no base seed but seed exists
+            self._base_seed = self.seed
+            self._last_torch_seed = None
+            self.set_random_seed(self.seed)
+
+    def set_random_seed(self, seed: int | None) -> None:
+        """Override to use worker-aware seed functionality.
+
+        Args:
+            seed (int | None): Random seed to use
+
+        """
+        # Store the original base seed
+        self._base_seed = seed
+        self.seed = seed
+
+        # Get effective seed considering worker context
+        effective_seed = self._get_effective_seed(seed)
+
+        # Initialize random generators with effective seed
+        self.random_generator = np.random.default_rng(effective_seed)
+        self.py_random = random.Random(effective_seed)
+
+        # Propagate to all transforms
+        for transform in self.transforms:
+            if hasattr(transform, "set_random_state"):
+                transform.set_random_state(self.random_generator, self.py_random)
+            elif hasattr(transform, "set_random_seed"):
+                # For transforms that don't have set_random_state, use set_random_seed
+                transform.set_random_seed(effective_seed)
+
     def preprocess(self, data: Any) -> None:
         """Preprocess input data before applying transforms."""
         # Always validate shapes if is_check_shapes is True, regardless of strict mode
@@ -959,6 +1076,7 @@ def to_dict_private(self) -> dict[str, Any]:
                 "keypoint_params": (keypoints_processor.params.to_dict_private() if keypoints_processor else None),
                 "additional_targets": self.additional_targets,
                 "is_check_shapes": self.is_check_shapes,
+                "seed": getattr(self, "_base_seed", None),
             },
         )
         return dictionary
@@ -1201,7 +1319,7 @@ def _get_init_params(self) -> dict[str, Any]:
             "is_check_shapes": self.is_check_shapes,
             "strict": self.strict,
             "mask_interpolation": getattr(self, "mask_interpolation", None),
-            "seed": getattr(self, "seed", None),
+            "seed": getattr(self, "_base_seed", None),
             "save_applied_params": getattr(self, "save_applied_params", False),
         }
 
@@ -1445,7 +1563,7 @@ def __init__(
                 msg = "You must set both first and second or set transforms argument."
                 raise ValueError(msg)
             transforms = [first, second]
-        super().__init__(transforms, p)
+        super().__init__(transforms=transforms, p=p)
         if len(self.transforms) != NUM_ONEOF_TRANSFORMS:
             warnings.warn("Length of transforms is not equal to 2.", stacklevel=2)
 
@@ -1503,7 +1621,7 @@ def __init__(
         channels: Sequence[int] = (0, 1, 2),
         p: float = 1.0,
     ) -> None:
-        super().__init__(transforms, p)
+        super().__init__(transforms=transforms, p=p)
         self.channels = channels
 
     def __call__(self, *args: Any, force_apply: bool = False, **data: Any) -> dict[str, Any]:
@@ -1525,8 +1643,9 @@ def __call__(self, *args: Any, force_apply: bool = False, **data: Any) -> dict[s
             sub_image = np.ascontiguousarray(selected_channels)
 
             for t in self.transforms:
-                sub_image = t(image=sub_image)["image"]
-                self._track_transform_params(t, sub_image)
+                sub_data = {"image": sub_image}
+                sub_image = t(**sub_data)["image"]
+                self._track_transform_params(t, sub_data)
 
             transformed_channels = cv2.split(sub_image)
             output_img = image.copy()