mehta-lab
diff --git a/‎examples/virtual_staining/dlmbl_exercise/exercise.ipynb‎
Lines changed: 270 additions & 184 deletions b/‎examples/virtual_staining/dlmbl_exercise/exercise.ipynb‎
Lines changed: 270 additions & 184 deletions
diff --git a/‎examples/virtual_staining/dlmbl_exercise/solution.ipynb‎
Lines changed: 346 additions & 1690 deletions b/‎examples/virtual_staining/dlmbl_exercise/solution.ipynb‎
Lines changed: 346 additions & 1690 deletions
diff --git a/‎examples/virtual_staining/dlmbl_exercise/solution.py‎
Lines changed: 370 additions & 239 deletions b/‎examples/virtual_staining/dlmbl_exercise/solution.py‎
Lines changed: 370 additions & 239 deletions
diff --git a/‎viscy/cli.py‎
Lines changed: 3 additions & 2 deletions b/‎viscy/cli.py‎
Lines changed: 3 additions & 2 deletions
diff --git a/‎viscy/data/gpu_aug.py‎
Lines changed: 25 additions & 1 deletion b/‎viscy/data/gpu_aug.py‎
Lines changed: 25 additions & 1 deletion
diff --git a/‎viscy/data/mmap_cache.py‎
Lines changed: 264 additions & 0 deletions b/‎viscy/data/mmap_cache.py‎
Lines changed: 264 additions & 0 deletions
@@ -21,6 +21,7 @@ def subcommands() -> dict[str, set[str]]:
         subcommand_base_args = {"model"}
         subcommands["preprocess"] = subcommand_base_args
         subcommands["export"] = subcommand_base_args
+        subcommands["precompute"] = subcommand_base_args
         return subcommands
 
     def add_arguments_to_parser(self, parser) -> None:
@@ -50,8 +51,8 @@ def main() -> None:
     Set default random seed to 42.
     """
     _setup_environment()
-    require_model = "preprocess" not in sys.argv
-    require_data = {"preprocess", "export"}.isdisjoint(sys.argv)
+    require_model = {"preprocess", "precompute"}.isdisjoint(sys.argv)
+    require_data = {"preprocess", "precompute", "export"}.isdisjoint(sys.argv)
     _ = VisCyCLI(
         model_class=LightningModule,
         datamodule_class=LightningDataModule if require_data else None,
 
@@ -19,6 +19,7 @@
 from viscy.data.distributed import ShardedDistributedSampler
 from viscy.data.hcs import _ensure_channel_list, _read_norm_meta
 from viscy.data.typing import DictTransform, NormMeta
+from viscy.preprocessing.precompute import _filter_fovs, _filter_wells
 
 if TYPE_CHECKING:
     from multiprocessing.managers import DictProxy
@@ -36,6 +37,7 @@ class GPUTransformDataModule(ABC, LightningDataModule):
     batch_size: int
     num_workers: int
     pin_memory: bool
+    prefetch_factor: int | None
 
     def _maybe_sampler(
         self, dataset: Dataset, shuffle: bool
@@ -59,6 +61,7 @@ def train_dataloader(self) -> DataLoader:
             pin_memory=self.pin_memory,
             drop_last=False,
             collate_fn=list_data_collate,
+            prefetch_factor=self.prefetch_factor,
         )
 
     def val_dataloader(self) -> DataLoader:
@@ -74,6 +77,7 @@ def val_dataloader(self) -> DataLoader:
             pin_memory=self.pin_memory,
             drop_last=False,
             collate_fn=list_data_collate,
+            prefetch_factor=self.prefetch_factor,
         )
 
     @property
@@ -169,7 +173,23 @@ def __getitem__(self, idx: int) -> dict[str, Tensor]:
         return sample
 
 
-class CachedOmeZarrDataModule(GPUTransformDataModule):
+class SelectWell:
+    _include_wells: list[str] | None
+    _exclude_fovs: list[str] | None
+
+    def _filter_fit_fovs(self, plate: Plate) -> list[Position]:
+        positions = []
+        for well in _filter_wells(plate, include_wells=self._include_wells):
+            for fov in _filter_fovs(well, exclude_fovs=self._exclude_fovs):
+                positions.append(fov)
+        if len(positions) < 2:
+            raise ValueError(
+                "At least 2 FOVs are required for training and validation."
+            )
+        return positions
+
+
+class CachedOmeZarrDataModule(GPUTransformDataModule, SelectWell):
     """Data module for cached OME-Zarr arrays.
 
     Parameters
@@ -199,6 +219,8 @@ class CachedOmeZarrDataModule(GPUTransformDataModule):
         Skip caching for this dataset, by default False
     include_wells : list[str], optional
         List of well names to include in the dataset, by default None (all)
+    include_wells : list[str], optional
+        List of well names to include in the dataset, by default None (all)
     """
 
     def __init__(
@@ -215,6 +237,7 @@ def __init__(
         pin_memory: bool = True,
         skip_cache: bool = False,
         include_wells: list[str] | None = None,
+        exclude_fovs: list[str] | None = None,
     ):
         super().__init__()
         self.data_path = data_path
@@ -229,6 +252,7 @@ def __init__(
         self.pin_memory = pin_memory
         self.skip_cache = skip_cache
         self._include_wells = include_wells
+        self._exclude_fovs = exclude_fovs
 
     @property
     def train_cpu_transforms(self) -> Compose:
 
@@ -0,0 +1,264 @@
+from __future__ import annotations
+
+import os
+import tempfile
+from logging import getLogger
+from pathlib import Path
+from typing import TYPE_CHECKING, Literal
+
+import numpy as np
+import torch
+from iohub.ngff import Plate, Position, open_ome_zarr
+from monai.data.meta_obj import set_track_meta
+from monai.transforms.compose import Compose
+from tensordict.memmap import MemoryMappedTensor
+from torch import Tensor
+from torch.multiprocessing import Manager
+from torch.utils.data import Dataset
+
+from viscy.data.gpu_aug import GPUTransformDataModule, SelectWell
+from viscy.data.hcs import _ensure_channel_list, _read_norm_meta
+from viscy.data.typing import DictTransform, NormMeta
+
+if TYPE_CHECKING:
+    from multiprocessing.managers import DictProxy
+
+_logger = getLogger("lightning.pytorch")
+
+_CacheMetadata = tuple[Position, int, NormMeta | None]
+
+
+class MmappedDataset(Dataset):
+    def __init__(
+        self,
+        positions: list[Position],
+        channel_names: list[str],
+        cache_map: DictProxy,
+        buffer: MemoryMappedTensor,
+        preprocess_transforms: Compose | None = None,
+        cpu_transform: Compose | None = None,
+        array_key: str = "0",
+        load_normalization_metadata: bool = True,
+    ):
+        key = 0
+        self._metadata_map: dict[int, _CacheMetadata] = {}
+        for position in positions:
+            img = position[array_key]
+            norm_meta = _read_norm_meta(position)
+            for time_idx in range(img.frames):
+                cache_map[key] = None
+                self._metadata_map[key] = (position, time_idx, norm_meta)
+                key += 1
+        self.channels = {ch: position.get_channel_index(ch) for ch in channel_names}
+        self.array_key = array_key
+        self._buffer = buffer
+        self._cache_map = cache_map
+        self.preprocess_transforms = preprocess_transforms
+        self.cpu_transform = cpu_transform
+        self.load_normalization_metadata = load_normalization_metadata
+
+    def __len__(self) -> int:
+        return len(self._metadata_map)
+
+    def _split_channels(self, volume: Tensor) -> dict[str, Tensor]:
+        return {name: img[None] for name, img in zip(self.channels.keys(), volume)}
+
+    def _preprocess_volume(self, volume: Tensor, norm_meta) -> Tensor:
+        if self.preprocess_transforms:
+            orig_shape = volume.shape
+            sample = self._split_channels(volume)
+            if self.load_normalization_metadata:
+                sample["norm_meta"] = norm_meta
+            sample = self.preprocess_transforms(sample)
+            volume = torch.cat([sample[name] for name in self.channels.keys()], dim=0)
+            assert volume.shape == orig_shape, (volume.shape, orig_shape, sample.keys())
+        return volume
+
+    def __getitem__(self, idx: int) -> dict[str, Tensor]:
+        position, time_idx, norm_meta = self._metadata_map[idx]
+        if not self._cache_map[idx]:
+            _logger.debug(f"Loading volume for index {idx}")
+            volume = torch.from_numpy(
+                position[self.array_key]
+                .oindex[time_idx, list(self.channels.values())]
+                .astype(np.float32)
+            )
+            volume = self._preprocess_volume(volume, norm_meta)
+            _logger.debug(f"Caching for index {idx}")
+            self._cache_map[idx] = True
+            self._buffer[idx] = volume
+        else:
+            _logger.debug(f"Using cached volume for index {idx}")
+            volume = self._buffer[idx]
+        sample = self._split_channels(volume)
+        if self.cpu_transform:
+            sample = self.cpu_transform(sample)
+        if not isinstance(sample, list):
+            sample = [sample]
+        return sample
+
+
+class MmappedDataModule(GPUTransformDataModule, SelectWell):
+    """Data module for cached OME-Zarr arrays.
+
+    Parameters
+    ----------
+    data_path : Path
+        Path to the HCS OME-Zarr dataset.
+    channels : str | list[str]
+        Channel names to load.
+    batch_size : int
+        Batch size for training and validation.
+    num_workers : int
+        Number of workers for data-loaders.
+    split_ratio : float
+        Fraction of the FOVs used for the training split.
+        The rest will be used for validation.
+    train_cpu_transforms : list[DictTransform]
+        Transforms to be applied on the CPU during training.
+    val_cpu_transforms : list[DictTransform]
+        Transforms to be applied on the CPU during validation.
+    train_gpu_transforms : list[DictTransform]
+        Transforms to be applied on the GPU during training.
+    val_gpu_transforms : list[DictTransform]
+        Transforms to be applied on the GPU during validation.
+    pin_memory : bool, optional
+        Use page-locked memory in data-loaders, by default True
+    prefetch_factor : int | None, optional
+        Prefetching ratio for the torch dataloader, by default None
+    array_key : str, optional
+        Name of the image arrays (multiscales level), by default "0"
+    scratch_dir : Path | None, optional
+        Path to the scratch directory,
+        by default None (use OS temporary data directory)
+    include_wells : list[str] | None, optional
+        Include only a subset of wells, by default None (include all wells)
+    exclude_fovs : list[str] | None, optional
+        Exclude FOVs, by default None (do not exclude any FOVs)
+    """
+
+    def __init__(
+        self,
+        data_path: Path,
+        channels: str | list[str],
+        batch_size: int,
+        num_workers: int,
+        split_ratio: float,
+        preprocess_transforms: list[DictTransform],
+        train_cpu_transforms: list[DictTransform],
+        val_cpu_transforms: list[DictTransform],
+        train_gpu_transforms: list[DictTransform],
+        val_gpu_transforms: list[DictTransform],
+        pin_memory: bool = True,
+        prefetch_factor: int | None = None,
+        array_key: str = "0",
+        scratch_dir: Path | None = None,
+        include_wells: list[str] | None = None,
+        exclude_fovs: list[str] | None = None,
+    ):
+        super().__init__()
+        self.data_path = Path(data_path)
+        self.channels = _ensure_channel_list(channels)
+        self.batch_size = batch_size
+        self.num_workers = num_workers
+        self.split_ratio = split_ratio
+        self._preprocessing_transforms = Compose(preprocess_transforms)
+        self._train_cpu_transforms = Compose(train_cpu_transforms)
+        self._val_cpu_transforms = Compose(val_cpu_transforms)
+        self._train_gpu_transforms = Compose(train_gpu_transforms)
+        self._val_gpu_transforms = Compose(val_gpu_transforms)
+        self.pin_memory = pin_memory
+        self.array_key = array_key
+        self.scratch_dir = scratch_dir
+        self._include_wells = include_wells
+        self._exclude_fovs = exclude_fovs
+        self.prepare_data_per_node = True
+        self.prefetch_factor = prefetch_factor if self.num_workers > 0 else None
+
+    @property
+    def preprocessing_transforms(self) -> Compose:
+        return self._preprocessing_transforms
+
+    @property
+    def train_cpu_transforms(self) -> Compose:
+        return self._train_cpu_transforms
+
+    @property
+    def train_gpu_transforms(self) -> Compose:
+        return self._train_gpu_transforms
+
+    @property
+    def val_cpu_transforms(self) -> Compose:
+        return self._val_cpu_transforms
+
+    @property
+    def val_gpu_transforms(self) -> Compose:
+        return self._val_gpu_transforms
+
+    @property
+    def cache_dir(self) -> Path:
+        scratch_dir = self.scratch_dir or Path(tempfile.gettempdir())
+        cache_dir = Path(
+            scratch_dir,
+            os.getenv("SLURM_JOB_ID", "viscy_cache"),
+            str(
+                torch.distributed.get_rank()
+                if torch.distributed.is_initialized()
+                else 0
+            ),
+            self.data_path.name,
+        )
+        cache_dir.mkdir(parents=True, exist_ok=True)
+        return cache_dir
+
+    def _set_fit_global_state(self, num_positions: int) -> list[int]:
+        # disable metadata tracking in MONAI for performance
+        set_track_meta(False)
+        # shuffle positions, randomness is handled globally
+        return torch.randperm(num_positions).tolist()
+
+    def _buffer_shape(self, arr_shape, fovs) -> tuple[int, ...]:
+        return (len(fovs) * arr_shape[0], len(self.channels), *arr_shape[2:])
+
+    def setup(self, stage: Literal["fit", "validate"]) -> None:
+        if stage not in ("fit", "validate"):
+            raise NotImplementedError("Only fit and validate stages are supported.")
+        plate: Plate = open_ome_zarr(self.data_path, mode="r", layout="hcs")
+        positions = self._filter_fit_fovs(plate)
+        arr_shape = positions[0][self.array_key].shape
+        shuffled_indices = self._set_fit_global_state(len(positions))
+        num_train_fovs = int(len(positions) * self.split_ratio)
+        train_fovs = [positions[i] for i in shuffled_indices[:num_train_fovs]]
+        val_fovs = [positions[i] for i in shuffled_indices[num_train_fovs:]]
+        _logger.debug(f"Training FOVs: {[p.zgroup.name for p in train_fovs]}")
+        _logger.debug(f"Validation FOVs: {[p.zgroup.name for p in val_fovs]}")
+        train_buffer = MemoryMappedTensor.empty(
+            self._buffer_shape(arr_shape, train_fovs),
+            dtype=torch.float32,
+            filename=self.cache_dir / "train.mmap",
+        )
+        val_buffer = MemoryMappedTensor.empty(
+            self._buffer_shape(arr_shape, val_fovs),
+            dtype=torch.float32,
+            filename=self.cache_dir / "val.mmap",
+        )
+        cache_map_train = Manager().dict()
+        self.train_dataset = MmappedDataset(
+            positions=train_fovs,
+            channel_names=self.channels,
+            cache_map=cache_map_train,
+            buffer=train_buffer,
+            preprocess_transforms=self.preprocessing_transforms,
+            cpu_transform=self.train_cpu_transforms,
+            array_key=self.array_key,
+        )
+        cache_map_val = Manager().dict()
+        self.val_dataset = MmappedDataset(
+            positions=val_fovs,
+            channel_names=self.channels,
+            cache_map=cache_map_val,
+            buffer=val_buffer,
+            preprocess_transforms=self.preprocessing_transforms,
+            cpu_transform=self.val_cpu_transforms,
+            array_key=self.array_key,
+        )