rename model=>models

clee-ai · clee-ai · commit 694683651c01 · 2021-07-22T12:51:42.000-05:00
diff --git a/conf/dataset/segmentation/s3dis/s3dis1x1.yaml b/conf/dataset/segmentation/s3dis/s3dis1x1.yaml
@@ -1,6 +1,6 @@
 # @package dataset
 defaults:
   - segmentation/default
-_target_: torch_points3d.dataset.s3dis1x1.s3dis_data_module
+_target_: torch_points3d.datasets.s3dis1x1.s3dis_data_module
 cfg:
   fold: 5
diff --git a/conf/model/default.yaml b/conf/model/default.yaml
@@ -1,6 +1,6 @@
 # By default we turn off recursive instantiation, allowing the user to instantiate themselves at the appropriate times.
 _recursive_: false
 
-_target_: torch_points3d.model.base_model.PointCloudBaseModel
+_target_: torch_points3d.models.base_model.PointCloudBaseModel
 optimizer: ${optimizer}
 scheduler: ${scheduler}
diff --git a/torch_points3d/core/instantiator.py b/torch_points3d/core/instantiator.py
@@ -6,11 +6,11 @@
 import torch
 from omegaconf import DictConfig
 
-from torch_points3d.dataset.base_dataset import PointCloudDataModule
+from torch_points3d.datasets.base_dataset import PointCloudDataModule
 
 if TYPE_CHECKING:
     # avoid circular imports
-    from torch_points3d.model.base_model import PointCloudBaseModel
+    from torch_points3d.models.base_model import PointCloudBaseModel
 
 
 class Instantiator:
diff --git a/torch_points3d/datasets/base_dataset.py b/torch_points3d/datasets/base_dataset.py
diff --git a/torch_points3d/datasets/s3dis1x1.py b/torch_points3d/datasets/s3dis1x1.py
@@ -5,7 +5,7 @@
 import hydra.utils
 import torch_geometric.transforms as T
 from torch.utils.data import DataLoader
-from torch_points3d.dataset.base_dataset import PointCloudDataModule, PointCloudDataConfig
+from torch_points3d.datasets.base_dataset import PointCloudDataModule, PointCloudDataConfig
 
 from torch_geometric.datasets import S3DIS as S3DIS1x1
 
diff --git a/torch_points3d/model/base_model.py b/torch_points3d/model/base_model.py
diff --git a/torch_points3d/models/base_model.py b/torch_points3d/models/base_model.py
@@ -1,18 +1,86 @@
-import torch.nn as nn
+from typing import Any, Dict, Optional, Tuple, Union
 
-from omegaconf import DictConfig, OmegaConf
+import pytorch_lightning as pl
+import torch
+from pytorch_lightning.utilities import rank_zero_info
+from pytorch_lightning.utilities.exceptions import MisconfigurationException
 
-from torch_geometric.data import Data
+from torch_points3d.core.instantiator import Instantiator
+from torch_points3d.core.config import OptimizerConfig, SchedulerConfig
 
 
-class BaseModel(nn.Module):
-    def __init__(self, opt: DictConfig):
-        super(BaseModel, self).__init__()
-        self.opt = opt
+class PointCloudBaseModel(pl.LightningModule):
+    def __init__(
+        self,
+        model: torch.nn.Module,
+        optimizer: OptimizerConfig,
+        scheduler: SchedulerConfig,
+        instantiator: Instantiator,
+    ):
+        super().__init__()
+        self.model = model
+        # some optimizers/schedulers need parameters only known dynamically
+        # allow users to override the getter to instantiate them lazily
+        self.optimizer_cfg = optimizer
+        self.scheduler_cfg = scheduler
+        self.instantiator = instantiator
 
-    def set_input(self, data: Data):
-        """Unpack input data from the dataloader and perform necessary pre-processing steps.
-        Parameters:
-            input (dict): includes the data itself and its metadata information.
+    def configure_optimizers(self) -> Dict:
+        """Prepare optimizer and scheduler"""
+        self.optimizer = self.instantiator.optimizer(self.model, self.optimizer_cfg)
+        # compute_warmup needs the datamodule to be available when `self.num_training_steps`
+        # is called that is why this is done here and not in the __init__
+        self.scheduler_cfg.num_training_steps, self.scheduler_cfg.num_warmup_steps = self.compute_warmup(
+            num_training_steps=self.scheduler_cfg.num_training_steps,
+            num_warmup_steps=self.scheduler_cfg.num_warmup_steps,
+        )
+        rank_zero_info(f"Inferring number of training steps, set to {self.scheduler_cfg.num_training_steps}")
+        rank_zero_info(f"Inferring number of warmup steps from ratio, set to {self.scheduler_cfg.num_warmup_steps}")
+        self.scheduler = self.instantiator.scheduler(self.scheduler_cfg, self.optimizer)
+
+        return {
+            "optimizer": self.optimizer,
+            "lr_scheduler": {"scheduler": self.scheduler, "interval": "step", "frequency": 1},
+        }
+
+    @property
+    def num_training_steps(self) -> int:
+        """Total training steps inferred from datamodule and devices."""
+        if isinstance(self.trainer.limit_train_batches, int) and self.trainer.limit_train_batches != 0:
+            dataset_size = self.trainer.limit_train_batches
+        elif isinstance(self.trainer.limit_train_batches, float):
+            # limit_train_batches is a percentage of batches
+            dataset_size = len(self.trainer.datamodule.train_dataloader())
+            dataset_size = int(dataset_size * self.trainer.limit_train_batches)
+        else:
+            dataset_size = len(self.trainer.datamodule.train_dataloader())
+
+        num_devices = max(1, self.trainer.num_gpus, self.trainer.num_processes)
+        if self.trainer.tpu_cores:
+            num_devices = max(num_devices, self.trainer.tpu_cores)
+
+        effective_batch_size = self.trainer.accumulate_grad_batches * num_devices
+        max_estimated_steps = (dataset_size // effective_batch_size) * self.trainer.max_epochs
+
+        if self.trainer.max_steps and self.trainer.max_steps < max_estimated_steps:
+            return self.trainer.max_steps
+        return max_estimated_steps
+
+    def compute_warmup(self, num_training_steps: int, num_warmup_steps: Union[int, float]) -> Tuple[int, int]:
+        if num_training_steps < 0:
+            # less than 0 specifies to infer number of training steps
+            num_training_steps = self.num_training_steps
+        if isinstance(num_warmup_steps, float):
+            # Convert float values to percentage of training steps to use as warmup
+            num_warmup_steps *= num_training_steps
+        return num_training_steps, num_warmup_steps
+
+    def setup(self, stage: str):
+        self.configure_metrics(stage)
+
+    def configure_metrics(self, stage: str) -> Optional[Any]:
+        """
+        Override to configure metrics for train/validation/test.
+        This is called on fit start to have access to the data module,
+        and initialize any data specific metrics.
         """
-        raise NotImplementedError
diff --git a/torch_points3d/trainer.py b/torch_points3d/trainer.py
@@ -6,8 +6,8 @@
 
 # from hydra.utils.instantiate as hydra_instantiate
 
-from torch_points3d.model.base_model import PointCloudBaseModel
-from torch_points3d.dataset.base_dataset import PointCloudDataModule, PointCloudDataConfig, PointCloudDataModule
+from torch_points3d.models.base_model import PointCloudBaseModel
+from torch_points3d.datasets.base_dataset import PointCloudDataModule, PointCloudDataConfig, PointCloudDataModule
 from torch_points3d.core.instantiator import HydraInstantiator, Instantiator
 from torch_points3d.core.config import TaskConfig, TrainerConfig