change assertion order for setup() and configure_model() in test_hooks.py

Alan Chu · Alan Chu · commit 8ba644ad6ed6 · 2024-11-25T18:32:16.000Z
diff --git a/tests/tests_pytorch/models/test_hooks.py b/tests/tests_pytorch/models/test_hooks.py
@@ -21,11 +21,10 @@
 from lightning.pytorch import Callback, LightningDataModule, LightningModule, Trainer, __version__
 from lightning.pytorch.demos.boring_classes import BoringDataModule, BoringModel, RandomDataset
 from lightning.pytorch.utilities.model_helpers import is_overridden
+from tests_pytorch.helpers.runif import RunIf
 from torch import Tensor
 from torch.utils.data import DataLoader
 
-from tests_pytorch.helpers.runif import RunIf
-
 
 class HookedDataModule(BoringDataModule):
     def __init__(self, called):
@@ -267,79 +266,83 @@ def _auto_train_batch(trainer, model, batches, device, current_epoch=0, current_
         using_deepspeed = kwargs.get("strategy") == "deepspeed"
         out = []
         for i in range(current_batch, batches):
-            out.extend([
-                {"name": "on_before_batch_transfer", "args": (ANY, 0)},
-                {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
-                {"name": "on_after_batch_transfer", "args": (ANY, 0)},
-                {"name": "Callback.on_train_batch_start", "args": (trainer, model, ANY, i)},
-                {"name": "on_train_batch_start", "args": (ANY, i)},
-                {"name": "forward", "args": (ANY,)},
-                {"name": "training_step", "args": (ANY, i)},
-                {"name": "Callback.on_before_zero_grad", "args": (trainer, model, ANY)},
-                {"name": "on_before_zero_grad", "args": (ANY,)},
-                {"name": "optimizer_zero_grad", "args": (current_epoch, i, ANY)},
-                {"name": "Callback.on_before_backward", "args": (trainer, model, ANY)},
-                {"name": "on_before_backward", "args": (ANY,)},
-                # DeepSpeed handles backward internally
-                *([{"name": "backward", "args": (ANY,)}] if not using_deepspeed else []),
-                {"name": "Callback.on_after_backward", "args": (trainer, model)},
-                {"name": "on_after_backward"},
-                # note: unscaling happens here in the case of AMP
-                {"name": "Callback.on_before_optimizer_step", "args": (trainer, model, ANY)},
-                {"name": "on_before_optimizer_step", "args": (ANY,)},
-                {
-                    "name": "clip_gradients",
-                    "args": (ANY,),
-                    "kwargs": {"gradient_clip_val": None, "gradient_clip_algorithm": None},
-                },
-                {
-                    "name": "configure_gradient_clipping",
-                    "args": (ANY,),
-                    "kwargs": {"gradient_clip_val": None, "gradient_clip_algorithm": None},
-                },
-                # this is after because it refers to the `LightningModule.optimizer_step` hook which encapsulates
-                # the actual call to `Precision.optimizer_step`
-                {
-                    "name": "optimizer_step",
-                    "args": (current_epoch, i, ANY, ANY),
-                },
-                *(
-                    [{"name": "lr_scheduler_step", "args": (ANY, None)}]
-                    if i == (trainer.num_training_batches - 1)
-                    else []
-                ),
-                {"name": "Callback.on_train_batch_end", "args": (trainer, model, {"loss": ANY}, ANY, i)},
-                {"name": "on_train_batch_end", "args": ({"loss": ANY}, ANY, i)},
-            ])
+            out.extend(
+                [
+                    {"name": "on_before_batch_transfer", "args": (ANY, 0)},
+                    {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
+                    {"name": "on_after_batch_transfer", "args": (ANY, 0)},
+                    {"name": "Callback.on_train_batch_start", "args": (trainer, model, ANY, i)},
+                    {"name": "on_train_batch_start", "args": (ANY, i)},
+                    {"name": "forward", "args": (ANY,)},
+                    {"name": "training_step", "args": (ANY, i)},
+                    {"name": "Callback.on_before_zero_grad", "args": (trainer, model, ANY)},
+                    {"name": "on_before_zero_grad", "args": (ANY,)},
+                    {"name": "optimizer_zero_grad", "args": (current_epoch, i, ANY)},
+                    {"name": "Callback.on_before_backward", "args": (trainer, model, ANY)},
+                    {"name": "on_before_backward", "args": (ANY,)},
+                    # DeepSpeed handles backward internally
+                    *([{"name": "backward", "args": (ANY,)}] if not using_deepspeed else []),
+                    {"name": "Callback.on_after_backward", "args": (trainer, model)},
+                    {"name": "on_after_backward"},
+                    # note: unscaling happens here in the case of AMP
+                    {"name": "Callback.on_before_optimizer_step", "args": (trainer, model, ANY)},
+                    {"name": "on_before_optimizer_step", "args": (ANY,)},
+                    {
+                        "name": "clip_gradients",
+                        "args": (ANY,),
+                        "kwargs": {"gradient_clip_val": None, "gradient_clip_algorithm": None},
+                    },
+                    {
+                        "name": "configure_gradient_clipping",
+                        "args": (ANY,),
+                        "kwargs": {"gradient_clip_val": None, "gradient_clip_algorithm": None},
+                    },
+                    # this is after because it refers to the `LightningModule.optimizer_step` hook which encapsulates
+                    # the actual call to `Precision.optimizer_step`
+                    {
+                        "name": "optimizer_step",
+                        "args": (current_epoch, i, ANY, ANY),
+                    },
+                    *(
+                        [{"name": "lr_scheduler_step", "args": (ANY, None)}]
+                        if i == (trainer.num_training_batches - 1)
+                        else []
+                    ),
+                    {"name": "Callback.on_train_batch_end", "args": (trainer, model, {"loss": ANY}, ANY, i)},
+                    {"name": "on_train_batch_end", "args": ({"loss": ANY}, ANY, i)},
+                ]
+            )
         return out
 
     @staticmethod
     def _manual_train_batch(trainer, model, batches, device, **kwargs):
         using_deepspeed = kwargs.get("strategy") == "deepspeed"
         out = []
         for i in range(batches):
-            out.extend([
-                {"name": "on_before_batch_transfer", "args": (ANY, 0)},
-                {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
-                {"name": "on_after_batch_transfer", "args": (ANY, 0)},
-                {"name": "Callback.on_train_batch_start", "args": (trainer, model, ANY, i)},
-                {"name": "on_train_batch_start", "args": (ANY, i)},
-                {"name": "forward", "args": (ANY,)},
-                {"name": "Callback.on_before_backward", "args": (trainer, model, ANY)},
-                {"name": "on_before_backward", "args": (ANY,)},
-                # DeepSpeed handles backward internally
-                *([{"name": "backward", "args": (ANY,)}] if not using_deepspeed else []),
-                {"name": "Callback.on_after_backward", "args": (trainer, model)},
-                {"name": "on_after_backward"},
-                # `manual_backward` calls the previous 3
-                {"name": "manual_backward", "args": (ANY,)},
-                {"name": "closure"},
-                {"name": "Callback.on_before_optimizer_step", "args": (trainer, model, ANY)},
-                {"name": "on_before_optimizer_step", "args": (ANY,)},
-                {"name": "training_step", "args": (ANY, i)},
-                {"name": "Callback.on_train_batch_end", "args": (trainer, model, {"loss": ANY}, ANY, i)},
-                {"name": "on_train_batch_end", "args": ({"loss": ANY}, ANY, i)},
-            ])
+            out.extend(
+                [
+                    {"name": "on_before_batch_transfer", "args": (ANY, 0)},
+                    {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
+                    {"name": "on_after_batch_transfer", "args": (ANY, 0)},
+                    {"name": "Callback.on_train_batch_start", "args": (trainer, model, ANY, i)},
+                    {"name": "on_train_batch_start", "args": (ANY, i)},
+                    {"name": "forward", "args": (ANY,)},
+                    {"name": "Callback.on_before_backward", "args": (trainer, model, ANY)},
+                    {"name": "on_before_backward", "args": (ANY,)},
+                    # DeepSpeed handles backward internally
+                    *([{"name": "backward", "args": (ANY,)}] if not using_deepspeed else []),
+                    {"name": "Callback.on_after_backward", "args": (trainer, model)},
+                    {"name": "on_after_backward"},
+                    # `manual_backward` calls the previous 3
+                    {"name": "manual_backward", "args": (ANY,)},
+                    {"name": "closure"},
+                    {"name": "Callback.on_before_optimizer_step", "args": (trainer, model, ANY)},
+                    {"name": "on_before_optimizer_step", "args": (ANY,)},
+                    {"name": "training_step", "args": (ANY, i)},
+                    {"name": "Callback.on_train_batch_end", "args": (trainer, model, {"loss": ANY}, ANY, i)},
+                    {"name": "on_train_batch_end", "args": ({"loss": ANY}, ANY, i)},
+                ]
+            )
         return out
 
     @staticmethod
@@ -357,34 +360,38 @@ def _eval_batch(fn, trainer, model, batches, key, device):
         out = []
         outputs = {key: ANY}
         for i in range(batches):
-            out.extend([
-                {"name": "on_before_batch_transfer", "args": (ANY, 0)},
-                {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
-                {"name": "on_after_batch_transfer", "args": (ANY, 0)},
-                {"name": f"Callback.on_{fn}_batch_start", "args": (trainer, model, ANY, i)},
-                {"name": f"on_{fn}_batch_start", "args": (ANY, i)},
-                {"name": "forward", "args": (ANY,)},
-                {"name": f"{fn}_step", "args": (ANY, i)},
-                {"name": f"Callback.on_{fn}_batch_end", "args": (trainer, model, outputs, ANY, i)},
-                {"name": f"on_{fn}_batch_end", "args": (outputs, ANY, i)},
-            ])
+            out.extend(
+                [
+                    {"name": "on_before_batch_transfer", "args": (ANY, 0)},
+                    {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
+                    {"name": "on_after_batch_transfer", "args": (ANY, 0)},
+                    {"name": f"Callback.on_{fn}_batch_start", "args": (trainer, model, ANY, i)},
+                    {"name": f"on_{fn}_batch_start", "args": (ANY, i)},
+                    {"name": "forward", "args": (ANY,)},
+                    {"name": f"{fn}_step", "args": (ANY, i)},
+                    {"name": f"Callback.on_{fn}_batch_end", "args": (trainer, model, outputs, ANY, i)},
+                    {"name": f"on_{fn}_batch_end", "args": (outputs, ANY, i)},
+                ]
+            )
         return out
 
     @staticmethod
     def _predict_batch(trainer, model, batches, device):
         out = []
         for i in range(batches):
-            out.extend([
-                {"name": "on_before_batch_transfer", "args": (ANY, 0)},
-                {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
-                {"name": "on_after_batch_transfer", "args": (ANY, 0)},
-                {"name": "Callback.on_predict_batch_start", "args": (trainer, model, ANY, i)},
-                {"name": "on_predict_batch_start", "args": (ANY, i)},
-                {"name": "forward", "args": (ANY,)},
-                {"name": "predict_step", "args": (ANY, i)},
-                {"name": "Callback.on_predict_batch_end", "args": (trainer, model, ANY, ANY, i)},
-                {"name": "on_predict_batch_end", "args": (ANY, ANY, i)},
-            ])
+            out.extend(
+                [
+                    {"name": "on_before_batch_transfer", "args": (ANY, 0)},
+                    {"name": "transfer_batch_to_device", "args": (ANY, device, 0)},
+                    {"name": "on_after_batch_transfer", "args": (ANY, 0)},
+                    {"name": "Callback.on_predict_batch_start", "args": (trainer, model, ANY, i)},
+                    {"name": "on_predict_batch_start", "args": (ANY, i)},
+                    {"name": "forward", "args": (ANY,)},
+                    {"name": "predict_step", "args": (ANY, i)},
+                    {"name": "Callback.on_predict_batch_end", "args": (trainer, model, ANY, ANY, i)},
+                    {"name": "on_predict_batch_end", "args": (ANY, ANY, i)},
+                ]
+            )
         return out
 
     # override so that it gets called
@@ -472,11 +479,11 @@ def training_step(self, batch, batch_idx):
     expected = [
         {"name": "configure_callbacks"},
         {"name": "prepare_data"},
+        {"name": "configure_model"},
         {"name": "Callback.setup", "args": (trainer, model), "kwargs": {"stage": "fit"}},
         {"name": "setup", "kwargs": {"stage": "fit"}},
         # DeepSpeed needs the batch size to figure out throughput logging
         *([{"name": "train_dataloader"}] if using_deepspeed else []),
-        {"name": "configure_model"},
         {"name": "configure_optimizers"},
         {"name": "Callback.on_fit_start", "args": (trainer, model)},
         {"name": "on_fit_start"},
@@ -569,9 +576,9 @@ def test_trainer_model_hook_system_fit_no_val_and_resume_max_epochs(tmp_path):
     expected = [
         {"name": "configure_callbacks"},
         {"name": "prepare_data"},
+        {"name": "configure_model"},
         {"name": "Callback.setup", "args": (trainer, model), "kwargs": {"stage": "fit"}},
         {"name": "setup", "kwargs": {"stage": "fit"}},
-        {"name": "configure_model"},
         {"name": "on_load_checkpoint", "args": (loaded_ckpt,)},
         {"name": "Callback.on_load_checkpoint", "args": (trainer, model, loaded_ckpt)},
         {"name": "Callback.load_state_dict", "args": ({"foo": True},)},
@@ -647,9 +654,9 @@ def test_trainer_model_hook_system_fit_no_val_and_resume_max_steps(tmp_path):
     expected = [
         {"name": "configure_callbacks"},
         {"name": "prepare_data"},
+        {"name": "configure_model"},
         {"name": "Callback.setup", "args": (trainer, model), "kwargs": {"stage": "fit"}},
         {"name": "setup", "kwargs": {"stage": "fit"}},
-        {"name": "configure_model"},
         {"name": "on_load_checkpoint", "args": (loaded_ckpt,)},
         {"name": "Callback.on_load_checkpoint", "args": (trainer, model, loaded_ckpt)},
         {"name": "Callback.load_state_dict", "args": ({"foo": True},)},
@@ -714,9 +721,9 @@ def test_trainer_model_hook_system_eval(tmp_path, override_on_x_model_train, bat
     expected = [
         {"name": "configure_callbacks"},
         {"name": "prepare_data"},
+        {"name": "configure_model"},
         {"name": "Callback.setup", "args": (trainer, model), "kwargs": {"stage": verb}},
         {"name": "setup", "kwargs": {"stage": verb}},
-        {"name": "configure_model"},
         {"name": "zero_grad"},
         *(hooks if batches else []),
         {"name": "Callback.teardown", "args": (trainer, model), "kwargs": {"stage": verb}},
@@ -737,9 +744,9 @@ def test_trainer_model_hook_system_predict(tmp_path):
     expected = [
         {"name": "configure_callbacks"},
         {"name": "prepare_data"},
+        {"name": "configure_model"},
         {"name": "Callback.setup", "args": (trainer, model), "kwargs": {"stage": "predict"}},
         {"name": "setup", "kwargs": {"stage": "predict"}},
-        {"name": "configure_model"},
         {"name": "zero_grad"},
         {"name": "predict_dataloader"},
         {"name": "train", "args": (False,)},