core\refac: #98 missing hps

blotero · blotero · commit b12345c67e1a · 2025-07-28T06:49:13.000-05:00
- missing hps for features and pixel experiments
diff --git a/core/pyproject.toml b/core/pyproject.toml
@@ -1,7 +1,7 @@
 [project]
 description = "Framework for handling image segmentation in the context of multiple annotators"
 name = "seg_tgce"
-version = "0.3.7"
+version = "0.3.9"
 readme = "README.md"
 authors = [{ name = "Brandon Lotero", email = "blotero@gmail.com" }]
 maintainers = [{ name = "Brandon Lotero", email = "blotero@gmail.com" }]
@@ -15,7 +15,7 @@ Issues = "https://github.com/blotero/seg_tgce/issues"
 
 [tool.poetry]
 name = "seg_tgce"
-version = "0.3.7"
+version = "0.3.9"
 authors = ["Brandon Lotero <blotero@gmail.com>"]
 description = "A package for the SEG TGCE project"
 readme = "README.md"
diff --git a/core/seg_tgce/experiments/pets/features.py b/core/seg_tgce/experiments/pets/features.py
@@ -1,11 +1,15 @@
-import keras_tuner as kt
-import tensorflow as tf
+import argparse
+
+from keras import Model
+from keras.callbacks import EarlyStopping, ReduceLROnPlateau
 
 from seg_tgce.data.oxford_pet.oxford_pet import (
     fetch_models,
     get_data_multiple_annotators,
 )
 from seg_tgce.experiments.plot_utils import plot_training_history, print_test_metrics
+from seg_tgce.experiments.types import HpTunerTrial
+from seg_tgce.experiments.utils import handle_training_optuna
 from seg_tgce.models.builders import build_features_model_from_hparams
 from seg_tgce.models.ma_model import FeatureVisualizationCallback
 
@@ -16,39 +20,68 @@
 NUM_SCORERS = len(NOISE_LEVELS)
 TRAIN_EPOCHS = 50
 TUNER_EPOCHS = 1
-TUNER_TRIALS = 1
+TUNER_MAX_TRIALS = 1
+STUDY_NAME = "pets_features_tuning"
+OBJECTIVE = "val_segmentation_output_dice_coefficient"
 
+DEFAULT_HPARAMS = {
+    "initial_learning_rate": 1e-3,
+    "q": 0.7,
+    "noise_tolerance": 0.5,
+    "a": 0.2,
+    "b": 0.7,
+    "c": 1.0,
+    "lambda_reg_weight": 0.1,
+    "lambda_entropy_weight": 0.1,
+    "lambda_sum_weight": 0.1,
+}
 
-def build_model(hp: kt.HyperParameters) -> tf.keras.Model:
-    learning_rate = hp.Float(
-        "learning_rate", min_value=1e-5, max_value=1e-2, sampling="LOG"
-    )
-    q = hp.Float("q", min_value=0.1, max_value=0.9, step=0.1)
-    noise_tolerance = hp.Float("noise_tolerance", min_value=0.1, max_value=0.9, step=0.1)
-    lambda_reg_weight = hp.Float(
-        "lambda_reg_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
-    lambda_entropy_weight = hp.Float(
-        "lambda_entropy_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
-    lambda_sum_weight = hp.Float(
-        "lambda_sum_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
+
+def build_model_from_trial(trial: HpTunerTrial | None) -> Model:
+    if trial is None:
+        return build_features_model_from_hparams(
+            learning_rate=DEFAULT_HPARAMS["initial_learning_rate"],
+            q=DEFAULT_HPARAMS["q"],
+            noise_tolerance=DEFAULT_HPARAMS["noise_tolerance"],
+            b=DEFAULT_HPARAMS["b"],
+            c=DEFAULT_HPARAMS["c"],
+            a=DEFAULT_HPARAMS["a"],
+            lambda_reg_weight=DEFAULT_HPARAMS["lambda_reg_weight"],
+            lambda_entropy_weight=DEFAULT_HPARAMS["lambda_entropy_weight"],
+            lambda_sum_weight=DEFAULT_HPARAMS["lambda_sum_weight"],
+            num_classes=NUM_CLASSES,
+            target_shape=TARGET_SHAPE,
+            n_scorers=NUM_SCORERS,
+        )
 
     return build_features_model_from_hparams(
-        learning_rate=learning_rate,
-        q=q,
-        noise_tolerance=noise_tolerance,
-        lambda_reg_weight=lambda_reg_weight,
-        lambda_entropy_weight=lambda_entropy_weight,
-        lambda_sum_weight=lambda_sum_weight,
+        learning_rate=trial.suggest_float("learning_rate", 1e-5, 1e-2, log=True),
+        q=trial.suggest_float("q", 0.1, 0.9, step=0.01),
+        noise_tolerance=trial.suggest_float("noise_tolerance", 0.1, 0.9, step=0.01),
+        b=trial.suggest_float("b", 0.1, 1.0, step=0.01),
+        a=trial.suggest_float("a", 0.1, 1.0, step=0.01),
+        c=trial.suggest_float("c", 0.1, 10.0, step=0.1),
+        lambda_reg_weight=trial.suggest_float("lambda_reg_weight", 0.0, 10.0, step=0.1),
+        lambda_entropy_weight=trial.suggest_float(
+            "lambda_entropy_weight", 0.0, 10.0, step=0.1
+        ),
+        lambda_sum_weight=trial.suggest_float("lambda_sum_weight", 0.0, 10.0, step=0.1),
         num_classes=NUM_CLASSES,
         target_shape=TARGET_SHAPE,
         n_scorers=NUM_SCORERS,
     )
 
 
 if __name__ == "__main__":
+    parser = argparse.ArgumentParser(
+        description="Train pets features model with or without hyperparameter tuning"
+    )
+    parser.add_argument(
+        "--use-tuner",
+        action="store_true",
+        help="Use Keras Tuner for hyperparameter optimization",
+    )
+    args = parser.parse_args()
     disturbance_models = fetch_models(NOISE_LEVELS)
     train, val, test = get_data_multiple_annotators(
         annotation_models=disturbance_models,
@@ -57,37 +90,43 @@ def build_model(hp: kt.HyperParameters) -> tf.keras.Model:
         labeling_rate=1.0,
     )
 
-    tuner = kt.BayesianOptimization(
-        build_model,
-        objective=kt.Objective(
-            "val_segmentation_output_dice_coefficient", direction="max"
-        ),
-        max_trials=TUNER_TRIALS,
-        directory="tuner_results",
-        project_name="features_tuning",
+    model = handle_training_optuna(
+        train.take(10).cache(),
+        val.take(10).cache(),
+        model_builder=build_model_from_trial,
+        use_tuner=args.use_tuner,
+        tuner_epochs=TUNER_EPOCHS,
+        objective=OBJECTIVE,
+        tuner_max_trials=TUNER_MAX_TRIALS,
+        study_name=STUDY_NAME,
     )
 
-    print("Starting hyperparameter search...")
-    tuner.search(
-        train.take(16).cache(),
-        epochs=TUNER_EPOCHS,
-        validation_data=val.take(8).cache(),
-    )
-
-    best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]
-    print("\nBest hyperparameters:")
-    for param, value in best_hps.values.items():
-        print(f"{param}: {value}")
+    vis_callback = FeatureVisualizationCallback(val, save_dir="vis/pets/features")
 
-    model = build_model(best_hps)
-    vis_callback = FeatureVisualizationCallback(val)
+    lr_scheduler = ReduceLROnPlateau(
+        monitor=OBJECTIVE,
+        factor=0.5,
+        patience=3,
+        min_lr=1e-6,
+        mode="max",
+        verbose=1,
+    )
 
     print("\nTraining with best hyperparameters...")
     history = model.fit(
         train.take(16).cache(),
         epochs=TRAIN_EPOCHS,
         validation_data=val.take(8).cache(),
-        callbacks=[vis_callback],
+        callbacks=[
+            vis_callback,
+            lr_scheduler,
+            EarlyStopping(
+                monitor=OBJECTIVE,
+                patience=5,
+                mode="max",
+                restore_best_weights=True,
+            ),
+        ],
     )
 
     plot_training_history(history, "Features Model Training History")
diff --git a/core/seg_tgce/experiments/pets/pixel.py b/core/seg_tgce/experiments/pets/pixel.py
@@ -1,11 +1,15 @@
-import keras_tuner as kt
-import tensorflow as tf
+import argparse
+
+from keras import Model
+from keras.callbacks import EarlyStopping, ReduceLROnPlateau
 
 from seg_tgce.data.oxford_pet.oxford_pet import (
     fetch_models,
     get_data_multiple_annotators,
 )
 from seg_tgce.experiments.plot_utils import plot_training_history, print_test_metrics
+from seg_tgce.experiments.types import HpTunerTrial
+from seg_tgce.experiments.utils import handle_training_optuna
 from seg_tgce.models.builders import build_pixel_model_from_hparams
 from seg_tgce.models.ma_model import PixelVisualizationCallback
 
@@ -16,80 +20,116 @@
 NUM_SCORERS = len(NOISE_LEVELS)
 TRAIN_EPOCHS = 50
 TUNER_EPOCHS = 1
-TUNER_TRIALS = 1
+TUNER_MAX_TRIALS = 1
+STUDY_NAME = "pets_pixel_tuning"
+OBJECTIVE = "val_segmentation_output_dice_coefficient"
+LABELING_RATE = 1.0
 
+DEFAULT_HPARAMS = {
+    "initial_learning_rate": 1e-3,
+    "q": 0.7,
+    "noise_tolerance": 0.5,
+    "a": 0.2,
+    "b": 0.7,
+    "c": 1.0,
+    "lambda_reg_weight": 0.1,
+    "lambda_entropy_weight": 0.1,
+    "lambda_sum_weight": 0.1,
+}
 
-def build_model(hp: kt.HyperParameters) -> tf.keras.Model:
-    learning_rate = hp.Float(
-        "learning_rate", min_value=1e-5, max_value=1e-2, sampling="LOG"
-    )
-    q = hp.Float("q", min_value=0.1, max_value=0.9, step=0.1)
-    noise_tolerance = hp.Float("noise_tolerance", min_value=0.1, max_value=0.9, step=0.1)
-    lambda_reg_weight = hp.Float(
-        "lambda_reg_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
-    lambda_entropy_weight = hp.Float(
-        "lambda_entropy_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
-    lambda_sum_weight = hp.Float(
-        "lambda_sum_weight", min_value=0.01, max_value=0.5, step=0.01
-    )
+
+def build_model_from_trial(trial: HpTunerTrial | None) -> Model:
+    if trial is None:
+        return build_pixel_model_from_hparams(
+            learning_rate=DEFAULT_HPARAMS["initial_learning_rate"],
+            q=DEFAULT_HPARAMS["q"],
+            noise_tolerance=DEFAULT_HPARAMS["noise_tolerance"],
+            b=DEFAULT_HPARAMS["b"],
+            c=DEFAULT_HPARAMS["c"],
+            a=DEFAULT_HPARAMS["a"],
+            lambda_reg_weight=DEFAULT_HPARAMS["lambda_reg_weight"],
+            lambda_entropy_weight=DEFAULT_HPARAMS["lambda_entropy_weight"],
+            lambda_sum_weight=DEFAULT_HPARAMS["lambda_sum_weight"],
+            num_classes=NUM_CLASSES,
+            target_shape=TARGET_SHAPE,
+            n_scorers=NUM_SCORERS,
+        )
 
     return build_pixel_model_from_hparams(
-        learning_rate=learning_rate,
-        q=q,
-        noise_tolerance=noise_tolerance,
-        lambda_reg_weight=lambda_reg_weight,
-        lambda_entropy_weight=lambda_entropy_weight,
-        lambda_sum_weight=lambda_sum_weight,
+        learning_rate=trial.suggest_float("learning_rate", 1e-5, 1e-2, log=True),
+        q=trial.suggest_float("q", 0.1, 0.9, step=0.01),
+        noise_tolerance=trial.suggest_float("noise_tolerance", 0.1, 0.9, step=0.01),
+        b=trial.suggest_float("b", 0.1, 1.0, step=0.01),
+        a=trial.suggest_float("a", 0.1, 1.0, step=0.01),
+        c=trial.suggest_float("c", 0.1, 10.0, step=0.1),
+        lambda_reg_weight=trial.suggest_float("lambda_reg_weight", 0.0, 10.0, step=0.1),
+        lambda_entropy_weight=trial.suggest_float(
+            "lambda_entropy_weight", 0.0, 10.0, step=0.1
+        ),
+        lambda_sum_weight=trial.suggest_float("lambda_sum_weight", 0.0, 10.0, step=0.1),
         num_classes=NUM_CLASSES,
         target_shape=TARGET_SHAPE,
         n_scorers=NUM_SCORERS,
     )
 
 
 if __name__ == "__main__":
+    parser = argparse.ArgumentParser(
+        description="Train pets pixel model with or without hyperparameter tuning"
+    )
+    parser.add_argument(
+        "--use-tuner",
+        action="store_true",
+        help="Use Keras Tuner for hyperparameter optimization",
+    )
+    args = parser.parse_args()
+
     disturbance_models = fetch_models(NOISE_LEVELS)
     train, val, test = get_data_multiple_annotators(
         annotation_models=disturbance_models,
         target_shape=TARGET_SHAPE,
         batch_size=BATCH_SIZE,
-        labeling_rate=0.5,
+        labeling_rate=LABELING_RATE,
     )
 
-    tuner = kt.BayesianOptimization(
-        build_model,
-        objective=kt.Objective(
-            "val_segmentation_output_dice_coefficient", direction="max"
-        ),
-        max_trials=TUNER_TRIALS,
-        directory="tuner_results",
-        project_name="pixel_tuning",
+    model = handle_training_optuna(
+        train.take(10).cache(),
+        val.take(10).cache(),
+        model_builder=build_model_from_trial,
+        use_tuner=args.use_tuner,
+        tuner_epochs=TUNER_EPOCHS,
+        objective=OBJECTIVE,
+        tuner_max_trials=TUNER_MAX_TRIALS,
+        study_name=STUDY_NAME,
     )
 
-    print("Starting hyperparameter search...")
-    tuner.search(
-        train.take(16).cache(),
-        epochs=TUNER_EPOCHS,
-        validation_data=val.take(8).cache(),
-    )
+    vis_callback = PixelVisualizationCallback(val, save_dir="vis/pets/pixel")
 
-    best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]
-    print("\nBest hyperparameters:")
-    for param, value in best_hps.values.items():
-        print(f"{param}: {value}")
-
-    model = build_model(best_hps)
-    vis_callback = PixelVisualizationCallback(val)
+    lr_scheduler = ReduceLROnPlateau(
+        monitor=OBJECTIVE,
+        factor=0.5,
+        patience=3,
+        min_lr=1e-6,
+        mode="max",
+        verbose=1,
+    )
 
-    print("\nTraining with best hyperparameters...")
+    print("\nTraining final model...")
     history = model.fit(
-        train.take(16).cache(),
+        train,
         epochs=TRAIN_EPOCHS,
-        validation_data=val.take(8).cache(),
-        callbacks=[vis_callback],
+        validation_data=val.cache(),
+        callbacks=[
+            vis_callback,
+            lr_scheduler,
+            EarlyStopping(
+                monitor=OBJECTIVE,
+                patience=5,
+                mode="max",
+                restore_best_weights=True,
+            ),
+        ],
     )
 
-    plot_training_history(history, "Pixel Model Training History")
-
-    print_test_metrics(model, test, "Pixel")
+    plot_training_history(history, "Pets Pixel Model Training History")
+    print_test_metrics(model, test, "Pets Pixel")
diff --git a/core/seg_tgce/experiments/pets/scalar.py b/core/seg_tgce/experiments/pets/scalar.py
@@ -13,7 +13,7 @@
 from seg_tgce.models.builders import build_scalar_model_from_hparams
 from seg_tgce.models.ma_model import ScalarVisualizationCallback
 
-TARGET_SHAPE = (128, 128)
+TARGET_SHAPE = (256, 256)
 BATCH_SIZE = 16
 NUM_CLASSES = 3
 NOISE_LEVELS = [-20.0, 10.0]
@@ -24,6 +24,7 @@
 TUNER_MAX_TRIALS = 3
 STUDY_NAME = "pets_scalar_tuning"
 OBJECTIVE = "val_segmentation_output_dice_coefficient"
+
 DEFAULT_HPARAMS = {
     "initial_learning_rate": 1e-3,
     "q": 0.7,
diff --git a/core/seg_tgce/loss/tgce.py b/core/seg_tgce/loss/tgce.py
diff --git a/core/seg_tgce/models/builders.py b/core/seg_tgce/models/builders.py