per target (#210)

lazarusA · web-flow · commit f5be653c00c8 · 2025-12-19T14:42:38.000+01:00
* per target

* rename file

* rename lossfn to compute_loss

* fix name include

* r f

* orga split

* tests PerTarget
diff --git a/docs/src/tutorials/losses.md b/docs/src/tutorials/losses.md
@@ -2,11 +2,11 @@
 
 ```@example loss
 using EasyHybrid
-using EasyHybrid: compute_loss
+using EasyHybrid: _compute_loss
 ```
 
 ````@docs; canonical=false
-EasyHybrid.compute_loss
+EasyHybrid._compute_loss
 ````
 
 ::: warning
@@ -21,12 +21,12 @@ EasyHybrid.compute_loss
 - Prefer `f(ŷ_masked, y_masked)` for custom losses; `y_masked` may be a vector or `(y, σ)`.
 - Use `Val(:metric)` only for predefined `loss_fn` variants.
 - Quick calls:
-    - `compute_loss(..., :mse, sum)`: predefined
-    - `compute_loss(..., custom_loss, sum)` : custom loss
-    - `compute_loss(..., (f, (arg1, arg2, )), sum)`: additional arguments 
-    - `compute_loss(..., (f, (kw=val,)), sum)`: with keyword arguments
-    - `compute_loss(..., (f, (arg1, ), (kw=val,)), sum)`: with additional arguments and keyword arguments
-    - `compute_loss(..., (y, y_sigma), ..., custom_loss_uncertainty, sum)`: with uncertainties
+    - `_compute_loss(..., :mse, sum)`: predefined
+    - `_compute_loss(..., custom_loss, sum)` : custom loss
+    - `_compute_loss(..., (f, (arg1, arg2, )), sum)`: additional arguments 
+    - `_compute_loss(..., (f, (kw=val,)), sum)`: with keyword arguments
+    - `_compute_loss(..., (f, (arg1, ), (kw=val,)), sum)`: with additional arguments and keyword arguments
+    - `_compute_loss(..., (y, y_sigma), ..., custom_loss_uncertainty, sum)`: with uncertainties
 
 :::
 
@@ -44,8 +44,8 @@ targets = [:t1, :t2]
 ```
 
 ```@ansi loss
-mse_total = compute_loss(ŷ, y, y_nan, targets, :mse, sum) # total MSE across targets
-losses = compute_loss(ŷ, y, y_nan, targets, [:mse, :mae], sum) # multiple metrics in a NamedTuple
+mse_total = _compute_loss(ŷ, y, y_nan, targets, :mse, sum) # total MSE across targets
+losses = _compute_loss(ŷ, y, y_nan, targets, [:mse, :mae], sum) # multiple metrics in a NamedTuple
 ```
 
 ### Custom functions, args, kwargs
@@ -63,10 +63,10 @@ nothing # hide
 Use variants:
 
 ```@ansi loss
-compute_loss(ŷ, y, y_nan, targets, custom_loss, sum)
-compute_loss(ŷ, y, y_nan, targets, (weighted_loss, (0.5,)), sum)
-compute_loss(ŷ, y, y_nan, targets, (scaled_loss, (scale=2.0,)), sum)
-compute_loss(ŷ, y, y_nan, targets, (complex_loss, (0.5,), (scale=2.0,)), sum)
+_compute_loss(ŷ, y, y_nan, targets, custom_loss, sum)
+_compute_loss(ŷ, y, y_nan, targets, (weighted_loss, (0.5,)), sum)
+_compute_loss(ŷ, y, y_nan, targets, (scaled_loss, (scale=2.0,)), sum)
+_compute_loss(ŷ, y, y_nan, targets, (complex_loss, (0.5,), (scale=2.0,)), sum)
 ```
 
 ### Uncertainty-aware losses
@@ -90,13 +90,13 @@ Top-level usage (both `y` and `y_sigma` can be functions or containers):
 
 ```julia
 y_sigma(t) = t == :t1 ? [0.1, 0.2] : [0.2, 0.1]
-loss = compute_loss(ŷ, (y, y_sigma), y_nan, targets,
+loss = _compute_loss(ŷ, (y, y_sigma), y_nan, targets,
     custom_loss_uncertainty, sum)
 ```
 
 ::: info Behavior
 
-- `compute_loss` packs per-target `(y_vals_target, σ_target)` tuples and forwards them to `loss_fn`.
+- `_compute_loss` packs per-target `(y_vals_target, σ_target)` tuples and forwards them to `loss_fn`.
 - Predefined metrics use only `y_vals` when a `(y, σ)` tuple is supplied. (TODO)
 
 :::
diff --git a/projects/RbQ10/Q10.jl b/projects/RbQ10/Q10.jl
@@ -87,14 +87,14 @@ out_pinball = train(
 );
 
 ## legacy
-# ? test lossfn
+# ? test compute_loss
 ps, st = LuxCore.setup(Random.default_rng(), RbQ10)
 # the Tuple `ds_p, ds_t` is later used for batching in the `dataloader`.
 ds_p_f, ds_t = EasyHybrid.prepare_data(RbQ10, ds_keyed)
 ds_t_nan = .!isnan.(ds_t)
-ls = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
+ls = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
 
-ls_logs = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
+ls_logs = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
 
 # ? play with :Temp as predictors in NN, temperature sensitivity!
 # TODO: variance effect due to LSTM vs NN
diff --git a/projects/RbQ10/Q10_dd.jl b/projects/RbQ10/Q10_dd.jl
@@ -30,7 +30,7 @@ using Zygote
 ps, st = LuxCore.setup(Random.default_rng(), RbQ10)
 
 l, backtrace = Zygote.pullback(
-    (ps) -> EasyHybrid.lossfn(
+    (ps) -> EasyHybrid.compute_loss(
         RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st,
         EasyHybrid.LoggingLoss(training_loss = :mse, agg = sum)
     ), ps
@@ -60,24 +60,24 @@ targets = RbQ10.targets
 # EasyHybrid.get_predictions_targets(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, targets)
 # ŷ, st_ = RbQ10(ds_p_f, ps, st)
 
-# EasyHybrid.compute_loss(ŷ, ds_t, ds_t_nan, targets, :mse, sum)
+# EasyHybrid._compute_loss(ŷ, ds_t, ds_t_nan, targets, :mse, sum)
 
-# ls = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
+# ls = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
 
 
 ## ! DimensionalData + ChainRulesCore
-# ? test lossfn
+# ? test compute_loss
 # ps, st = LuxCore.setup(Random.default_rng(), RbQ10)
 
-ls = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
-ls_logs = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
+ls = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss())
+ls_logs = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
 acc_ = EasyHybrid.evaluate_acc(RbQ10, ds_p_f, ds_t, ds_t_nan, ps, st, [:mse, :r2], :mse, sum)
 
 using Zygote, ChainRulesCore, DimensionalData
 using EasyHybrid
 
 l, backtrace = Zygote.pullback(
-    (ps) -> EasyHybrid.lossfn(
+    (ps) -> EasyHybrid.compute_loss(
         RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st,
         EasyHybrid.LoggingLoss(training_loss = :mse, agg = sum)
     ), ps
diff --git a/projects/RbQ10/Q10_lbfgs.jl b/projects/RbQ10/Q10_lbfgs.jl
@@ -47,9 +47,9 @@ end
 # the Tuple `ds_p, ds_t` is later used for batching in the `dataloader`.
 ds_p_f, ds_t = EasyHybrid.prepare_data(RbQ10, ds_keyed)
 ds_t_nan = .!isnan.(ds_t)
-ls = EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
+ls = EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), ps, st, LoggingLoss(train_mode = false))
 
-ls2 = (p, data) -> EasyHybrid.lossfn(RbQ10, ds_p_f, (ds_t, ds_t_nan), p, st, LoggingLoss())[1]
+ls2 = (p, data) -> EasyHybrid.compute_loss(RbQ10, ds_p_f, (ds_t, ds_t_nan), p, st, LoggingLoss())[1]
 
 dta = (ds_p_f, ds_t, ds_t_nan)
 
diff --git a/projects/RbQ10/synthetic_example_bookchapter.jl b/projects/RbQ10/synthetic_example_bookchapter.jl
@@ -65,7 +65,7 @@ dta = (ds_p_f, ds_t, ds_t_nan)
 dataloader = DataLoader((x_train, y_train, nan_train), batchsize = 512, shuffle = true);
 
 # wrap loss function to get arguments as required by Optimization.jl
-ls2 = (p, data) -> EasyHybrid.lossfn(RbQ10, data[1], (data[2], data[3]), p, st, LoggingLoss())[1]
+ls2 = (p, data) -> EasyHybrid.compute_loss(RbQ10, data[1], (data[2], data[3]), p, st, LoggingLoss())[1]
 
 # convert to Float64 for optimization
 ps_ca = ComponentArray(ps) .|> Float64
diff --git a/src/EasyHybrid.jl b/src/EasyHybrid.jl
@@ -50,8 +50,9 @@ include("utils/tools.jl")
 include("models/models.jl")
 include("utils/show_generic.jl")
 include("utils/synthetic_test_data.jl")
-include("utils/logging_loss.jl")
-include("utils/show_logging.jl")
+include("utils/compute_loss_types.jl")
+include("utils/show_loss_types.jl")
+include("utils/compute_loss.jl")
 include("utils/loss_fn.jl")
 include("plotrecipes.jl")
 include("train.jl")
diff --git a/src/train.jl b/src/train.jl
@@ -200,7 +200,7 @@ function train(
     @info "Check the saved output (.png, .mp4, .jld2) from training at: $(tmp_folder)"
 
     prog = Progress(nepochs, desc = "Training loss", enabled = show_progress)
-    loss(hybridModel, ps, st, (x, y)) = lossfn(
+    loss(hybridModel, ps, st, (x, y)) = compute_loss(
         hybridModel, ps, st, (x, y);
         logging = LoggingLoss(train_mode = true, loss_types = loss_types, training_loss = training_loss, extra_loss = extra_loss, agg = agg)
     )
@@ -366,7 +366,7 @@ function train(
 end
 
 function evaluate_acc(ghm, x, y, y_no_nan, ps, st, loss_types, training_loss, extra_loss, agg)
-    loss_val, sts, ŷ = lossfn(ghm, ps, st, (x, (y, y_no_nan)), logging = LoggingLoss(train_mode = false, loss_types = loss_types, training_loss = training_loss, extra_loss = extra_loss, agg = agg))
+    loss_val, sts, ŷ = compute_loss(ghm, ps, st, (x, (y, y_no_nan)), logging = LoggingLoss(train_mode = false, loss_types = loss_types, training_loss = training_loss, extra_loss = extra_loss, agg = agg))
     return loss_val, sts, ŷ
 end
 function maybe_record_history(block, should_record, fig, output_path; framerate = 24)
diff --git a/src/utils/compute_loss.jl b/src/utils/compute_loss.jl
@@ -0,0 +1,181 @@
+"""
+    compute_loss(HM, x, (y_t, y_nan), ps, st, logging::LoggingLoss)
+
+Main loss function for hybrid models that handles both training and evaluation modes.
+
+# Arguments
+- `HM`: The hybrid model (AbstractLuxContainerLayer or specific model type)
+- `x`: Input data for the model
+- `(y_t, y_nan)`: Tuple containing target values and NaN mask functions/arrays
+- `ps`: Model parameters
+- `st`: Model state
+- `logging`: LoggingLoss configuration
+
+# Returns
+- In training mode (`logging.train_mode = true`):
+  - `(loss_value, st)`: Single loss value and updated state
+- In evaluation mode (`logging.train_mode = false`):
+  - `(loss_values, st, ŷ)`: NamedTuple of losses, state and predictions
+"""
+function compute_loss(
+        HM::LuxCore.AbstractLuxContainerLayer, ps, st, (x, (y_t, y_nan));
+        logging::LoggingLoss
+    )
+
+    targets = HM.targets
+    ext_loss = extra_loss(logging)
+    if logging.train_mode
+        ŷ, st = HM(x, ps, st)
+        loss_value = _compute_loss(ŷ, y_t, y_nan, targets, training_loss(logging), logging.agg)
+        # Add extra_loss if provided
+        if ext_loss !== nothing
+            extra_loss_value = ext_loss(ŷ)
+            loss_value = logging.agg([loss_value, extra_loss_value...])
+        end
+        stats = NamedTuple()
+    else
+        ŷ, _ = HM(x, ps, LuxCore.testmode(st))
+        loss_value = _compute_loss(ŷ, y_t, y_nan, targets, loss_types(logging), logging.agg)
+        # Add extra_loss entries if provided
+        if ext_loss !== nothing
+            extra_loss_values = ext_loss(ŷ)
+            agg_extra_loss_value = logging.agg(extra_loss_values)
+            loss_value = (; loss_value..., extra_loss = (; extra_loss_values..., Symbol(logging.agg) => agg_extra_loss_value))
+        end
+        stats = (; ŷ...)
+    end
+    return loss_value, st, stats
+end
+
+function _compute_loss(ŷ, y, y_nan, targets, loss_spec, agg::Function)
+    losses = assemble_loss(ŷ, y, y_nan, targets, loss_spec)
+    return agg(losses)
+end
+
+function _compute_loss(ŷ, y, y_nan, targets, loss_types::Vector, agg::Function)
+    out_loss_types = [
+        begin
+                losses = assemble_loss(ŷ, y, y_nan, targets, loss_type)
+                agg_loss = agg(losses)
+                NamedTuple{(targets..., Symbol(agg))}([losses..., agg_loss])
+            end
+            for loss_type in loss_types
+    ]
+    _names = [_loss_name(lt) for lt in loss_types]
+    return NamedTuple{Tuple(_names)}([out_loss_types...])
+end
+
+"""
+    _compute_loss(ŷ, y, y_nan, targets, loss_spec, agg::Function)
+    _compute_loss(ŷ, y, y_nan, targets, loss_types::Vector, agg::Function)
+
+Compute the loss for the given predictions and targets using the specified training loss (or vector of losses) type and aggregation function.
+
+# Arguments:
+- `ŷ`: Predicted values.
+- `y`: Target values.
+- `y_nan`: Mask for NaN values.
+- `targets`: The targets for which the loss is computed.
+- `loss_spec`: The loss type to use during training, e.g., `:mse`.
+- `loss_types::Vector`: A vector of loss types to compute, e.g., `[:mse, :mae]`.
+- `agg::Function`: The aggregation function to apply to the computed losses, e.g., `sum` or `mean`.
+
+Returns a single loss value if `loss_spec` is provided, or a NamedTuple of losses for each type in `loss_types`.
+"""
+function _compute_loss end
+
+function assemble_loss(ŷ, y, y_nan, targets, loss_spec)
+    return [
+        _apply_loss(ŷ[target], _get_target_y(y, target), _get_target_nan(y_nan, target), loss_spec)
+            for target in targets
+    ]
+end
+
+function assemble_loss(ŷ, y, y_nan, targets, loss_spec::PerTarget)
+    @assert length(targets) == length(loss_spec.losses) "Length of targets and PerTarget losses tuple must match"
+    losses = [
+        _apply_loss(
+                ŷ,
+                _get_target_y(y, target),
+                _get_target_nan(y_nan, target),
+                target,
+                loss_t
+            ) for (target, loss_t) in zip(targets, loss_spec.losses)
+    ]
+    return losses
+end
+
+function _apply_loss(ŷ, y, y_nan, loss_spec::Symbol)
+    return loss_fn(ŷ, y, y_nan, Val(loss_spec))
+end
+
+function _apply_loss(ŷ, y, y_nan, loss_spec::Function)
+    return loss_fn(ŷ, y, y_nan, loss_spec)
+end
+
+function _apply_loss(ŷ, y, y_nan, loss_spec::Tuple)
+    return loss_fn(ŷ, y, y_nan, loss_spec)
+end
+function _apply_loss(ŷ, y, y_nan, target, loss_spec)
+    return _apply_loss(ŷ[target], y, y_nan, loss_spec)
+end
+
+"""
+    _apply_loss(ŷ, y, y_nan, loss_spec)
+
+Helper function to apply the appropriate loss function based on the specification type.
+
+# Arguments
+- `ŷ`: Predictions for a single target
+- `y`: Target values for a single target
+- `y_nan`: NaN mask for a single target
+- `loss_spec`: Loss specification (Symbol, Function, or Tuple)
+
+# Returns
+- Computed loss value
+"""
+function _apply_loss end
+
+_get_target_y(y, target) = y(target)
+_get_target_y(y::AbstractDimArray, target) = y[col = At(target)] # assumes the DimArray uses :col indexing
+_get_target_y(y::AbstractDimArray, targets::Vector) = y[col = At(targets)] # for multiple targets
+
+function _get_target_y(y::Tuple, target)
+    y_obs, y_sigma = y
+    sigma = y_sigma isa Number ? y_sigma : y_sigma(target)
+    y_obs_val = _get_target_y(y_obs, target)
+    return (y_obs_val, sigma)
+end
+
+
+"""
+    _get_target_y(y, target)
+Helper function to extract target-specific values from `y`, handling cases where `y` can be a tuple of `(y_obs, y_sigma)`.
+"""
+function _get_target_y end
+
+_get_target_nan(y_nan, target) = y_nan(target)
+_get_target_nan(y_nan::AbstractDimArray, target) = y_nan[col = At(target)] # assumes the DimArray uses :col indexing
+_get_target_nan(y_nan::AbstractDimArray, targets::Vector) = y_nan[col = At(targets)] # for multiple targets
+
+"""
+    _get_target_nan(y_nan, target)
+
+Helper function to extract target-specific values from `y_nan`.
+"""
+function _get_target_nan end
+
+# Helper to generate meaningful names for loss types
+function _loss_name(loss_spec::Symbol)
+    return loss_spec
+end
+
+function _loss_name(loss_spec::Function)
+    raw_name = nameof(typeof(loss_spec))
+    clean_name = Symbol(replace(string(raw_name), "#" => ""))
+    return clean_name
+end
+
+function _loss_name(loss_spec::Tuple)
+    return _loss_name(loss_spec[1])
+end
diff --git a/src/utils/compute_loss_types.jl b/src/utils/compute_loss_types.jl
diff --git a/src/utils/logging_loss.jl b/src/utils/logging_loss.jl
diff --git a/src/utils/show_loss_types.jl b/src/utils/show_loss_types.jl
diff --git a/test/test_compute_loss.jl b/test/test_compute_loss.jl