Merge pull request #94 from vadmbertr/diff-op

vadmbertr · web-flow · commit f88b00541292 · 2025-12-01T09:21:15.000+01:00
Simplify mask handling in diff operators
diff --git a/jaxparrow/geostrophy.py b/jaxparrow/geostrophy.py
@@ -61,7 +61,7 @@ def geostrophy(
     coriolis_factor_t = geometry.compute_coriolis_factor(lat_t)
 
     # Handle spurious and masked data
-    ssh_t = sanitize.sanitize_data(ssh_t, 0, is_land)
+    ssh_t = sanitize.sanitize_data(ssh_t, jnp.nan, is_land)
 
     u_geos_u, v_geos_v = _geostrophy(ssh_t, dx_t, dy_t, coriolis_factor_t, is_land)
 
diff --git a/jaxparrow/utils/operators.py b/jaxparrow/utils/operators.py
@@ -4,8 +4,6 @@
 import jax.numpy as jnp
 from jaxtyping import Array, Float
 
-from .sanitize import handle_land_boundary
-
 
 def interpolation(
         field: Float[Array, "lat lon"],
@@ -40,44 +38,34 @@ def interpolation(
     field : Float[Array, "lat lon"]
         Interpolated field
     """
-    def do_interpolate(field_b, field_f, mask_b, mask_f, pad_left):
-        field_b, field_f = handle_land_boundary(field_b, field_f, mask_b, mask_f, pad_left)
-        return 0.5 * (field_b + field_f)
-
-    def axis0(pad_left):
-        field_b, field_f = field[:-1, :], field[1:, :]
-        mask_b, mask_f = mask[:-1, :], mask[1:, :]
-        midpoint_values = do_interpolate(field_b, field_f, mask_b, mask_f, pad_left)
-
-        arr = lax.cond(
-            pad_left,
-            lambda: jnp.pad(midpoint_values, pad_width=((1, 0), (0, 0)), mode="edge"),
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 1), (0, 0)), mode="edge")
-        )
-
-        return arr
-
-    def axis1(pad_left):
-        field_b, field_f = field[:, :-1], field[:, 1:]
-        mask_b, mask_f = mask[:, :-1], mask[:, 1:]
-        midpoint_values = do_interpolate(field_b, field_f, mask_b, mask_f, pad_left)
-
-        arr = lax.cond(
-            pad_left,
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 0), (1, 0)), mode="edge"),
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 0), (0, 1)), mode="edge")
-        )
-
-        return arr
-
-    field = lax.cond(
-        axis == 0,
-        lambda pad_left: axis0(pad_left),
-        lambda pad_left: axis1(pad_left),
-        padding == "left"
+    f = jnp.moveaxis(field, axis, -1)
+
+    mid = (f[:, :-1] + f[:, 1:]) * 0.5
+    
+    # handle mask: extrapolate at land boundaries (up to 1 cell)
+    mid = jnp.where(
+        jnp.isnan(mid),
+        f[:, :-1],
+        mid
+    )
+    mid = jnp.where(
+        jnp.isnan(mid),
+        f[:, 1:],
+        mid
+    )
+
+    # extrapolate at the domain boundary
+    mid = lax.cond(
+        padding == "left",
+        lambda: jnp.concatenate([f[:, :1], mid], axis=-1),
+        lambda: jnp.concatenate([mid, f[:, -1:]], axis=-1)
     )
 
-    return field
+    mid = jnp.moveaxis(mid, -1, axis)
+
+    mid = jnp.where(mask, jnp.nan, mid)
+
+    return mid
 
 
 def derivative(
@@ -116,41 +104,31 @@ def derivative(
     field : Float[Array, "lat lon"]
         Interpolated field
     """
-    def do_differentiate(field_b, field_f, mask_b, mask_f, pad_left):
-        field_b, field_f = handle_land_boundary(field_b, field_f, mask_b, mask_f, pad_left)
-        return field_f - field_b
-
-    def axis0(pad_left):
-        field_b, field_f = field[:-1, :], field[1:, :]
-        mask_b, mask_f = mask[:-1, :], mask[1:, :]
-        midpoint_values = do_differentiate(field_b, field_f, mask_b, mask_f, pad_left)
-
-        arr = lax.cond(
-            pad_left,
-            lambda: jnp.pad(midpoint_values, pad_width=((1, 0), (0, 0)), mode="edge"),
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 1), (0, 0)), mode="edge")
-        )
-
-        return arr
-
-    def axis1(pad_left):
-        field_b, field_f = field[:, :-1], field[:, 1:]
-        mask_b, mask_f = mask[:, :-1], mask[:, 1:]
-        midpoint_values = do_differentiate(field_b, field_f, mask_b, mask_f, pad_left)
-
-        arr = lax.cond(
-            pad_left,
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 0), (1, 0)), mode="edge"),
-            lambda: jnp.pad(midpoint_values, pad_width=((0, 0), (0, 1)), mode="edge")
-        )
-
-        return arr
-
-    field = lax.cond(
-        axis == 0,
-        lambda pad_left: axis0(pad_left),
-        lambda pad_left: axis1(pad_left),
-        padding == "left"
+    f = jnp.moveaxis(field, axis, -1)
+
+    mid = jnp.diff(f, axis=-1)
+    
+    # handle mask: extrapolate at land boundaries (up to 1 cell)
+    mid = jnp.where(
+        jnp.isnan(mid),
+        jnp.pad(mid[:, 1:], pad_width=((0, 0), (0, 1)), mode="edge"),
+        mid
     )
+    mid = jnp.where(
+        jnp.isnan(mid),
+        jnp.pad(mid[:, :-1], pad_width=((0, 0), (1, 0)), mode="edge"),
+        mid
+    )
+
+    # extrapolate at the domain boundary
+    mid = lax.cond(
+        padding == "left",
+        lambda: jnp.pad(mid, pad_width=((0, 0), (1, 0)), mode="edge"),
+        lambda: jnp.pad(mid, pad_width=((0, 0), (0, 1)), mode="edge" )
+    )
+
+    mid = jnp.moveaxis(mid, -1, axis)
+
+    mid = jnp.where(mask, jnp.nan, mid)
 
-    return field / dxy
+    return mid / dxy
diff --git a/jaxparrow/utils/sanitize.py b/jaxparrow/utils/sanitize.py
@@ -1,8 +1,6 @@
 from jax import lax
 import jax.numpy as jnp
 from jaxtyping import Array, Float
-import numpy as np
-from scipy import interpolate
 
 
 def sanitize_data(
@@ -57,106 +55,3 @@ def init_land_mask(
     if mask is None:
         mask = ~jnp.isfinite(field)
     return mask
-
-
-def handle_land_boundary(
-        field1: Float[Array, "lat lon"],
-        field2: Float[Array, "lat lon"],
-        mask1: Float[Array, "lat lon"],
-        mask2: Float[Array, "lat lon"],
-        pad_left: bool
-) -> [Float[Array, "lat lon"], Float[Array, "lat lon"]]:
-    """
-    Replaces the masked values of ``field1`` (``field2``) with values of ``field2`` (``field1``), element-wise.
-
-    It allows computing more coherent values when applying grid operators.
-    In such cases, ``field1`` and ``field2`` are left and right shifted versions of a field (along one of the axes).
-
-    Parameters
-    ----------
-    field1 : Float[Array, "lat lon"]
-        A field
-    field2 : Float[Array, "lat lon"]
-        Another field
-    mask1 : Float[Array, "lat lon"]
-        A mask defining the marine area of ``field1`` spatial domain; `1` or `True` stands for masked (i.e. land)
-    mask2 : Float[Array, "lat lon"]
-        A mask defining the marine area of ``field2`` spatial domain; `1` or `True` stands for masked (i.e. land)
-    pad_left : bool
-        If `True`, apply padding in the `left` direction (i.e. `West` or `South`) ;
-        if `False`, apply padding in the `right` direction (i.e. `East` or `North`).
-
-    Returns
-    -------
-    field1 : Float[Array, "lat lon"]
-        A field whose masked values have been replaced with the ones from ``field2``
-    field2 : Float[Array, "lat lon"]
-        A field whose masked values have been replaced with the ones from ``field1``
-    """
-    field1, field2 = lax.cond(
-        pad_left,
-        lambda: (jnp.where(mask1, field2, field1), field2),
-        lambda: (field1, jnp.where(mask2, field1, field2))
-    )
-    return field1, field2
-
-
-def sanitize_grid_np(
-        lat: Float[Array, "lat lon"],
-        lon: Float[Array, "lat lon"],
-        mask: Float[Array, "lat lon"] = None
-) -> [Float[Array, "lat lon"], Float[Array, "lat lon"]]:
-    """
-    Sanitizes (unstructured) grids by interpolated and extrapolated `nan` or masked values to avoid spurious
-    (`0`, `nan`, `inf`) spatial steps and Coriolis factors.
-
-    Helper function written using pure ``numpy`` and ``scipy``, and as such not used internally,
-    because incompatible with ``jax.vmap`` and likes.
-    Should be used before calling ``jaxparrow.geostrophy`` or ``jaxparrow.cyclogeostrophy``
-    in case of suspicious latitudes or longitudes T grids.
-
-    Caution: because it uses ``scipy.interpolate.RBFInterpolator``,
-    it's memory usage grows quadratically with the number of grid points.
-
-    Parameters
-    ----------
-    lat : Float[Array, "lat lon"]
-        Grid latitudes
-    lon : Float[Array, "lat lon"]
-        Grid longitudes
-    mask :  Float[Array, "lat lon"], optional
-        Mask to apply, `1` or `True` for masked, defaults to `None`
-
-    Returns
-    -------
-    lat : Float[Array, "lat lon"]
-        Grid latitudes
-    lon : Float[Array, "lat lon"]
-        Grid longitudes
-    """
-    def fill_nan(arr: Float[Array, "lat lon"]) -> Float[Array, "lat lon"]:
-        x = np.arange(0, arr.shape[1])
-        y = np.arange(0, arr.shape[0])
-        # mask invalid values
-        arr = np.ma.masked_invalid(arr)
-        xx, yy = np.meshgrid(x, y)
-        # get only the valid values
-        valid_x = xx[~arr.mask]
-        valid_y = yy[~arr.mask]
-        valid_arr = arr[~arr.mask]
-        rbf = interpolate.RBFInterpolator(np.array([valid_x, valid_y]).T, valid_arr)
-        # get the invalid ones
-        invalid_x = xx[arr.mask]
-        invalid_y = yy[arr.mask]
-        invalid_arr = rbf(np.array([invalid_x, invalid_y]).T)
-        # fill
-        arr[arr.mask] = invalid_arr
-        return arr.data
-
-    # make sure nan are used behind masked pixels (and not 0)
-    lat = sanitize_data(lat, jnp.nan, mask)
-    lon = sanitize_data(lon, jnp.nan, mask)
-    # fill nan using RBF interpolation
-    lat = fill_nan(lat)
-    lon = fill_nan(lon)
-    return lat, lon