Improved & fixed highlights DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU mode

jenshannoschwalm · TurboGit · commit b4f1a626a67a · 2025-04-21T09:12:13.000+02:00
If we are in passthru mode we should not clip/modify any data and use the fastest way to do so.
As the module roi_in/out handling is somewhat tricky due to it's raw/non-raw support we do this
by using clip mode (with a non-clipping value).

While doing this the OpenCl code needed some care.
diff --git a/data/kernels/basic.cl b/data/kernels/basic.cl
@@ -273,18 +273,26 @@ highlights_4f_clip (read_only image2d_t in, write_only image2d_t out, const int
 }
 
 kernel void
-highlights_1f_clip (read_only image2d_t in, write_only image2d_t out, const int width, const int height,
-                    global float *clips, const int rx, const int ry, const int filters, global const unsigned char (*const xtrans)[6])
+highlights_1f_clip (read_only image2d_t in, write_only image2d_t out,
+                    const int iwidth, const int iheight,
+                    const int owidth, const int oheight,
+                    global float *clips, const int dx, const int dy,
+                    const int filters, global const unsigned char (*const xtrans)[6])
 {
   const int x = get_global_id(0);
   const int y = get_global_id(1);
 
-  if(x >= width || y >= height) return;
-  const int color = (filters == 9u) ? FCxtrans(y, x, xtrans) : FC(y, x, filters);
-
-  float pixel = read_imagef(in, sampleri, (int2)(x, y)).x;
+  if(x >= owidth || y >= oheight) return;
 
-  pixel = fmin(clips[color], pixel);
+  const int irow = y + dy;
+  const int icol = x + dx;
+  float pixel = 0.0f;
+  if((icol >= 0) && (irow >= 0) && (irow < iheight) && (icol < iwidth))
+  {
+    const int color = (filters == 9u) ? FCxtrans(irow, icol, xtrans) : FC(irow, icol, filters);
+    pixel = read_imagef(in, sampleri, (int2)(icol, irow)).x;
+    pixel = fmin(clips[color], pixel);
+  }
   write_imagef (out, (int2)(x, y), pixel);
 }
 
diff --git a/src/iop/highlights.c b/src/iop/highlights.c
@@ -534,29 +534,33 @@ int process_cl(dt_iop_module_t *self,
                const dt_iop_roi_t *const roi_in,
                const dt_iop_roi_t *const roi_out)
 {
+  dt_dev_pixelpipe_t *pipe = piece->pipe;
   dt_iop_highlights_data_t *d = piece->data;
   dt_iop_highlights_gui_data_t *g = self->gui_data;
   dt_iop_highlights_global_data_t *gd = self->global_data;
 
-  const uint32_t filters = piece->pipe->dsc.filters;
-  const int devid = piece->pipe->devid;
+  const uint32_t filters = pipe->dsc.filters;
+  const int devid = pipe->devid;
 
-  const gboolean fullpipe = piece->pipe->type & DT_DEV_PIXELPIPE_FULL;
-  gboolean announce = dt_iop_piece_is_raster_mask_used(piece, BLEND_RASTER_ID);
+  const gboolean fullpipe = pipe->type & DT_DEV_PIXELPIPE_FULL;
+  const gboolean passthru = pipe->mask_display == DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
+  const dt_iop_highlights_mode_t dmode = passthru && fullpipe ? DT_IOP_HIGHLIGHTS_CLIP : d->mode;
+
+  gboolean announce = passthru ? FALSE : dt_iop_piece_is_raster_mask_used(piece, BLEND_RASTER_ID);
 
   cl_int err = DT_OPENCL_DEFAULT_ERROR;
   cl_mem dev_xtrans = NULL;
   cl_mem dev_clips = NULL;
 
-  if(g && fullpipe)
+  if(g && fullpipe && !passthru)
   {
     if(g->hlr_mask_mode != DT_HIGHLIGHTS_MASK_OFF)
     {
-      piece->pipe->mask_display = DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
+      pipe->mask_display = DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
       if(g->hlr_mask_mode == DT_HIGHLIGHTS_MASK_CLIPPED)
       {
         const float mclip = d->clip * highlights_clip_magics[d->mode];
-        const float *c = piece->pipe->dsc.temperature.coeffs;
+        const float *c = pipe->dsc.temperature.coeffs;
         float clips[4] = { mclip * (c[RED]   <= 0.0f ? 1.0f : c[RED]),
                            mclip * (c[GREEN] <= 0.0f ? 1.0f : c[GREEN]),
                            mclip * (c[BLUE]  <= 0.0f ? 1.0f : c[BLUE]),
@@ -565,7 +569,7 @@ int process_cl(dt_iop_module_t *self,
         dev_clips = dt_opencl_copy_host_to_device_constant(devid, 4 * sizeof(float), clips);
         if(dev_clips == NULL) goto finish;
 
-        dev_xtrans = dt_opencl_copy_host_to_device_constant(devid, sizeof(piece->pipe->dsc.xtrans), piece->pipe->dsc.xtrans);
+        dev_xtrans = dt_opencl_copy_host_to_device_constant(devid, sizeof(pipe->dsc.xtrans), pipe->dsc.xtrans);
         if(dev_xtrans == NULL) goto finish;
 
         err = dt_opencl_enqueue_kernel_2d_args(devid, gd->kernel_highlights_false_color, roi_out->width, roi_out->height,
@@ -581,21 +585,21 @@ int process_cl(dt_iop_module_t *self,
     }
   }
 
-  const float clip = d->clip * dt_iop_get_processed_minimum(piece);
+  const float clip = passthru ? FLT_MAX : (d->clip * dt_iop_get_processed_minimum(piece));
 
   if(!filters)
   {
     // non-raw images use dedicated kernel which just clips
     err = dt_opencl_enqueue_kernel_2d_args(devid, gd->kernel_highlights_4f_clip, roi_in->width, roi_in->height,
       CLARG(dev_in), CLARG(dev_out),
       CLARG(roi_in->width), CLARG(roi_in->height),
-      CLARG(d->mode), CLARG(clip));
+      CLARG(dmode), CLARG(clip));
   }
-  else if(d->mode == DT_IOP_HIGHLIGHTS_OPPOSED)
+  else if(dmode == DT_IOP_HIGHLIGHTS_OPPOSED)
   {
     err = process_opposed_cl(self, piece, dev_in, dev_out, roi_in, roi_out);
   }
-  else if(d->mode == DT_IOP_HIGHLIGHTS_LCH && filters != 9u)
+  else if(dmode == DT_IOP_HIGHLIGHTS_LCH && filters != 9u)
   {
     // bayer sensor raws with LCH mode
     err = dt_opencl_enqueue_kernel_2d_args(devid, gd->kernel_highlights_1f_lch_bayer, roi_in->width, roi_in->height,
@@ -604,7 +608,7 @@ int process_cl(dt_iop_module_t *self,
       CLARG(clip), CLARG(roi_out->x), CLARG(roi_out->y),
       CLARG(filters));
   }
-  else if(d->mode == DT_IOP_HIGHLIGHTS_LCH && filters == 9u)
+  else if(dmode == DT_IOP_HIGHLIGHTS_LCH && filters == 9u)
   {
     // xtrans sensor raws with LCH mode
     int blocksizex, blocksizey;
@@ -622,8 +626,7 @@ int process_cl(dt_iop_module_t *self,
     else
       blocksizex = blocksizey = 1;
 
-    dev_xtrans
-        = dt_opencl_copy_host_to_device_constant(devid, sizeof(piece->pipe->dsc.xtrans), piece->pipe->dsc.xtrans);
+    dev_xtrans = dt_opencl_copy_host_to_device_constant(devid, sizeof(pipe->dsc.xtrans), pipe->dsc.xtrans);
     if(dev_xtrans == NULL) goto finish;
 
     size_t sizes[] = { ROUNDUP(roi_in->width, blocksizex), ROUNDUP(roi_in->height, blocksizey), 1 };
@@ -636,15 +639,15 @@ int process_cl(dt_iop_module_t *self,
       CLLOCAL(sizeof(float) * (blocksizex + 4) * (blocksizey + 4)));
     err = dt_opencl_enqueue_kernel_2d_with_local(devid, gd->kernel_highlights_1f_lch_xtrans, sizes, local);
   }
-  else if(d->mode == DT_IOP_HIGHLIGHTS_LAPLACIAN)
+  else if(dmode == DT_IOP_HIGHLIGHTS_LAPLACIAN)
   {
     const float clipper = d->clip * highlights_clip_magics[DT_IOP_HIGHLIGHTS_LAPLACIAN];
-    const dt_aligned_pixel_t clips = { clipper * piece->pipe->dsc.processed_maximum[0],
-                                       clipper * piece->pipe->dsc.processed_maximum[1],
-                                       clipper * piece->pipe->dsc.processed_maximum[2], clip };
+    const dt_aligned_pixel_t clips = { clipper * pipe->dsc.processed_maximum[0],
+                                       clipper * pipe->dsc.processed_maximum[1],
+                                       clipper * pipe->dsc.processed_maximum[2], clip };
     err = process_laplacian_bayer_cl(self, piece, dev_in, dev_out, roi_in, roi_out, clips);
   }
-  else // (d->mode == DT_IOP_HIGHLIGHTS_CLIP)
+  else // (dmode == DT_IOP_HIGHLIGHTS_CLIP)
   {
     const dt_dev_chroma_t *chr = &self->dev->chroma;
     dt_aligned_pixel_t clips = { clip, clip, clip, clip};
@@ -654,16 +657,21 @@ int process_cl(dt_iop_module_t *self,
     dev_clips = dt_opencl_copy_host_to_device_constant(devid, 4 * sizeof(float), clips);
     if(dev_clips == NULL) goto finish;
 
-    dev_xtrans = dt_opencl_copy_host_to_device_constant(devid, sizeof(piece->pipe->dsc.xtrans), piece->pipe->dsc.xtrans);
+    dev_xtrans = dt_opencl_copy_host_to_device_constant(devid, sizeof(pipe->dsc.xtrans), pipe->dsc.xtrans);
     if(dev_xtrans == NULL) goto finish;
+
     // raw images with clip mode (both bayer and xtrans)
-    err = dt_opencl_enqueue_kernel_2d_args(devid, gd->kernel_highlights_1f_clip, roi_in->width, roi_in->height,
+    const int dy = roi_out->y - roi_in->y;
+    const int dx = roi_out->x - roi_in->x;
+    err = dt_opencl_enqueue_kernel_2d_args(devid, gd->kernel_highlights_1f_clip, roi_out->width, roi_out->height,
       CLARG(dev_in), CLARG(dev_out),
       CLARG(roi_in->width), CLARG(roi_in->height),
-      CLARG(dev_clips), CLARG(roi_out->x), CLARG(roi_out->y),
+      CLARG(roi_out->width), CLARG(roi_out->height),
+      CLARG(dev_clips), CLARG(dx), CLARG(dy),
       CLARG(filters), CLARG(dev_xtrans));
   }
   if(err != CL_SUCCESS) goto finish;
+  if(passthru) goto finish;
 
   float *mask = NULL;
   if(announce)
@@ -686,7 +694,7 @@ int process_cl(dt_iop_module_t *self,
     // The guided laplacian and opposed are the modes that keeps signal scene-referred and don't clip highlights to 1
     // For the other modes, we need to notify the pipeline that white point has changed
     const float m = dt_iop_get_processed_maximum(piece);
-    for_three_channels(k) piece->pipe->dsc.processed_maximum[k] = m;
+    for_three_channels(k) pipe->dsc.processed_maximum[k] = m;
   }
 
   finish:
@@ -813,32 +821,37 @@ void process(dt_iop_module_t *self,
              const dt_iop_roi_t *const roi_in,
              const dt_iop_roi_t *const roi_out)
 {
-  const uint32_t filters = piece->pipe->dsc.filters;
+  dt_dev_pixelpipe_t *pipe = piece->pipe;
+  const uint32_t filters = pipe->dsc.filters;
   dt_iop_highlights_data_t *d = piece->data;
   dt_iop_highlights_gui_data_t *g = self->gui_data;
 
-  const gboolean fullpipe = piece->pipe->type & DT_DEV_PIXELPIPE_FULL;
-  const gboolean fastmode = piece->pipe->type & DT_DEV_PIXELPIPE_FAST;
-  const gboolean scaled = filters == 0 && d->mode != DT_IOP_HIGHLIGHTS_CLIP;
+  const gboolean fullpipe = pipe->type & DT_DEV_PIXELPIPE_FULL;
+  const gboolean fastmode = pipe->type & DT_DEV_PIXELPIPE_FAST;
+
+  const gboolean passthru = pipe->mask_display == DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
+  dt_iop_highlights_mode_t dmode = passthru ? DT_IOP_HIGHLIGHTS_CLIP : d->mode;
+
+  const gboolean scaled = filters == 0 && dmode != DT_IOP_HIGHLIGHTS_CLIP;
 
   float *out = scaled ? dt_alloc_align_float((size_t)roi_in->width * roi_in->height * 4) : NULL;
-  const gboolean announce = dt_iop_piece_is_raster_mask_used(piece, BLEND_RASTER_ID);
+  const gboolean announce = passthru ? FALSE : dt_iop_piece_is_raster_mask_used(piece, BLEND_RASTER_ID);
 
   if(!out && scaled)
   {
     dt_iop_clip_and_zoom_roi((float *)ovoid, (float *)ivoid, roi_out, roi_in);
     dt_print_pipe(DT_DEBUG_ALWAYS,
-          "bypass highlights", piece->pipe, self, DT_DEVICE_CPU, roi_in, roi_out,
+          "bypass highlights", pipe, self, DT_DEVICE_CPU, roi_in, roi_out,
           "can't allocate temp buffer");
     dt_iop_piece_clear_raster(piece, NULL);
     return;
   }
 
-  if(g && fullpipe)
+  if(g && fullpipe && !passthru)
   {
     if(g->hlr_mask_mode != DT_HIGHLIGHTS_MASK_OFF)
     {
-      piece->pipe->mask_display = DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
+      pipe->mask_display = DT_DEV_PIXELPIPE_DISPLAY_PASSTHRU;
       if(g->hlr_mask_mode == DT_HIGHLIGHTS_MASK_CLIPPED)
       {
         if(scaled)
@@ -858,24 +871,27 @@ void process(dt_iop_module_t *self,
 
   /* While rendering thumnbnails we look for an acceptable lower quality */
   gboolean high_quality = TRUE;
-  if(piece->pipe->type & DT_DEV_PIXELPIPE_THUMBNAIL)
+  if(pipe->type & DT_DEV_PIXELPIPE_THUMBNAIL)
   {
-    const dt_mipmap_size_t level = dt_mipmap_cache_get_matching_size(piece->pipe->final_width, piece->pipe->final_height);
+    const dt_mipmap_size_t level = dt_mipmap_cache_get_matching_size(pipe->final_width, pipe->final_height);
     const char *min = dt_conf_get_string_const("plugins/lighttable/thumbnail_hq_min_level");
     const dt_mipmap_size_t min_s = dt_mipmap_cache_get_min_mip_from_pref(min);
     high_quality = (level >= min_s);
   }
 
-  const float clip = d->clip * dt_iop_get_processed_minimum(piece);
+  const float clip = passthru ? FLT_MAX : d->clip * dt_iop_get_processed_minimum(piece);
 
   if(filters == 0)
   {
-    if(d->mode == DT_IOP_HIGHLIGHTS_CLIP)
+    if(dmode == DT_IOP_HIGHLIGHTS_CLIP)
     {
       process_clip(self, piece, ivoid, ovoid, roi_in, roi_out, clip);
-      const float m = dt_iop_get_processed_minimum(piece);
-      for_three_channels(k)
-        piece->pipe->dsc.processed_maximum[k] = m;
+      if(!passthru)
+      {
+        const float m = dt_iop_get_processed_minimum(piece);
+        for_three_channels(k)
+          pipe->dsc.processed_maximum[k] = m;
+      }
     }
     else
     {
@@ -884,27 +900,28 @@ void process(dt_iop_module_t *self,
       dt_free_align(out);
     }
 
+    if(passthru) return;
+
     float *mask = announce ? _provide_raster_mask(roi_in, roi_out, (float *)ovoid, d->clip, piece) : NULL;
     if(mask)  dt_iop_piece_set_raster(piece, mask, roi_in, roi_out);
     else      dt_iop_piece_clear_raster(piece, NULL);
 
     return;
   }
 
-  const dt_iop_highlights_mode_t dmode = fastmode && (d->mode == DT_IOP_HIGHLIGHTS_SEGMENTS)
-                                          ? DT_IOP_HIGHLIGHTS_OPPOSED : d->mode;
+  dmode = fastmode && (dmode == DT_IOP_HIGHLIGHTS_SEGMENTS) ? DT_IOP_HIGHLIGHTS_OPPOSED : dmode;
   switch(dmode)
   {
     case DT_IOP_HIGHLIGHTS_INPAINT: // a1ex's (magiclantern) idea of color inpainting:
     {
       const float clipper = d->clip * highlights_clip_magics[DT_IOP_HIGHLIGHTS_INPAINT];
-      const float clips[4] = { clipper * piece->pipe->dsc.processed_maximum[0],
-                               clipper * piece->pipe->dsc.processed_maximum[1],
-                               clipper * piece->pipe->dsc.processed_maximum[2], clip };
+      const float clips[4] = { clipper * pipe->dsc.processed_maximum[0],
+                               clipper * pipe->dsc.processed_maximum[1],
+                               clipper * pipe->dsc.processed_maximum[2], clip };
 
       if(filters == 9u)
       {
-        const uint8_t(*const xtrans)[6] = (const uint8_t(*const)[6])piece->pipe->dsc.xtrans;
+        const uint8_t(*const xtrans)[6] = (const uint8_t(*const)[6])pipe->dsc.xtrans;
         DT_OMP_FOR()
         for(int j = 0; j < roi_out->height; j++)
         {
@@ -967,9 +984,9 @@ void process(dt_iop_module_t *self,
     case DT_IOP_HIGHLIGHTS_LAPLACIAN:
     {
       const float clipper = d->clip * highlights_clip_magics[DT_IOP_HIGHLIGHTS_LAPLACIAN];
-      const dt_aligned_pixel_t clips = { clipper * piece->pipe->dsc.processed_maximum[0],
-                                         clipper * piece->pipe->dsc.processed_maximum[1],
-                                         clipper * piece->pipe->dsc.processed_maximum[2], clip };
+      const dt_aligned_pixel_t clips = { clipper * pipe->dsc.processed_maximum[0],
+                                         clipper * pipe->dsc.processed_maximum[1],
+                                         clipper * pipe->dsc.processed_maximum[2], clip };
       process_laplacian_bayer(self, piece, ivoid, ovoid, roi_in, roi_out, clips);
       break;
     }
@@ -981,17 +998,19 @@ void process(dt_iop_module_t *self,
     }
   }
 
+  if(passthru) return;
+
   float *mask = announce ? _provide_raster_mask(roi_in, roi_out, (float *)ovoid, d->clip, piece) : NULL;
   if(mask)  dt_iop_piece_set_raster(piece, mask, roi_in, roi_out);
   else      dt_iop_piece_clear_raster(piece, NULL);
 
   // update processed maximum
-  if((d->mode != DT_IOP_HIGHLIGHTS_LAPLACIAN) && (d->mode != DT_IOP_HIGHLIGHTS_SEGMENTS) && (d->mode != DT_IOP_HIGHLIGHTS_OPPOSED))
+  if((dmode != DT_IOP_HIGHLIGHTS_LAPLACIAN) && (dmode != DT_IOP_HIGHLIGHTS_SEGMENTS) && (dmode != DT_IOP_HIGHLIGHTS_OPPOSED) && !passthru)
   {
     // The guided laplacian, inpaint opposed and segmentation modes keep signal scene-referred and don't clip highlights to 1
     // For the other modes, we need to notify the pipeline that white point has changed
     const float m = dt_iop_get_processed_maximum(piece);
-    for_three_channels(k) piece->pipe->dsc.processed_maximum[k] = m;
+    for_three_channels(k) pipe->dsc.processed_maximum[k] = m;
   }
 }