try to refactor autoexposure

devshgraphicsprogramming · devshgraphicsprogramming · commit 1bf8bc2409d6 · 2021-04-10T18:42:15.000+02:00
diff --git a/examples_tests/39.DenoiserTonemapper/main.cpp b/examples_tests/39.DenoiserTonemapper/main.cpp
@@ -332,37 +332,44 @@ void nbl_glsl_ext_FFT_setData(in uvec3 coordinate, in uint channel, in nbl_glsl_
 #define _NBL_GLSL_EXT_FFT_SET_DATA_DEFINED_
 
 
+#define _NBL_GLSL_EXT_FFT_MAIN_DEFINED_
+#include "nbl/builtin/glsl/ext/FFT/default_compute_fft.comp"
 
-void main()
-{
-	const uint dataOffset = gl_GlobalInvocationID.y*pc.data.imageWidth+gl_GlobalInvocationID.x;
-	globalPixelData = vec3(inBuffer[dataOffset].x,inBuffer[dataOffset].y,inBuffer[dataOffset].z);
-
-	nbl_glsl_ext_LumaMeter(gl_GlobalInvocationID.x<pc.data.imageWidth);
-	barrier();
-}
 
 nbl_glsl_complex nbl_glsl_ext_FFT_getPaddedData(ivec3 coordinate, in uint channel) 
 {
-#if 0
-	if (!nbl_glsl_ext_FFT_wrap_coord(coordinate))
-		return nbl_glsl_complex(0.f,0.f);
-#endif
+	ivec3 oldCoord = coordinate;
+	nbl_glsl_ext_FFT_wrap_coord(coordinate);
+
 	const uint index = coordinate.y*pc.data.imageWidth+coordinate.x;
-	float data;
+
+	nbl_glsl_complex retval;
 	switch (channel)
 	{
 		case 2u:
-			data = float(inBuffer[index].z);
-			break;
+			retval.z = float(inBuffer[index].z);
 		case 1u:
-			data = float(inBuffer[index].y);
-			break;
+			retval.y = float(inBuffer[index].y);
 		default:
-			data = float(inBuffer[index].x);
-			break;
+			retval.x = float(inBuffer[index].x);
 	}
-	return nbl_glsl_complex(data,0.f);
+	return retval;
+}
+
+void main()
+{
+	#if _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN
+		nbl_glsl_ext_LumaMeter_clearHistogram();
+	#endif
+	nbl_glsl_ext_LumaMeter_clearFirstPassOutput();
+
+	//
+
+	// prevent overlap between different usages of shared memory
+	barrier();
+
+	for(uint ch=0u; ch<=nbl_glsl_ext_FFT_Parameters_t_getMaxChannel(); ++ch)
+		nbl_glsl_ext_FFT(nbl_glsl_ext_FFT_Parameters_t_getIsInverse(),ch);
 }
 		)==="));
 		auto interleaveAndLastFFTShader = driver->createGPUShader(core::make_smart_refctd_ptr<ICPUShader>(R"===(
@@ -390,9 +397,13 @@ layout(binding = 3, std430) restrict readonly buffer IntensityBuffer
 nbl_glsl_complex nbl_glsl_ext_FFT_getPaddedData(ivec3 coordinate, in uint channel);
 #define _NBL_GLSL_EXT_FFT_GET_PADDED_DATA_DEFINED_
 
+uint nbl_glsl_ext_FFT_Parameters_t_getLog2FFTSize()
+{
+    return max(findMSB(pc.data.imageWidth-1u),_NBL_GLSL_WORKGROUP_SIZE_LOG2_)+1u;
+}
 uvec3 nbl_glsl_ext_FFT_Parameters_t_getDimensions()
 {
-	return uvec3(pc.data.imageWidth,pc.data.imageHeight,1u);
+	return uvec3(0x1u<<nbl_glsl_ext_FFT_Parameters_t_getLog2FFTSize(),pc.data.imageHeight,1u);
 }
 bool nbl_glsl_ext_FFT_Parameters_t_getIsInverse()
 {
@@ -406,10 +417,6 @@ uint nbl_glsl_ext_FFT_Parameters_t_getMaxChannel()
 {
     return 2u;
 }
-uint nbl_glsl_ext_FFT_Parameters_t_getLog2FFTSize()
-{
-    return 10u;
-}
 uint nbl_glsl_ext_FFT_Parameters_t_getPaddingType()
 {
     return 3u; // _NBL_GLSL_EXT_FFT_PAD_MIRROR_;
diff --git a/include/nbl/builtin/glsl/ext/LumaMeter/common.glsl b/include/nbl/builtin/glsl/ext/LumaMeter/common.glsl
@@ -6,6 +6,7 @@
 #define _NBL_GLSL_EXT_LUMA_METER_COMMON_INCLUDED_
 
 #include <nbl/builtin/glsl/macros.glsl>
+#include <nbl/builtin/glsl/math/functions.glsl>
 
 #ifndef _NBL_GLSL_EXT_LUMA_METER_UNIFORMS_DEFINED_
 #define _NBL_GLSL_EXT_LUMA_METER_UNIFORMS_DEFINED_
@@ -201,6 +202,7 @@ layout(set=_NBL_GLSL_EXT_LUMA_METER_INPUT_IMAGE_SET_DEFINED_, binding=_NBL_GLSL_
     #if NBL_GLSL_EQUAL(_NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_,_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN)
         void nbl_glsl_ext_LumaMeter_clearHistogram()
         {
+            // TODO: redo how we clear
 	        for (int i=0; i<_NBL_GLSL_EXT_LUMA_METER_LOCAL_REPLICATION; i++)
 		        _NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex+i*_NBL_GLSL_WORKGROUP_SIZE_] = 0u;
             #if NBL_GLSL_GREATER(_NBL_GLSL_EXT_LUMA_METER_LOCAL_REPLICATION_POW_DEFINED_,0)
@@ -221,7 +223,7 @@ layout(set=_NBL_GLSL_EXT_LUMA_METER_INPUT_IMAGE_SET_DEFINED_, binding=_NBL_GLSL_
     void nbl_glsl_ext_LumaMeter_clearFirstPassOutput()
     {
         #if NBL_GLSL_EQUAL(_NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_,_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN)
-            uint globalIndex = gl_LocalInvocationIndex+gl_WorkGroupID.x*_NBL_GLSL_EXT_LUMA_METER_BIN_COUNT;
+            uint globalIndex = nbl_glsl_dot(uvec3(gl_LocalInvocationIndex,gl_WorkGroupID.xy),uvec3(1u,_NBL_GLSL_EXT_LUMA_METER_BIN_COUNT,gl_NumWorkGroups.x*_NBL_GLSL_EXT_LUMA_METER_BIN_COUNT));
             if (globalIndex<_NBL_GLSL_EXT_LUMA_METER_BIN_GLOBAL_COUNT)
             {
     		    outParams[nbl_glsl_ext_LumaMeter_getNextLumaOutputOffset()].packedHistogram[globalIndex] = 0u;
@@ -235,19 +237,19 @@ layout(set=_NBL_GLSL_EXT_LUMA_METER_INPUT_IMAGE_SET_DEFINED_, binding=_NBL_GLSL_
 
 
     #if NBL_GLSL_EQUAL(_NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_,_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN)
-        #define WriteOutValue_t uint
+        #define nbl_glsl_ext_LumaMeter_WriteOutValue_t uint
     #else
-        #define WriteOutValue_t float
+        #define nbl_glsl_ext_LumaMeter_WriteOutValue_t float
     #endif
 
     #ifndef _NBL_GLSL_EXT_LUMA_METER_SET_FIRST_OUTPUT_FUNC_DECLARED_
     #define _NBL_GLSL_EXT_LUMA_METER_SET_FIRST_OUTPUT_FUNC_DECLARED_
-    void nbl_glsl_ext_LumaMeter_setFirstPassOutput(in WriteOutValue_t writeOutVal);
+    void nbl_glsl_ext_LumaMeter_setFirstPassOutput(in nbl_glsl_ext_LumaMeter_WriteOutValue_t writeOutVal);
     #endif
 
     #ifndef _NBL_GLSL_EXT_LUMA_METER_SET_FIRST_OUTPUT_FUNC_DEFINED_
     #define _NBL_GLSL_EXT_LUMA_METER_SET_FIRST_OUTPUT_FUNC_DEFINED_
-    void nbl_glsl_ext_LumaMeter_setFirstPassOutput(in WriteOutValue_t writeOutVal)
+    void nbl_glsl_ext_LumaMeter_setFirstPassOutput(in nbl_glsl_ext_LumaMeter_WriteOutValue_t writeOutVal)
     {
         int layerIndex = nbl_glsl_ext_LumaMeter_getCurrentLumaOutputOffset();
         #if NBL_GLSL_EQUAL(_NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_,_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN)
@@ -264,8 +266,6 @@ layout(set=_NBL_GLSL_EXT_LUMA_METER_INPUT_IMAGE_SET_DEFINED_, binding=_NBL_GLSL_
         #endif
     }
     #endif
-
-    #undef WriteOutValue_t
 #endif // _NBL_GLSL_EXT_LUMA_METER_FIRST_PASS_DEFINED_
 
 
diff --git a/include/nbl/builtin/glsl/ext/LumaMeter/impl.glsl b/include/nbl/builtin/glsl/ext/LumaMeter/impl.glsl
@@ -33,20 +33,12 @@ vec3 nbl_glsl_ext_LumaMeter_getColor(bool wgExecutionMask);
 
 #ifndef _NBL_GLSL_EXT_LUMA_METER_IMPL_DECLARED_
 #define _NBL_GLSL_EXT_LUMA_METER_IMPL_DECLARED_
-void nbl_glsl_ext_LumaMeter(bool wgExecutionMask);
+void nbl_glsl_ext_LumaMeter(in bool wgExecutionMask);
 #endif
 
-#ifndef _NBL_GLSL_EXT_LUMA_METER_IMPL_DEFINED_
-#define _NBL_GLSL_EXT_LUMA_METER_IMPL_DEFINED_
-void nbl_glsl_ext_LumaMeter(bool wgExecutionMask)
+float nbl_glsl_ext_LumaMeter_local_process(in bool wgExecutionMask, in vec3 color)
 {
-	vec3 color = nbl_glsl_ext_LumaMeter_getColor(wgExecutionMask);
-	#if _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN
-		nbl_glsl_ext_LumaMeter_clearHistogram();
-	#endif
-	nbl_glsl_ext_LumaMeter_clearFirstPassOutput();
-
-	float logLuma;
+	float scaledLogLuma;
 	// linearize
 	if (wgExecutionMask)
 	{
@@ -58,36 +50,42 @@ void nbl_glsl_ext_LumaMeter(bool wgExecutionMask)
 		const float MaxLuma = intBitsToFloat(_NBL_GLSL_EXT_LUMA_METER_MAX_LUMA_DEFINED_);
 		luma = clamp(luma,MinLuma,MaxLuma);
 
-		logLuma = log2(luma/MinLuma)/log2(MaxLuma/MinLuma);
+		scaledLogLuma = log2(luma/MinLuma)/log2(MaxLuma/MinLuma);
 	}
 
 	#if _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN
 		// compute histogram index
 		int histogramIndex;
 		if (wgExecutionMask)
 		{
-			histogramIndex = int(logLuma*float(_NBL_GLSL_EXT_LUMA_METER_BIN_COUNT-1u)+0.5);
+			histogramIndex = int(scaledLogLuma *float(_NBL_GLSL_EXT_LUMA_METER_BIN_COUNT-1u)+0.5);
 			histogramIndex += int(gl_LocalInvocationIndex&uint(_NBL_GLSL_EXT_LUMA_METER_LOCAL_REPLICATION-1))*_NBL_GLSL_EXT_LUMA_METER_PADDED_BIN_COUNT;
 		}
 		// barrier so we "see" the cleared histogram
 		barrier();
-		memoryBarrierShared();
 		if (wgExecutionMask)
 			atomicAdd(_NBL_GLSL_SCRATCH_SHARED_DEFINED_[histogramIndex],1u);
-
-		// no barrier on shared memory cause if we use it with atomics the writes and reads be coherent
+		// no barrier on shared memory because we read from it later and we need all atomics to be done before we read
 		barrier();
+	#endif
 
+	return scaledLogLuma;
+}
+
+nbl_glsl_ext_LumaMeter_WriteOutValue_t nbl_glsl_ext_LumaMeter_workgroup_process(in bool wgExecutionMask, in float scaledLogLuma)
+{
+	#if _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN
 		// join the histograms across workgroups
 		uint writeOutVal = _NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex];
 		for (int i=1; i<_NBL_GLSL_EXT_LUMA_METER_LOCAL_REPLICATION; i++)
 			writeOutVal += _NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex+i*_NBL_GLSL_EXT_LUMA_METER_PADDED_BIN_COUNT];
+		return writeOutVal;
 	#elif _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_GEOM_MEAN
-		_NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex] = wgExecutionMask ? floatBitsToUint(logLuma):0u;
+		// TODO: use nbl_glsl_workgroupAdd reduction
+		_NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex] = wgExecutionMask ? floatBitsToUint(scaledLogLuma):0u;
 		for (int i=NBL_GLSL_WORKGROUP_SIZE_>>1; i>1; i>>=1)
 		{
 			barrier();
-			memoryBarrierShared();
 			if (gl_LocalInvocationIndex<i)
 			{
 				_NBL_GLSL_SCRATCH_SHARED_DEFINED_[gl_LocalInvocationIndex] = floatBitsToUint
@@ -98,9 +96,22 @@ void nbl_glsl_ext_LumaMeter(bool wgExecutionMask)
 			}
 		}
 		barrier();
-		memoryBarrierShared();
-		float writeOutVal = uintBitsToFloat(_NBL_GLSL_SCRATCH_SHARED_DEFINED_[0])+uintBitsToFloat(_NBL_GLSL_SCRATCH_SHARED_DEFINED_[1]);
+		return uintBitsToFloat(_NBL_GLSL_SCRATCH_SHARED_DEFINED_[0])+uintBitsToFloat(_NBL_GLSL_SCRATCH_SHARED_DEFINED_[1]);
+	#endif
+}
+
+#ifndef _NBL_GLSL_EXT_LUMA_METER_IMPL_DEFINED_
+#define _NBL_GLSL_EXT_LUMA_METER_IMPL_DEFINED_
+void nbl_glsl_ext_LumaMeter(in bool wgExecutionMask)
+{
+	vec3 color = nbl_glsl_ext_LumaMeter_getColor(wgExecutionMask);
+	#if _NBL_GLSL_EXT_LUMA_METER_MODE_DEFINED_==_NBL_GLSL_EXT_LUMA_METER_MODE_MEDIAN
+		nbl_glsl_ext_LumaMeter_clearHistogram();
 	#endif
+	nbl_glsl_ext_LumaMeter_clearFirstPassOutput();
+
+	const float scaledLogLuma = nbl_glsl_ext_LumaMeter_local_process(wgExecutionMask,color);
+	const nbl_glsl_ext_LumaMeter_WriteOutValue_t writeOutVal = nbl_glsl_ext_LumaMeter_workgroup_process(wgExecutionMask,scaledLogLuma);
 
 	nbl_glsl_ext_LumaMeter_setFirstPassOutput(writeOutVal);
 }