move some more stuff to push constants

devshgraphicsprogramming · devshgraphicsprogramming · commit 24386d79904c · 2021-03-26T12:38:37.000+01:00
diff --git a/examples_tests/49.ComputeFFT/extra_parameters.glsl b/examples_tests/49.ComputeFFT/extra_parameters.glsl
@@ -7,4 +7,10 @@ struct convolve_parameters_t
 {
     nbl_glsl_ext_FFT_Parameters_t fft;
     vec2    kernel_half_pixel_size;
+};
+
+struct image_store_parameters_t
+{
+    nbl_glsl_ext_FFT_Parameters_t fft;
+    ivec2   unpad_offset;
 };
diff --git a/examples_tests/49.ComputeFFT/fft_convolve_ifft.comp b/examples_tests/49.ComputeFFT/fft_convolve_ifft.comp
@@ -4,7 +4,7 @@ layout(local_size_x=_NBL_GLSL_WORKGROUP_SIZE_, local_size_y=1, local_size_z=1) i
 
 layout(set=0, binding=2) uniform sampler2D NormalizedKernel[3];
 
-#include "convolve_parameters.glsl"
+#include "extra_parameters.glsl"
 layout(push_constant) uniform PushConstants
 {
 	convolve_parameters_t params;
diff --git a/examples_tests/49.ComputeFFT/last_fft.comp b/examples_tests/49.ComputeFFT/last_fft.comp
@@ -4,12 +4,25 @@ layout(local_size_x=_NBL_GLSL_WORKGROUP_SIZE_, local_size_y=1, local_size_z=1) i
 layout(set=0, binding=1, rgba16f) uniform image2D outImage;
 #define _NBL_GLSL_EXT_FFT_OUTPUT_DESCRIPTOR_DEFINED_
 
+
+#include "extra_parameters.glsl"
+layout(push_constant) uniform PushConstants
+{
+	image_store_parameters_t params;
+} pc;
+#define _NBL_GLSL_EXT_FFT_PUSH_CONSTANTS_DEFINED_
+
+nbl_glsl_ext_FFT_Parameters_t nbl_glsl_ext_FFT_getParameters()
+{
+	return pc.params.fft;
+}
+#define _NBL_GLSL_EXT_FFT_GET_PARAMETERS_DEFINED_
+
+
 #include <nbl/builtin/glsl/math/complex.glsl>
 void nbl_glsl_ext_FFT_setData(in uvec3 coordinate, in uint channel, in nbl_glsl_complex complex_value)
 {
-// TODO PC
-    const ivec2 padding = imageSize(outImage).x!=512u ? ivec2(384,0):ivec2(0);
-	const ivec2 coords = ivec2(coordinate.xy)-padding;
+	const ivec2 coords = ivec2(coordinate.xy)-pc.params.unpad_offset;
 
     if (all(lessThanEqual(ivec2(0),coords)) && all(greaterThan(imageSize(outImage),coords)))
     {
diff --git a/examples_tests/49.ComputeFFT/main.cpp b/examples_tests/49.ComputeFFT/main.cpp
@@ -114,36 +114,6 @@ inline void updateDescriptorSet_Convolution (
 
 	driver->updateDescriptorSets(descCount, pWrites, 0u, nullptr);
 }
-
-static inline core::smart_refctd_ptr<video::IGPUPipelineLayout> getPipelineLayout_LastFFT(video::IVideoDriver* driver)
-{
-	static IGPUDescriptorSetLayout::SBinding bnd[] =
-	{
-		{
-			0u,
-			EDT_STORAGE_BUFFER,
-			1u,
-			ISpecializedShader::ESS_COMPUTE,
-			nullptr
-		},
-		{
-			1u,
-			EDT_STORAGE_IMAGE,
-			1u,
-			ISpecializedShader::ESS_COMPUTE,
-			nullptr
-		},
-	};
-
-	using FFTClass = ext::FFT::FFT;
-	core::SRange<const asset::SPushConstantRange> pcRange = FFTClass::getDefaultPushConstantRanges();
-	core::SRange<const video::IGPUDescriptorSetLayout::SBinding> bindings = {bnd, bnd+sizeof(bnd)/sizeof(IGPUDescriptorSetLayout::SBinding)};;
-
-	return driver->createGPUPipelineLayout(
-		pcRange.begin(),pcRange.end(),
-		driver->createGPUDescriptorSetLayout(bindings.begin(),bindings.end()),nullptr,nullptr,nullptr
-	);
-}
 inline void updateDescriptorSet_LastFFT (
 	video::IVideoDriver * driver,
 	video::IGPUDescriptorSet * set,
@@ -183,10 +153,13 @@ inline void updateDescriptorSet_LastFFT (
 using nbl_glsl_ext_FFT_Parameters_t = ext::FFT::FFT::Parameters_t;
 struct vec2
 {
-	float x;
-	float y;
+	float x,y;
 };
-#include "convolve_parameters.glsl"
+struct ivec2
+{
+	int32_t x,y;
+};
+#include "extra_parameters.glsl"
 
 
 int main()
@@ -359,10 +332,38 @@ int main()
 			driver->createGPUDescriptorSetLayout(bindings.begin(),bindings.end()),nullptr,nullptr,nullptr
 		);
 	}();
+	auto lastFFTPipelineLayout = [driver]() -> auto
+	{
+		IGPUDescriptorSetLayout::SBinding bnd[] =
+		{
+			{
+				0u,
+				EDT_STORAGE_BUFFER,
+				1u,
+				ISpecializedShader::ESS_COMPUTE,
+				nullptr
+			},
+			{
+				1u,
+				EDT_STORAGE_IMAGE,
+				1u,
+				ISpecializedShader::ESS_COMPUTE,
+				nullptr
+			},
+		};
+		
+		const asset::SPushConstantRange pcRange = {ISpecializedShader::ESS_COMPUTE,0u,sizeof(image_store_parameters_t)};
+		core::SRange<const video::IGPUDescriptorSetLayout::SBinding> bindings = {bnd, bnd+sizeof(bnd)/sizeof(IGPUDescriptorSetLayout::SBinding)};;
+
+		return driver->createGPUPipelineLayout(
+			&pcRange,&pcRange+1,
+			driver->createGPUDescriptorSetLayout(bindings.begin(),bindings.end()),nullptr,nullptr,nullptr
+		);
+	}();
 
 	float bloomScale = 1.f;
 	const auto kerDim = kerImageView->getCreationParameters().image->getCreationParameters().extent;
-	const auto paddedSrcDim = [srcDim,kerDim,bloomScale]() -> auto
+	const auto marginSrcDim = [srcDim,kerDim,bloomScale]() -> auto
 	{
 		auto tmp = srcDim;
 		tmp.width += kerDim.width*bloomScale-1u;
@@ -373,8 +374,8 @@ int main()
 	bloomScale = 0.5;
 	constexpr bool useHalfFloats = true;
 	// Allocate Output Buffer
-	auto fftOutputBuffer_0 = driver->createDeviceLocalGPUBufferOnDedMem(FFTClass::getOutputBufferSize(useHalfFloats,paddedSrcDim,srcNumChannels));
-	auto fftOutputBuffer_1 = driver->createDeviceLocalGPUBufferOnDedMem(FFTClass::getOutputBufferSize(useHalfFloats,paddedSrcDim,srcNumChannels));
+	auto fftOutputBuffer_0 = driver->createDeviceLocalGPUBufferOnDedMem(FFTClass::getOutputBufferSize(useHalfFloats,marginSrcDim,srcNumChannels));
+	auto fftOutputBuffer_1 = driver->createDeviceLocalGPUBufferOnDedMem(FFTClass::getOutputBufferSize(useHalfFloats,marginSrcDim,srcNumChannels));
 	core::smart_refctd_ptr<IGPUImageView> kernelNormalizedSpectrums[channelCountOverride];
 
 	auto updateDescriptorSet = [driver](video::IGPUDescriptorSet* set, core::smart_refctd_ptr<IGPUImageView> inputImageDescriptor, asset::ISampler::E_TEXTURE_CLAMP textureWrap, core::smart_refctd_ptr<IGPUBuffer> outputBufferDescriptor) -> void
@@ -581,11 +582,11 @@ int main()
 	}
 	
 	// pipelines
-	auto fft_x = core::make_smart_refctd_ptr<FFTClass>(driver,paddedSrcDim.width,useHalfFloats);
-	auto fft_y = core::make_smart_refctd_ptr<FFTClass>(driver,paddedSrcDim.height,useHalfFloats);
+	auto fft_x = core::make_smart_refctd_ptr<FFTClass>(driver,marginSrcDim.width,useHalfFloats);
+	auto fft_y = core::make_smart_refctd_ptr<FFTClass>(driver,marginSrcDim.height,useHalfFloats);
 	auto fftPipeline_ImageInput = driver->createGPUComputePipeline(nullptr,core::smart_refctd_ptr(imageFirstFFTPipelineLayout),createShader(driver,fft_x.get(), "../image_first_fft.comp"));
 	auto convolvePipeline = driver->createGPUComputePipeline(nullptr, std::move(convolvePipelineLayout), createShader(driver,fft_y.get(), "../fft_convolve_ifft.comp"));
-	auto lastFFTPipeline = driver->createGPUComputePipeline(nullptr, getPipelineLayout_LastFFT(driver), createShader(driver,fft_x.get(), "../last_fft.comp"));
+	auto lastFFTPipeline = driver->createGPUComputePipeline(nullptr, std::move(lastFFTPipelineLayout), createShader(driver,fft_x.get(), "../last_fft.comp"));
 
 	// Src FFT X 
 	auto fftDescriptorSet_Src_FFT_X = driver->createGPUDescriptorSet(core::smart_refctd_ptr<const IGPUDescriptorSetLayout>(imageFirstFFTPipelineLayout->getDescriptorSetLayout(0u)));
@@ -612,7 +613,7 @@ int main()
 	FFTClass::Parameters_t fftPushConstants[3];
 	FFTClass::DispatchInfo_t fftDispatchInfo[3];
 	const ISampler::E_TEXTURE_CLAMP fftPadding[2] = {ISampler::ETC_MIRROR,ISampler::ETC_MIRROR};
-	const auto passes = FFTClass::buildParameters(false,srcNumChannels,srcDim,fftPushConstants,fftDispatchInfo,fftPadding,paddedSrcDim);
+	const auto passes = FFTClass::buildParameters(false,srcNumChannels,srcDim,fftPushConstants,fftDispatchInfo,fftPadding,marginSrcDim);
 	{
 		fftPushConstants[1].output_strides = fftPushConstants[1].input_strides; // override for less work and storage (dont need to store the extra Y-slices after iFFT)
 		fftPushConstants[2].input_dimensions = fftPushConstants[1].input_dimensions;
@@ -649,6 +650,14 @@ int main()
 		// Last FFT Padding and Copy to GPU Image
 		driver->bindComputePipeline(lastFFTPipeline.get());
 		driver->bindDescriptorSets(EPBP_COMPUTE, lastFFTPipeline->getLayout(), 0u, 1u, &lastFFTDescriptorSet.get(), nullptr);
+		{
+			const auto paddedSrcDim = FFTClass::padDimensions(marginSrcDim);
+			ivec2 unpad_offset = { 0,0 };
+			for (auto i=0u; i<2u; i++)
+			if (fftDispatchInfo[3].workGroupCount[i]>1u)
+				(&unpad_offset.x)[i] = ((&paddedSrcDim.width)[i]-(&srcDim.width)[i])>>1u;
+			driver->pushConstants(lastFFTPipeline->getLayout(),ISpecializedShader::ESS_COMPUTE,offsetof(image_store_parameters_t,unpad_offset),sizeof(image_store_parameters_t::unpad_offset),&unpad_offset);
+		}
 		FFTClass::dispatchHelper(driver, lastFFTPipeline->getLayout(), fftPushConstants[2], fftDispatchInfo[2]);
 		
 		if(!savedToFile) 

Original file line number	Diff line number	Diff line change
`@@ -4,7 +4,7 @@ layout(local_size_x=_NBL_GLSL_WORKGROUP_SIZE_, local_size_y=1, local_size_z=1) i`
`4`	`4`
`5`	`5`	`layout(set=0, binding=2) uniform sampler2D NormalizedKernel[3];`
`6`	`6`
`7`		`-#include "convolve_parameters.glsl"`
	`7`	`+#include "extra_parameters.glsl"`
`8`	`8`	`layout(push_constant) uniform PushConstants`
`9`	`9`	`{`
`10`	`10`	`convolve_parameters_t params;`