[ET-VK] Rename quantize/dequantize functions/shaders to be more generic (#15752)

pytorchbot · web-flow · commit a44f68ddb5e3 · 2025-11-11T14:06:12.000-05:00
Title says it all! Currently, quantize/dequantize ops are named like `add_quantize_and_pack_linear_input_node` `add_quantize_and_pack_q8ta_conv2d_input_node` This diff renames them to `add_quantize_and_pack_4h4w_node` `add_quantize_and_pack_4w4c_node` which references the memory layout they produce rather than a specific op. Differential Revision: [D86702456](https://our.internmc.facebook.com/intern/diff/D86702456/)
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w.glsl b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w.glsl
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w.yaml b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w.yaml
@@ -4,21 +4,22 @@
 # This source code is licensed under the BSD-style license found in the
 # LICENSE file in the root directory of this source tree.
 
-quantize_and_pack_linear_input:
+quantize_and_pack_4h4w:
   parameter_names_with_default_values:
     DTYPE: float
     OUTPUT_STORAGE: texture3d
     INPUT_STORAGE: texture3d
     STORAGE: texture3d
     GRANULARITY: per_tensor
   generate_variant_forall:
+    combination:
+      parameter_names: [OUTPUT_STORAGE, INPUT_STORAGE]
+      combos:
+        - parameter_values: [texture3d, texture3d]
+        - parameter_values: [buffer, texture3d]
+        - parameter_values: [buffer, buffer]
     DTYPE:
       - VALUE: half
       - VALUE: float
   shader_variants:
-    - NAME: quantize_and_pack_linear_input_per_tensor_texture3d_texture3d
-    - NAME: quantize_and_pack_linear_input_per_tensor_buffer_texture3d
-      OUTPUT_STORAGE: buffer
-    - NAME: quantize_and_pack_linear_input_per_tensor_buffer_buffer
-      OUTPUT_STORAGE: buffer
-      INPUT_STORAGE: buffer
+    - NAME: quantize_and_pack_4h4w_per_tensor
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w_with_group_sums.glsl b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w_with_group_sums.glsl
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w_with_group_sums.yaml b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4h4w_with_group_sums.yaml
@@ -4,7 +4,7 @@
 # This source code is licensed under the BSD-style license found in the
 # LICENSE file in the root directory of this source tree.
 
-quantize_and_pack_linear_input_with_sums:
+quantize_and_pack_4h4w_with_group_sums:
   parameter_names_with_default_values:
     DTYPE: float
     OUTPUT_STORAGE: buffer
@@ -16,14 +16,14 @@ quantize_and_pack_linear_input_with_sums:
       - VALUE: half
       - VALUE: float
   shader_variants:
-    - NAME: quantize_and_pack_linear_input_with_sums_o2w32_buffer_texture3d
-    - NAME: quantize_and_pack_linear_input_with_sums_o2w32_buffer_buffer
+    - NAME: quantize_and_pack_4h4w_with_group_sums_o2w32_buffer_texture3d
+    - NAME: quantize_and_pack_4h4w_with_group_sums_o2w32_buffer_buffer
       OUTPUT_STORAGE: buffer
       INPUT_STORAGE: buffer
-    - NAME: quantize_and_pack_linear_input_with_sums_o4w16_buffer_texture3d
+    - NAME: quantize_and_pack_4h4w_with_group_sums_o4w16_buffer_texture3d
       NUM_GROUPS_PER_WG: 4
       NUM_WORKERS_PER_GROUP: 16
-    - NAME: quantize_and_pack_linear_input_with_sums_o4w16_buffer_buffer
+    - NAME: quantize_and_pack_4h4w_with_group_sums_o4w16_buffer_buffer
       NUM_GROUPS_PER_WG: 4
       NUM_WORKERS_PER_GROUP: 16
       OUTPUT_STORAGE: buffer
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4w4c.glsl b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4w4c.glsl
diff --git a/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4w4c.yaml b/backends/vulkan/runtime/graph/ops/glsl/quantize_and_pack_4w4c.yaml
@@ -4,7 +4,7 @@
 # This source code is licensed under the BSD-style license found in the
 # LICENSE file in the root directory of this source tree.
 
-quantize_and_pack_q8ta_conv2d_input:
+quantize_and_pack_4w4c:
   parameter_names_with_default_values:
     DTYPE: float
     OUTPUT_STORAGE: texture3d
@@ -19,4 +19,4 @@ quantize_and_pack_q8ta_conv2d_input:
     DTYPE:
       - VALUE: float
   shader_variants:
-    - NAME: quantize_and_pack_q8ta_conv2d_input
+    - NAME: quantize_and_pack_4w4c_per_tensor
diff --git a/backends/vulkan/runtime/graph/ops/glsl/unpack_4w4c_and_dequantize.glsl b/backends/vulkan/runtime/graph/ops/glsl/unpack_4w4c_and_dequantize.glsl
diff --git a/backends/vulkan/runtime/graph/ops/glsl/unpack_4w4c_and_dequantize.yaml b/backends/vulkan/runtime/graph/ops/glsl/unpack_4w4c_and_dequantize.yaml
@@ -4,7 +4,7 @@
 # This source code is licensed under the BSD-style license found in the
 # LICENSE file in the root directory of this source tree.
 
-unpack_and_dequantize_q8ta_conv2d_output:
+unpack_4w4c_and_dequantize:
   parameter_names_with_default_values:
     DTYPE: float
     OUTPUT_STORAGE: texture3d
@@ -19,4 +19,4 @@ unpack_and_dequantize_q8ta_conv2d_output:
     DTYPE:
       - VALUE: float
   shader_variants:
-    - NAME: unpack_and_dequantize_q8ta_conv2d_output
+    - NAME: unpack_4w4c_and_dequantize_per_tensor
diff --git a/backends/vulkan/runtime/graph/ops/impl/QuantizeDequantize.cpp b/backends/vulkan/runtime/graph/ops/impl/QuantizeDequantize.cpp
@@ -41,7 +41,7 @@ std::tuple<int64_t, int64_t> get_quantized_input_num_blocks(
   return std::make_tuple(num_blocks_M, num_blocks_K);
 }
 
-utils::uvec3 quant_pack_input_global_wg_size(
+utils::uvec3 quantize_and_pack_4h4w_global_wg_size(
     ComputeGraph* graph,
     const vkapi::ShaderInfo& shader,
     const std::vector<ArgGroup>& args,
@@ -57,7 +57,7 @@ utils::uvec3 quant_pack_input_global_wg_size(
       1u};
 }
 
-vkapi::ShaderInfo pick_quantize_and_pack_input_with_sums_shader(
+vkapi::ShaderInfo pick_quantize_and_pack_4h4w_with_group_sums_shader(
     ComputeGraph* graph,
     const std::vector<ArgGroup>& args,
     const std::vector<ValueRef>& resize_args) {
@@ -67,7 +67,7 @@ vkapi::ShaderInfo pick_quantize_and_pack_input_with_sums_shader(
 
   const int64_t group_size_val = graph->extract_scalar<int64_t>(group_size);
 
-  std::string shader_name = "quantize_and_pack_linear_input_with_sums";
+  std::string shader_name = "quantize_and_pack_4h4w_with_group_sums";
   if (group_size_val >= 128) {
     shader_name += "_o2w32";
   } else {
@@ -82,7 +82,7 @@ vkapi::ShaderInfo pick_quantize_and_pack_input_with_sums_shader(
   return VK_KERNEL_FROM_STR(shader_name);
 }
 
-utils::uvec3 pick_quantize_and_pack_input_with_sums_global_wg_size(
+utils::uvec3 pick_quantize_and_pack_4h4w_with_group_sums_global_wg_size(
     ComputeGraph* graph,
     const vkapi::ShaderInfo& shader,
     const std::vector<ArgGroup>& args,
@@ -113,7 +113,7 @@ utils::uvec3 pick_quantize_and_pack_input_with_sums_global_wg_size(
       1u};
 }
 
-utils::uvec3 pick_quantize_and_pack_input_with_sums_local_wg_size(
+utils::uvec3 pick_quantize_and_pack_4h4w_with_group_sums_local_wg_size(
     ComputeGraph* graph,
     const vkapi::ShaderInfo& shader,
     const utils::uvec3& global_workgroup_size,
@@ -144,7 +144,7 @@ utils::uvec3 pick_quantize_and_pack_input_with_sums_local_wg_size(
 // Dispatch logic (Linear)
 //
 
-void add_quantize_and_pack_linear_input_node(
+void add_quantize_and_pack_4h4w_node(
     ComputeGraph& graph,
     const QuantizationConfig& input_quant_config,
     const ValueRef fp_input,
@@ -164,7 +164,7 @@ void add_quantize_and_pack_linear_input_node(
   float inv_scale = 1.0f / graph.extract_scalar<float>(input_scale_data);
   int32_t zp = graph.extract_scalar<int32_t>(input_zp_data);
 
-  std::string shader_name = "quantize_and_pack_linear_input_per_tensor";
+  std::string shader_name = "quantize_and_pack_4h4w_per_tensor";
   add_storage_type_suffix(shader_name, graph.storage_type_of(packed_int_input));
   add_storage_type_suffix(shader_name, graph.storage_type_of(fp_input));
   add_dtype_suffix(shader_name, graph.dtype_of(fp_input));
@@ -179,7 +179,7 @@ void add_quantize_and_pack_linear_input_node(
   graph.execute_nodes().emplace_back(new DynamicDispatchNode(
       graph,
       VK_KERNEL_FROM_STR(shader_name),
-      quant_pack_input_global_wg_size,
+      quantize_and_pack_4h4w_global_wg_size,
       default_pick_local_wg_size,
       // Inputs and Outputs
       {{packed_int_input, vkapi::kWrite}, {fp_input, vkapi::kRead}},
@@ -193,7 +193,7 @@ void add_quantize_and_pack_linear_input_node(
       {}));
 }
 
-void add_quantize_and_pack_linear_input_with_sums_node(
+void add_quantize_and_pack_4h4w_with_group_sums_node(
     ComputeGraph& graph,
     const QuantizationConfig& input_quant_config,
     const ValueRef fp_input,
@@ -216,9 +216,9 @@ void add_quantize_and_pack_linear_input_with_sums_node(
 
   graph.execute_nodes().emplace_back(new DynamicDispatchNode(
       graph,
-      pick_quantize_and_pack_input_with_sums_shader,
-      pick_quantize_and_pack_input_with_sums_global_wg_size,
-      pick_quantize_and_pack_input_with_sums_local_wg_size,
+      pick_quantize_and_pack_4h4w_with_group_sums_shader,
+      pick_quantize_and_pack_4h4w_with_group_sums_global_wg_size,
+      pick_quantize_and_pack_4h4w_with_group_sums_local_wg_size,
       // Inputs and Outputs
       {{{packed_int_input, int_input_sums}, vkapi::kWrite},
        {{fp_input, packed_input_scales, packed_input_zps}, vkapi::kRead}},
@@ -236,7 +236,7 @@ void add_quantize_and_pack_linear_input_with_sums_node(
 // Dispatch utilities (Conv2d)
 //
 
-utils::uvec3 pick_quantize_and_pack_conv2d_input_global_wg_size(
+utils::uvec3 pick_quantize_and_pack_4w4c_global_wg_size(
     ComputeGraph* graph,
     const vkapi::ShaderInfo& shader,
     const std::vector<ArgGroup>& args,
@@ -253,7 +253,7 @@ utils::uvec3 pick_quantize_and_pack_conv2d_input_global_wg_size(
   return {W4, H, C4};
 }
 
-utils::uvec3 pick_unpack_and_dequantize_conv2d_output_global_wg_size(
+utils::uvec3 pick_unpack_4w4c_and_dequantize_global_wg_size(
     ComputeGraph* graph,
     const vkapi::ShaderInfo& shader,
     const std::vector<ArgGroup>& args,
@@ -274,7 +274,7 @@ utils::uvec3 pick_unpack_and_dequantize_conv2d_output_global_wg_size(
 // Dispatch logic (Conv2d)
 //
 
-void add_quantize_and_pack_q8ta_conv2d_input_node(
+void add_quantize_and_pack_4w4c_node(
     ComputeGraph& graph,
     const ValueRef fp_input,
     const ValueRef input_scale,
@@ -284,7 +284,7 @@ void add_quantize_and_pack_q8ta_conv2d_input_node(
   int32_t zp = graph.extract_scalar<int32_t>(input_zp);
 
   // Get shader for quantized conv2d linear tiled
-  std::string kernel_name = "quantize_and_pack_q8ta_conv2d_input";
+  std::string kernel_name = "quantize_and_pack_4w4c_per_tensor";
   add_storage_type_suffix(
       kernel_name, graph.storage_type_of(packed_int8_input));
   add_storage_type_suffix(kernel_name, graph.storage_type_of(fp_input));
@@ -302,7 +302,7 @@ void add_quantize_and_pack_q8ta_conv2d_input_node(
   graph.execute_nodes().emplace_back(new DynamicDispatchNode(
       graph,
       VK_KERNEL_FROM_STR(kernel_name),
-      pick_quantize_and_pack_conv2d_input_global_wg_size,
+      pick_quantize_and_pack_4w4c_global_wg_size,
       pick_wc_square_wg_size,
       // Inputs and Outputs
       {{packed_int8_input, vkapi::kWrite}, {fp_input, vkapi::kRead}},
@@ -318,7 +318,7 @@ void add_quantize_and_pack_q8ta_conv2d_input_node(
       nullptr));
 }
 
-void add_unpack_and_dequantize_q8ta_conv2d_output_node(
+void add_unpack_4w4c_and_dequantize_node(
     ComputeGraph& graph,
     const ValueRef packed_int8_output,
     const ValueRef output_scale,
@@ -328,7 +328,7 @@ void add_unpack_and_dequantize_q8ta_conv2d_output_node(
   int32_t zp = graph.extract_scalar<int32_t>(output_zp);
 
   // Get shader for quantized conv2d linear tiled
-  std::string kernel_name = "unpack_and_dequantize_q8ta_conv2d_output";
+  std::string kernel_name = "unpack_4w4c_and_dequantize_per_tensor";
   add_storage_type_suffix(kernel_name, graph.storage_type_of(fp_output));
   add_storage_type_suffix(
       kernel_name, graph.storage_type_of(packed_int8_output));
@@ -346,7 +346,7 @@ void add_unpack_and_dequantize_q8ta_conv2d_output_node(
   graph.execute_nodes().emplace_back(new DynamicDispatchNode(
       graph,
       VK_KERNEL_FROM_STR(kernel_name),
-      pick_unpack_and_dequantize_conv2d_output_global_wg_size,
+      pick_unpack_4w4c_and_dequantize_global_wg_size,
       default_pick_local_wg_size,
       // Inputs and Outputs
       {{fp_output, vkapi::kWrite}, {packed_int8_output, vkapi::kRead}},
@@ -375,7 +375,7 @@ void quantize_q8ta_for_conv2d(
   const ValueRef zero_point = args.at(idx++);
   const ValueRef packed_int8_input = args.at(idx++);
 
-  add_quantize_and_pack_q8ta_conv2d_input_node(
+  add_quantize_and_pack_4w4c_node(
       graph, fp_input, scale, zero_point, packed_int8_input);
 }
 
@@ -388,7 +388,7 @@ void dequantize_q8to_from_conv2d(
   const ValueRef zero_point = args.at(idx++);
   const ValueRef fp_output = args.at(idx++);
 
-  add_unpack_and_dequantize_q8ta_conv2d_output_node(
+  add_unpack_4w4c_and_dequantize_node(
       graph, packed_int8_output, scale, zero_point, fp_output);
 }
 
@@ -408,10 +408,10 @@ void qdq8ta_conv2d_input(
       utils::kBuffer,
       utils::kPackedInt8_4W4C);
 
-  add_quantize_and_pack_q8ta_conv2d_input_node(
+  add_quantize_and_pack_4w4c_node(
       graph, fp_input, scale, zero_point, packed_int8_input);
 
-  add_unpack_and_dequantize_q8ta_conv2d_output_node(
+  add_unpack_4w4c_and_dequantize_node(
       graph, packed_int8_input, scale, zero_point, fp_output);
 }
 
diff --git a/backends/vulkan/runtime/graph/ops/impl/QuantizeDequantize.h b/backends/vulkan/runtime/graph/ops/impl/QuantizeDequantize.h
@@ -23,7 +23,7 @@ bool is_gemv(ComputeGraph* graph, const ValueRef& fp_input);
 // Quantize, Dequantize for Linear/Matmul
 //
 
-void add_quantize_and_pack_linear_input_node(
+void add_quantize_and_pack_4h4w_node(
     ComputeGraph& graph,
     const QuantizationConfig& input_quant_config,
     const ValueRef fp_input,
@@ -34,7 +34,7 @@ void add_quantize_and_pack_linear_input_node(
     const ValueRef packed_int_input,
     const ValueRef group_size);
 
-void add_quantize_and_pack_linear_input_with_sums_node(
+void add_quantize_and_pack_4h4w_with_group_sums_node(
     ComputeGraph& graph,
     const QuantizationConfig& input_quant_config,
     const ValueRef fp_input,
@@ -48,14 +48,14 @@ void add_quantize_and_pack_linear_input_with_sums_node(
 // Quantize, Dequantize for Convolution
 //
 
-void add_quantize_and_pack_q8ta_conv2d_input_node(
+void add_quantize_and_pack_4w4c_node(
     ComputeGraph& graph,
     const ValueRef fp_input,
     const ValueRef input_scale,
     const ValueRef input_zp,
     const ValueRef packed_int8_input);
 
-void add_unpack_and_dequantize_q8ta_conv2d_output_node(
+void add_unpack_4w4c_and_dequantize_node(
     ComputeGraph& graph,
     const ValueRef packed_int8_output,
     const ValueRef output_scale,
diff --git a/backends/vulkan/runtime/graph/ops/impl/QuantizedBinary.cpp b/backends/vulkan/runtime/graph/ops/impl/QuantizedBinary.cpp
@@ -178,10 +178,10 @@ void add_q8ta_q8ta_q8to_test(
       utils::kBuffer,
       utils::kPackedInt8_4W4C);
 
-  add_quantize_and_pack_q8ta_conv2d_input_node(
+  add_quantize_and_pack_4w4c_node(
       graph, fp_input_a, input_a_scale, input_a_zp, packed_int8_input_a);
 
-  add_quantize_and_pack_q8ta_conv2d_input_node(
+  add_quantize_and_pack_4w4c_node(
       graph, fp_input_b, input_b_scale, input_b_zp, packed_int8_input_b);
 
   std::vector<ValueRef> add_args = {
@@ -198,7 +198,7 @@ void add_q8ta_q8ta_q8to_test(
 
   add_q8ta_q8ta_q8to(graph, add_args);
 
-  add_unpack_and_dequantize_q8ta_conv2d_output_node(
+  add_unpack_4w4c_and_dequantize_node(
       graph, packed_int8_output, output_scale, output_zp, fp_output);
 }
 
diff --git a/backends/vulkan/runtime/graph/ops/impl/QuantizedConvolution.cpp b/backends/vulkan/runtime/graph/ops/impl/QuantizedConvolution.cpp
@@ -1524,7 +1524,7 @@ void conv2d_q8ta_q8csw_q8to_test(
       utils::kBuffer,
       utils::kPackedInt8_4W4C);
 
-  add_quantize_and_pack_q8ta_conv2d_input_node(
+  add_quantize_and_pack_4w4c_node(
       graph, fp_input, input_scale, input_zp, packed_int8_input);
 
   std::vector<ValueRef> conv2d_args = {
@@ -1546,7 +1546,7 @@ void conv2d_q8ta_q8csw_q8to_test(
 
   conv2d_q8ta_q8csw_q8to(graph, conv2d_args);
 
-  add_unpack_and_dequantize_q8ta_conv2d_output_node(
+  add_unpack_4w4c_and_dequantize_node(
       graph, packed_int8_output, output_scale, output_zp, fp_output);
 }
 
diff --git a/backends/vulkan/runtime/graph/ops/impl/QuantizedLinear.cpp b/backends/vulkan/runtime/graph/ops/impl/QuantizedLinear.cpp
@@ -607,7 +607,7 @@ void quantized_linear_impl(
 
   // Non dynamically quantized input case
   if (!input_quant_config.is_dynamic) {
-    add_quantize_and_pack_linear_input_node(
+    add_quantize_and_pack_4h4w_node(
         graph,
         input_quant_config,
         fp_input,
@@ -656,7 +656,7 @@ void quantized_linear_impl(
       utils::kBuffer,
       utils::kWidthPacked);
 
-  add_quantize_and_pack_linear_input_with_sums_node(
+  add_quantize_and_pack_4h4w_with_group_sums_node(
       graph,
       input_quant_config,
       fp_input,