Update base for Update on "[ET-VK] Implement prepack nodes"

SS-JIA · SS-JIA · commit b0f75f9ce8b8 · 2024-10-18T09:40:52.000-07:00
## Context This diff implements the idea described in the previous diff in this stack. During export, `et_vk.prepack` nodes will be inserted to convert constant tensors to GPU tensor objects. This makes it so that Vulkan operators will not have to account for the possibility that their arguments can potentially be constant tensor data instead of an actual tensor object. Differential Revision: [D64603666](https://our.internmc.facebook.com/intern/diff/D64603666/) [ghstack-poisoned]
diff --git a/backends/vulkan/runtime/graph/ops/impl/Linear.cpp b/backends/vulkan/runtime/graph/ops/impl/Linear.cpp
@@ -95,10 +95,10 @@ void add_addmm_naive_node(
     const Params& params,
     const ValueRef mat2_is_transposed) {
   utils::StorageType stype = graph.storage_type_of(out);
-  ValueRef self =
-      prepack_standard(graph, self_data, stype, utils::kWidthPacked, true);
-  ValueRef mat2 =
-      prepack_standard(graph, mat2_data, stype, utils::kHeightPacked, true);
+  ValueRef self = prepack_standard(
+      graph, self_data, stype, utils::kWidthPacked, /*passthrough = */ true);
+  ValueRef mat2 = prepack_standard(
+      graph, mat2_data, stype, utils::kHeightPacked, /*passthrough = */ true);
 
   std::string kernel_name =
       graph.get_bool(mat2_is_transposed) ? "linear_naive" : "addmm_naive";
@@ -149,10 +149,10 @@ void add_addmm_optimized_node(
     const Params& params,
     const ValueRef mat2_is_transposed) {
   utils::StorageType stype = graph.storage_type_of(out);
-  ValueRef self =
-      prepack_standard(graph, self_data, stype, utils::kChannelsPacked, true);
-  ValueRef mat2 =
-      prepack_standard(graph, mat2_data, stype, utils::kHeightPacked, true);
+  ValueRef self = prepack_standard(
+      graph, self_data, stype, utils::kChannelsPacked, /*passthrough=*/true);
+  ValueRef mat2 = prepack_standard(
+      graph, mat2_data, stype, utils::kHeightPacked, /*passthrough=*/true);
 
   // Ensure mat1 is width packed
   ValueRef mat1_W_packed = graph.add_tensor_like(mat1, utils::kWidthPacked);
diff --git a/backends/vulkan/runtime/graph/ops/impl/MatMul.cpp b/backends/vulkan/runtime/graph/ops/impl/MatMul.cpp
@@ -63,7 +63,11 @@ void add_matmul_naive_buffer_node(
     const ValueRef out,
     const ValueRef mat2_is_transposed) {
   ValueRef mat2 = prepack_standard(
-      graph, mat2_data, graph.storage_type_of(out), utils::kHeightPacked, true);
+      graph,
+      mat2_data,
+      graph.storage_type_of(out),
+      utils::kHeightPacked,
+      /*passthrough = */ true);
 
   std::string kernel_name = "matmul_naive_buffer";
   add_dtype_suffix(kernel_name, graph.dtype_of(out));
@@ -105,7 +109,11 @@ void add_matmul_naive_texture3d_node(
     const ValueRef out,
     const ValueRef mat2_is_transposed) {
   ValueRef mat2 = prepack_standard(
-      graph, mat2_data, graph.storage_type_of(out), utils::kHeightPacked, true);
+      graph,
+      mat2_data,
+      graph.storage_type_of(out),
+      utils::kHeightPacked,
+      /*passthrough = */ true);
 
   std::string kernel_name = graph.get_bool(mat2_is_transposed)
       ? "matmul_transposed_naive"
@@ -149,7 +157,11 @@ void add_matmul_optimized_node(
     const ValueRef out,
     const ValueRef mat2_is_transposed) {
   ValueRef mat2 = prepack_standard(
-      graph, mat2_data, graph.storage_type_of(out), utils::kHeightPacked, true);
+      graph,
+      mat2_data,
+      graph.storage_type_of(out),
+      utils::kHeightPacked,
+      /*passthrough = */ true);
 
   // Ensure mat1 is width packed
   ValueRef mat1_W_packed = graph.add_tensor_like(mat1, utils::kWidthPacked);
diff --git a/backends/vulkan/runtime/graph/ops/impl/Staging.cpp b/backends/vulkan/runtime/graph/ops/impl/Staging.cpp
@@ -110,7 +110,7 @@ void add_tensor_to_staging_node(
       {SV(graph.packed_dim_of(in_tensor))}));
 }
 
-void add_standard_prepack_node(
+void add_prepack_standard_node(
     ComputeGraph& graph,
     const ValueRef tensor_data,
     const ValueRef tensor) {
@@ -152,7 +152,7 @@ ValueRef prepack_standard(
   }
   VK_CHECK_COND(graph.val_is_tref(tensor_data));
   ValueRef tensor = graph.add_tensor_like(tensor_data, storage_type, layout);
-  add_standard_prepack_node(graph, tensor_data, tensor);
+  add_prepack_standard_node(graph, tensor_data, tensor);
   return tensor;
 }
 
@@ -170,7 +170,7 @@ ValueRef prepack_standard_like(
       passthrough);
 }
 
-void add_direct_buffer_copy_prepack_node(
+void add_prepack_direct_buffer_copy_node(
     ComputeGraph& graph,
     const ValueRef tensor_data,
     const ValueRef tensor) {
@@ -198,9 +198,10 @@ void add_direct_buffer_copy_prepack_node(
 ValueRef prepack_direct_copy_buffer(
     ComputeGraph& graph,
     const ValueRef tensor_data) {
+  VK_CHECK_COND(graph.val_is_tref(tensor_data));
   ValueRef tensor =
       graph.add_tensor_like(tensor_data, utils::kBuffer, utils::kWidthPacked);
-  add_direct_buffer_copy_prepack_node(graph, tensor_data, tensor);
+  add_prepack_direct_buffer_copy_node(graph, tensor_data, tensor);
   return tensor;
 }