WOQ: fix reference kernel for binary fusion with odd M (#3490)

Xia-Weiwen · web-flow · commit 3049c7878c85 · 2025-02-06T07:11:28.000-08:00
diff --git a/csrc/cpu/aten/utils/woq.h b/csrc/cpu/aten/utils/woq.h
@@ -3454,11 +3454,21 @@ static at::Tensor woq_gemm_ref_impl(
     at::silu_(y);
   } else if (fusion_type == WOQ_FUSE_ADD || fusion_type == WOQ_FUSE_ADD_ADD) {
     for (auto& tin : others_list) {
-      y = at::add(y, tin.view(y.sizes()));
+      auto tin_view = tin.view({-1, y.size(-1)});
+      if (tin_view.size(0) < y.size(0)) {
+        tin_view = at::pad(
+            tin_view, {0, 0, 0, y.size(0) - tin_view.size(0)}, "constant", 0);
+      }
+      y = at::add(y, tin_view);
     }
   } else if (fusion_type == WOQ_FUSE_MUL) {
     for (auto& tin : others_list) {
-      y = at::mul(y, tin.view(y.sizes()));
+      auto tin_view = tin.view({-1, y.size(-1)});
+      if (tin_view.size(0) < y.size(0)) {
+        tin_view = at::pad(
+            tin_view, {0, 0, 0, y.size(0) - tin_view.size(0)}, "constant", 0);
+      }
+      y = at::mul(y, tin_view);
     }
   } else {
     TORCH_CHECK(
diff --git a/tests/cpu/test_quantization_default_recipe.py b/tests/cpu/test_quantization_default_recipe.py
@@ -1207,7 +1207,7 @@ def forward(self, x, others):
         ]
         bias_list = [False, True]
         bf16_list = [False, True]
-        batch_size_list = [4, 1024]
+        batch_size_list = [4, 1024, 63]
         cases = itertools.product(
             weight_dtype_list, bias_list, bf16_list, batch_size_list
         )

Original file line number	Diff line number	Diff line change
`@@ -1207,7 +1207,7 @@ def forward(self, x, others):`
`1207`	`1207`	`]`
`1208`	`1208`	`bias_list = [False, True]`
`1209`	`1209`	`bf16_list = [False, True]`
`1210`		`- batch_size_list = [4, 1024]`
	`1210`	`+ batch_size_list = [4, 1024, 63]`
`1211`	`1211`	`cases = itertools.product(`
`1212`	`1212`	`weight_dtype_list, bias_list, bf16_list, batch_size_list`
`1213`	`1213`	`)`