pytorch
diff --git a/‎fbgemm_gpu/experimental/gemm/triton_gemm/fp4_quantize.py‎
Lines changed: 1 addition & 1 deletion b/‎fbgemm_gpu/experimental/gemm/triton_gemm/fp4_quantize.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎fbgemm_gpu/experimental/gen_ai/bench/quantize_ops.py‎
Lines changed: 2 additions & 2 deletions b/‎fbgemm_gpu/experimental/gen_ai/bench/quantize_ops.py‎
Lines changed: 2 additions & 2 deletions
@@ -289,7 +289,7 @@ def triton_quantize_mx4_unpack(
         stochastic_casting (bool): Whether to use stochastic casting.
 
     Returns:
-        torch.Tensor: [M / 2] mx4 scaled tensor packed into in8
+        torch.Tensor: [M / 2] mx4 scaled tensor packed into uint8
         torch.Tensor: [M / group_size] mx4 shared exponents into int8
 
         eg.
 
@@ -2385,7 +2385,7 @@ def quantize(self, x, w):
 
     def compute(self, xq, wq, x_scale, w_scale, global_scale):
         return torch.ops.fbgemm.f4f4bf16(
-            xq, wq, x_scale, w_scale, global_scale=global_scale, use_mx=False
+            xq, wq, x_scale, w_scale, global_scale=global_scale
         )
 
     def quantize_and_compute(self, x, w):
@@ -2471,7 +2471,7 @@ def quantize(self, x, w):
 
     def compute(self, xq, wq, x_scale, w_scale, global_scale):
         return torch.ops.fbgemm.f4f4bf16(
-            xq, wq, x_scale, w_scale, global_scale=global_scale, use_mx=False
+            xq, wq, x_scale, w_scale, global_scale=global_scale
         )
 
     def quantize_and_compute(self, x, w):
Original file line number	Diff line number	Diff line change
`@@ -2385,7 +2385,7 @@ def quantize(self, x, w):`
`2385`	`2385`
`2386`	`2386`	`def compute(self, xq, wq, x_scale, w_scale, global_scale):`
`2387`	`2387`	`return torch.ops.fbgemm.f4f4bf16(`
`2388`		`- xq, wq, x_scale, w_scale, global_scale=global_scale, use_mx=False`
	`2388`	`+ xq, wq, x_scale, w_scale, global_scale=global_scale`
`2389`	`2389`	`)`
`2390`	`2390`
`2391`	`2391`	`def quantize_and_compute(self, x, w):`
`@@ -2471,7 +2471,7 @@ def quantize(self, x, w):`
`2471`	`2471`
`2472`	`2472`	`def compute(self, xq, wq, x_scale, w_scale, global_scale):`
`2473`	`2473`	`return torch.ops.fbgemm.f4f4bf16(`
`2474`		`- xq, wq, x_scale, w_scale, global_scale=global_scale, use_mx=False`
	`2474`	`+ xq, wq, x_scale, w_scale, global_scale=global_scale`
`2475`	`2475`	`)`
`2476`	`2476`
`2477`	`2477`	`def quantize_and_compute(self, x, w):`