update

ji-huazhong · ji-huazhong · commit 7ba303f5157c · 2024-12-05T11:31:22.000+08:00
diff --git a/bitsandbytes/backends/npu.py b/bitsandbytes/backends/npu.py
@@ -90,7 +90,7 @@ def quantize_4bit(
         A: torch.Tensor,
         absmax: Optional[torch.Tensor] = None,
         out: Optional[torch.Tensor] = None,
-        blocksize=64,
+        blocksize: Optional[int] = None,
         compress_statistics=False,
         quant_type: Literal["fp4", "nf4"] = "nf4",
         quant_storage=torch.uint8,