fix observer zp dtype

helloyongyang · helloyongyang · commit b1edea77fcae · 2024-04-18T22:56:29.000+08:00
diff --git a/mqbench/observer.py b/mqbench/observer.py
@@ -54,6 +54,28 @@ def calculate_qparams(self) -> Tuple[torch.Tensor, torch.Tensor]:
             scale = pot_quantization(scale)
         return scale, zero_point
 
+    @torch.jit.export
+    def _calculate_qparams(
+        self, min_val: torch.Tensor, max_val: torch.Tensor
+    ) -> Tuple[torch.Tensor, torch.Tensor]:
+        r"""Calculates the quantization parameters, given min and max
+        value tensors. Works for both per tensor and per channel cases
+
+        Args:
+            min_val: Minimum values per channel
+            max_val: Maximum values per channel
+
+        Returns:
+            scales: Scales tensor of shape (#channels,)
+            zero_points: Zero points tensor of shape (#channels,)
+        """
+        scale, zero_point = super()._calculate_qparams(min_val, max_val)
+        if _version_under_1100:
+            zero_point = zero_point.long()
+        else:
+            zero_point = zero_point.int()
+        return scale, zero_point
+
     @torch.jit.export
     def _calculate_qmin_qmax(self) -> Tuple[int, int]:
         r"""Calculates actual qmin and qmax based on the quantization range,
diff --git a/requirements.txt b/requirements.txt
@@ -1,6 +1,6 @@
 torch==1.10.0
 torchvision==0.11.1
-onnx==1.7.0
 numpy==1.19.0
 protobuf==3.20.3
 prettytable
+onnx==1.13.1