Only support int8 dtype for quant operators

aaron-ang · aaron-ang · commit c06b0ef155f6 · 2025-06-20T23:27:08.000-07:00
diff --git a/backends/xnnpack/partition/config/xnnpack_config.py b/backends/xnnpack/partition/config/xnnpack_config.py
@@ -10,12 +10,17 @@
 from typing import List, Optional
 
 import torch
+from torch.export import ExportedProgram
+from executorch.backends.xnnpack.utils.quant_utils import (
+    is_quant,
+    is_dequant,
+    is_qparam,
+)
 from executorch.exir.backend.canonical_partitioners.config_partitioner import (
     format_target_name,
     PartitionerConfig,
 )
 from executorch.exir.backend.utils import WhyNoPartition
-from torch.export import ExportedProgram
 
 logger = logging.getLogger(__name__)
 why = WhyNoPartition(logger=logger)
@@ -220,9 +225,12 @@ def _check_node_has_valid_dtype(self, node):
         valid_dtypes = {
             torch.float32,
             torch.float16,
-            torch.int8,
             torch.qint8,
         }
+        # Only allow int8 for quantization operations
+        if is_quant(node) or is_dequant(node) or is_qparam(node):
+            valid_dtypes.add(torch.int8)
+
         if (
             node.op != "placeholder"
             and node.op != "call_function"