Qualcomm AI Engine Direct - fix suite op

haowhsu-quic · haowhsu-quic · commit 993b9cb1e06c · 2025-10-16T00:08:57.000+08:00
- fix annotation logic for non arithmetic op
- partition out unsupported embedding_bag op
- use calibration input in suite test when verifying quantized op
diff --git a/backends/qualcomm/partition/common_defs.py b/backends/qualcomm/partition/common_defs.py
@@ -10,6 +10,7 @@
 from executorch.exir.dialects._ops import ops as exir_ops
 
 not_supported_operator = [
+    exir_ops.edge.aten._embedding_bag.default,
     exir_ops.edge.dim_order_ops._clone_dim_order.default,
     exir_ops.edge.quantized_decomposed.embedding_4bit.dtype,
 ]
diff --git a/backends/qualcomm/quantizer/annotators.py b/backends/qualcomm/quantizer/annotators.py
@@ -691,7 +691,7 @@ def annotate_sign(node: Node, quantization_config: QuantizationConfig) -> None:
 
 @register_annotator([torch.ops.aten.slice.Tensor])
 def annotate_slice(node: Node, quantization_config: QuantizationConfig) -> None:
-    annotate_single_in_single_out(node, quantization_config)
+    annotate_single_in_share_out(node, quantization_config)
 
 
 @register_annotator([torch.ops.aten.slice_scatter.default])
@@ -1281,27 +1281,15 @@ def annotate_cat(node: Node, quantization_config: QuantizationConfig) -> None:
     if _is_annotated([node]) or not _is_float_tensor(node):
         return
 
-    assert isinstance(input_nodes, Sequence)
-
-    first_input_node = input_nodes[0]
     input_qspec_map = {}
-    assert isinstance(first_input_node, Node)
-    assert isinstance(node, Node)
-    if _is_float_tensor(first_input_node):
-        input_qspec_map[first_input_node] = quantization_config.input_activation
-        share_qparams_with_input_act0_qspec = SharedQuantizationSpec(
-            (first_input_node, node)
-        )
-
-    for input_node in input_nodes[1:]:
-        if input_node not in input_qspec_map:
-            assert isinstance(input_node, Node)
-            if _is_float_tensor(input_node):
-                input_qspec_map[input_node] = share_qparams_with_input_act0_qspec
+    for input_node in input_nodes:
+        assert isinstance(input_node, Node)
+        if _is_float_tensor(input_node):
+            input_qspec_map[input_node] = quantization_config.input_activation
 
     node.meta[Q_ANNOTATION_KEY] = QuantizationAnnotation(
         input_qspec_map=input_qspec_map,
-        output_qspec=share_qparams_with_input_act0_qspec,
+        output_qspec=quantization_config.output_activation,
         _annotated=True,
     )
 
@@ -1346,14 +1334,17 @@ def annotate_chunk(node: Node, quantization_config: QuantizationConfig) -> None:
     assert isinstance(input_act, Node)
     input_qspec_map[input_act] = quantization_config.input_activation
 
+    share_qparams_with_input_node_qspec = SharedQuantizationSpec((input_act, node))
+    input_qspec_map[input_act] = quantization_config.input_activation
+
     node.meta[Q_ANNOTATION_KEY] = QuantizationAnnotation(
         input_qspec_map=input_qspec_map,
         _annotated=True,
     )
 
     for user in node.users:
         user.meta[Q_ANNOTATION_KEY] = QuantizationAnnotation(
-            output_qspec=quantization_config.output_activation,
+            output_qspec=share_qparams_with_input_node_qspec,
             _annotated=True,
         )
 
diff --git a/backends/test/suite/operators/__init__.py b/backends/test/suite/operators/__init__.py
@@ -69,7 +69,7 @@ class TestCaseShim:
     def __init__(self, test_runner):
         self._test_runner = test_runner
 
-    def _test_op(self, model, args, flow, generate_random_test_inputs=True):
+    def _test_op(self, model, args, flow, generate_random_test_inputs=False):
         self._test_runner.lower_and_run_model(
             model, args, generate_random_test_inputs=generate_random_test_inputs
         )

Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,7 @@`
`10`	`10`	`from executorch.exir.dialects._ops import ops as exir_ops`
`11`	`11`
`12`	`12`	`not_supported_operator = [`
	`13`	`+ exir_ops.edge.aten._embedding_bag.default,`
`13`	`14`	`exir_ops.edge.dim_order_ops._clone_dim_order.default,`
`14`	`15`	`exir_ops.edge.quantized_decomposed.embedding_4bit.dtype,`
`15`	`16`	`]`
Original file line number	Diff line number	Diff line change
`@@ -69,7 +69,7 @@ class TestCaseShim:`
`69`	`69`	`def __init__(self, test_runner):`
`70`	`70`	`self._test_runner = test_runner`
`71`	`71`
`72`		`- def _test_op(self, model, args, flow, generate_random_test_inputs=True):`
	`72`	`+ def _test_op(self, model, args, flow, generate_random_test_inputs=False):`
`73`	`73`	`self._test_runner.lower_and_run_model(`
`74`	`74`	`model, args, generate_random_test_inputs=generate_random_test_inputs`
`75`	`75`	`)`