pytorch
diff --git a/‎.lintrunner.toml‎
Lines changed: 28 additions & 0 deletions b/‎.lintrunner.toml‎
Lines changed: 28 additions & 0 deletions
diff --git a/‎.mypy.ini‎
Lines changed: 3 additions & 0 deletions b/‎.mypy.ini‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎backends/apple/coreml/test/test_coreml_quantizer.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/apple/coreml/test/test_coreml_quantizer.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎backends/arm/quantizer/arm_quantizer.py‎
Lines changed: 11 additions & 12 deletions b/‎backends/arm/quantizer/arm_quantizer.py‎
Lines changed: 11 additions & 12 deletions
diff --git a/‎backends/arm/quantizer/arm_quantizer_utils.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/arm/quantizer/arm_quantizer_utils.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎backends/arm/quantizer/quantization_annotator.py‎
Lines changed: 8 additions & 7 deletions b/‎backends/arm/quantizer/quantization_annotator.py‎
Lines changed: 8 additions & 7 deletions
diff --git a/‎backends/arm/quantizer/quantization_config.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/arm/quantizer/quantization_config.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎backends/arm/test/ops/test_add.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/arm/test/ops/test_add.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎backends/arm/test/ops/test_sigmoid_16bit.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/arm/test/ops/test_sigmoid_16bit.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎backends/arm/test/ops/test_sigmoid_32bit.py‎
Lines changed: 2 additions & 2 deletions b/‎backends/arm/test/ops/test_sigmoid_32bit.py‎
Lines changed: 2 additions & 2 deletions
@@ -378,3 +378,31 @@ command = [
     '--',
     '@{{PATHSFILE}}',
 ]
+
+[[linter]]
+code = "TORCH_AO_IMPORT"
+include_patterns = ["**/*.py"]
+exclude_patterns = [
+    "third-party/**",
+]
+
+command = [
+  "python3",
+  "-m",
+  "lintrunner_adapters",
+  "run",
+  "grep_linter",
+  "--pattern=\\bfrom torch\\.ao\\.quantization\\.(?:quantizer|observer|quantize_pt2e|pt2e)(?:\\.[A-Za-z0-9_]+)*\\b",
+  "--linter-name=TorchAOImport",
+  "--error-name=Prohibited torch.ao.quantization import",
+  """--error-description=\
+  Imports from torch.ao.quantization are not allowed. \
+  Please import from torchao.quantization.pt2e instead.\n \
+  * torchao.quantization.pt2e (includes all the utils, including observers, fake quants etc.) \n \
+  * torchao.quantization.pt2e.quantizer (quantizer related objects and utils) \n \
+  * torchao.quantization.pt2e.quantize_pt2e (prepare_pt2e, prepare_qat_pt2e, convert_pt2e) \n\n \
+  If you need something from torch.ao.quantization, you can add your file to an exclude_patterns for TORCH_AO_IMPORT in .lintrunner.toml. \
+  """,
+  "--",
+  "@{{PATHSFILE}}",
+]
@@ -97,3 +97,6 @@ ignore_missing_imports = True
 
 [mypy-zstd]
 ignore_missing_imports = True
+
+[mypy-torchao.*]
+follow_untyped_imports = True
@@ -15,12 +15,12 @@
 )
 
 from executorch.backends.apple.coreml.quantizer import CoreMLQuantizer
-from torch.ao.quantization.quantize_pt2e import (
+from torch.export import export_for_training
+from torchao.quantization.pt2e.quantize_pt2e import (
     convert_pt2e,
     prepare_pt2e,
     prepare_qat_pt2e,
 )
-from torch.export import export_for_training
 
 
 class TestCoreMLQuantizer:
 
@@ -30,25 +30,24 @@
     is_vgf,
 )  # usort: skip
 from executorch.exir.backend.compile_spec_schema import CompileSpec
-from torch.ao.quantization.fake_quantize import (
+from torch.fx import GraphModule, Node
+from torchao.quantization.pt2e import (
     FakeQuantize,
     FusedMovingAvgObsFakeQuantize,
-)
-from torch.ao.quantization.observer import (
     HistogramObserver,
     MinMaxObserver,
     MovingAverageMinMaxObserver,
     MovingAveragePerChannelMinMaxObserver,
+    ObserverOrFakeQuantizeConstructor,
     PerChannelMinMaxObserver,
     PlaceholderObserver,
 )
-from torch.ao.quantization.qconfig import _ObserverOrFakeQuantizeConstructor
-from torch.ao.quantization.quantizer import QuantizationSpec, Quantizer
-from torch.ao.quantization.quantizer.utils import (
-    _annotate_input_qspec_map,
-    _annotate_output_qspec,
+from torchao.quantization.pt2e.quantizer import (
+    annotate_input_qspec_map,
+    annotate_output_qspec,
+    QuantizationSpec,
+    Quantizer,
 )
-from torch.fx import GraphModule, Node
 
 __all__ = [
     "TOSAQuantizer",
@@ -97,7 +96,7 @@ def get_symmetric_quantization_config(
     weight_qscheme = (
         torch.per_channel_symmetric if is_per_channel else torch.per_tensor_symmetric
     )
-    weight_observer_or_fake_quant_ctr: _ObserverOrFakeQuantizeConstructor = (
+    weight_observer_or_fake_quant_ctr: ObserverOrFakeQuantizeConstructor = (
         MinMaxObserver
     )
     if is_qat:
@@ -337,14 +336,14 @@ def _annotate_io(
             if is_annotated(node):
                 continue
             if node.op == "placeholder" and len(node.users) > 0:
-                _annotate_output_qspec(
+                annotate_output_qspec(
                     node,
                     quantization_config.get_output_act_qspec(),
                 )
                 mark_node_as_annotated(node)
             if node.op == "output":
                 parent = node.all_input_nodes[0]
-                _annotate_input_qspec_map(
+                annotate_input_qspec_map(
                     node, parent, quantization_config.get_input_act_qspec()
                 )
                 mark_node_as_annotated(node)
 
@@ -15,10 +15,10 @@
 
 import torch
 from torch._subclasses import FakeTensor
-
-from torch.ao.quantization.quantizer import QuantizationAnnotation
 from torch.fx import GraphModule, Node
 
+from torchao.quantization.pt2e.quantizer import QuantizationAnnotation
+
 
 def is_annotated(node: Node) -> bool:
     """Given a node return whether the node is annotated."""
 
@@ -12,12 +12,13 @@
 import torch.fx
 from executorch.backends.arm.quantizer import QuantizationConfig
 from executorch.backends.arm.tosa_utils import get_node_debug_info
-from torch.ao.quantization.quantizer import QuantizationSpecBase, SharedQuantizationSpec
-from torch.ao.quantization.quantizer.utils import (
-    _annotate_input_qspec_map,
-    _annotate_output_qspec,
-)
 from torch.fx import Node
+from torchao.quantization.pt2e.quantizer import (
+    annotate_input_qspec_map,
+    annotate_output_qspec,
+    QuantizationSpecBase,
+    SharedQuantizationSpec,
+)
 
 from .arm_quantizer_utils import (
     is_annotated,
@@ -118,7 +119,7 @@ def _annotate_input(node: Node, quant_property: _QuantProperty):
         strict=True,
     ):
         assert isinstance(n_arg, Node)
-        _annotate_input_qspec_map(node, n_arg, qspec)
+        annotate_input_qspec_map(node, n_arg, qspec)
         if quant_property.mark_annotated:
             mark_node_as_annotated(n_arg)  # type: ignore[attr-defined]
 
@@ -129,7 +130,7 @@ def _annotate_output(node: Node, quant_property: _QuantProperty):
     assert not quant_property.optional
     assert quant_property.index == 0, "Only one output annotation supported currently"
 
-    _annotate_output_qspec(node, quant_property.qspec)
+    annotate_output_qspec(node, quant_property.qspec)
 
 
 def _match_pattern(
 
@@ -9,9 +9,9 @@
 from dataclasses import dataclass
 
 import torch
-from torch.ao.quantization import ObserverOrFakeQuantize
+from torchao.quantization.pt2e import ObserverOrFakeQuantize
 
-from torch.ao.quantization.quantizer import (
+from torchao.quantization.pt2e.quantizer import (
     DerivedQuantizationSpec,
     FixedQParamsQuantizationSpec,
     QuantizationSpec,
 
@@ -19,8 +19,8 @@
 )
 from executorch.backends.arm.tosa_specification import TosaSpecification
 from executorch.backends.xnnpack.test.tester import Quantize
-from torch.ao.quantization.observer import HistogramObserver
-from torch.ao.quantization.quantizer import QuantizationSpec
+from torchao.quantization.pt2e.observer import HistogramObserver
+from torchao.quantization.pt2e.quantizer import QuantizationSpec
 
 aten_op = "torch.ops.aten.add.Tensor"
 exir_op = "executorch_exir_dialects_edge__ops_aten_add_Tensor"
 
@@ -18,8 +18,8 @@
 )
 from executorch.backends.arm.tosa_specification import TosaSpecification
 from executorch.backends.xnnpack.test.tester import Quantize
-from torch.ao.quantization.observer import HistogramObserver
-from torch.ao.quantization.quantizer import QuantizationSpec
+from torchao.quantization.pt2e.observer import HistogramObserver
+from torchao.quantization.pt2e.quantizer import QuantizationSpec
 
 
 def _get_16_bit_quant_config():
 
@@ -14,8 +14,8 @@
 )
 from executorch.backends.arm.tosa_specification import TosaSpecification
 from executorch.backends.xnnpack.test.tester import Quantize
-from torch.ao.quantization.observer import HistogramObserver
-from torch.ao.quantization.quantizer import QuantizationSpec
+from torchao.quantization.pt2e.observer import HistogramObserver
+from torchao.quantization.pt2e.quantizer import QuantizationSpec
 
 
 def _get_16_bit_quant_config():
Original file line number	Diff line number	Diff line change
`@@ -15,12 +15,12 @@`
`15`	`15`	`)`
`16`	`16`
`17`	`17`	`from executorch.backends.apple.coreml.quantizer import CoreMLQuantizer`
`18`		`-from torch.ao.quantization.quantize_pt2e import (`
	`18`	`+from torch.export import export_for_training`
	`19`	`+from torchao.quantization.pt2e.quantize_pt2e import (`
`19`	`20`	`convert_pt2e,`
`20`	`21`	`prepare_pt2e,`
`21`	`22`	`prepare_qat_pt2e,`
`22`	`23`	`)`
`23`		`-from torch.export import export_for_training`
`24`	`24`
`25`	`25`
`26`	`26`	`class TestCoreMLQuantizer:`
Original file line number	Diff line number	Diff line change
`@@ -18,8 +18,8 @@`
`18`	`18`	`)`
`19`	`19`	`from executorch.backends.arm.tosa_specification import TosaSpecification`
`20`	`20`	`from executorch.backends.xnnpack.test.tester import Quantize`
`21`		`-from torch.ao.quantization.observer import HistogramObserver`
`22`		`-from torch.ao.quantization.quantizer import QuantizationSpec`
	`21`	`+from torchao.quantization.pt2e.observer import HistogramObserver`
	`22`	`+from torchao.quantization.pt2e.quantizer import QuantizationSpec`
`23`	`23`
`24`	`24`
`25`	`25`	`def _get_16_bit_quant_config():`
Original file line number	Diff line number	Diff line change
`@@ -14,8 +14,8 @@`
`14`	`14`	`)`
`15`	`15`	`from executorch.backends.arm.tosa_specification import TosaSpecification`
`16`	`16`	`from executorch.backends.xnnpack.test.tester import Quantize`
`17`		`-from torch.ao.quantization.observer import HistogramObserver`
`18`		`-from torch.ao.quantization.quantizer import QuantizationSpec`
	`17`	`+from torchao.quantization.pt2e.observer import HistogramObserver`
	`18`	`+from torchao.quantization.pt2e.quantizer import QuantizationSpec`
`19`	`19`
`20`	`20`
`21`	`21`	`def _get_16_bit_quant_config():`