microsoft
diff --git a/‎.lintrunner.toml‎
Lines changed: 1 addition & 1 deletion b/‎.lintrunner.toml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎onnxscript/rewriter/generic_pattern.py‎
Lines changed: 2 additions & 0 deletions b/‎onnxscript/rewriter/generic_pattern.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎onnxscript/rewriter/onnxruntime/xformers/__init__.py‎
Lines changed: 0 additions & 21 deletions b/‎onnxscript/rewriter/onnxruntime/xformers/__init__.py‎
Lines changed: 0 additions & 21 deletions
diff --git a/‎onnxscript/rewriter/onnxruntime/xformers/fuse_xformers.py‎
Lines changed: 0 additions & 19 deletions b/‎onnxscript/rewriter/onnxruntime/xformers/fuse_xformers.py‎
Lines changed: 0 additions & 19 deletions
diff --git a/‎onnxscript/rewriter/onnxruntime/xformers/mha.py‎
Lines changed: 0 additions & 178 deletions b/‎onnxscript/rewriter/onnxruntime/xformers/mha.py‎
Lines changed: 0 additions & 178 deletions
diff --git a/‎onnxscript/rewriter/ort_fusions/__init__.py‎
Lines changed: 9 additions & 0 deletions b/‎onnxscript/rewriter/ort_fusions/__init__.py‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎onnxscript/rewriter/ort_fusions/_core.py‎
Lines changed: 28 additions & 0 deletions b/‎onnxscript/rewriter/ort_fusions/_core.py‎
Lines changed: 28 additions & 0 deletions
diff --git a/‎…writer/onnxruntime/xformers/_smollm_1.py‎ ‎…script/rewriter/ort_fusions/_smollm_1.py‎onnxscript/rewriter/onnxruntime/xformers/_smollm_1.py renamed to onnxscript/rewriter/ort_fusions/_smollm_1.py b/‎…writer/onnxruntime/xformers/_smollm_1.py‎ ‎…script/rewriter/ort_fusions/_smollm_1.py‎onnxscript/rewriter/onnxruntime/xformers/_smollm_1.py renamed to onnxscript/rewriter/ort_fusions/_smollm_1.py
diff --git a/‎…writer/onnxruntime/xformers/_smollm_2.py‎ ‎…script/rewriter/ort_fusions/_smollm_2.py‎onnxscript/rewriter/onnxruntime/xformers/_smollm_2.py renamed to onnxscript/rewriter/ort_fusions/_smollm_2.py b/‎…writer/onnxruntime/xformers/_smollm_2.py‎ ‎…script/rewriter/ort_fusions/_smollm_2.py‎onnxscript/rewriter/onnxruntime/xformers/_smollm_2.py renamed to onnxscript/rewriter/ort_fusions/_smollm_2.py
diff --git a/‎…ter/onnxruntime/xformers/_test_models.py‎ ‎…ipt/rewriter/ort_fusions/_test_models.py‎onnxscript/rewriter/onnxruntime/xformers/_test_models.py renamed to onnxscript/rewriter/ort_fusions/_test_models.py b/‎…ter/onnxruntime/xformers/_test_models.py‎ ‎…ipt/rewriter/ort_fusions/_test_models.py‎onnxscript/rewriter/onnxruntime/xformers/_test_models.py renamed to onnxscript/rewriter/ort_fusions/_test_models.py
@@ -50,7 +50,7 @@ exclude_patterns = [
     'onnxscript/optimizer/_legacy/constant_folding.py',  # FIXME
     'onnxscript/rewriter/onnxruntime/transformers/fastgelu.py',  # FIXME
     'onnxscript/rewriter/onnxruntime/instance_to_group_normalization.py',  # FIXME
-    'onnxscript/rewriter/onnxruntime/xformers/_smollm_*.py',  # onnxscript code
+    'onnxscript/rewriter/ort_fusions/_smollm_*.py',  # onnxscript code
     'onnxscript/_legacy_ir/irbuilder.py',  # FIXME
     'onnxscript/rewriter/onnxruntime/transformers/multihead_attention.py',  # FIXME
     'onnxscript/tools/function_unittest_producer.py',  # FIXME
 
@@ -549,8 +549,10 @@ def match(
         model: ir.Model,
         graph_or_function: ir.Graph | ir.Function,
         node: ir.Node,
+        *,
         verbose: int = 0,
         remove_nodes: bool = True,
+        tracer: orp.MatchingTracer | None = None,
     ) -> orp.MatchResult | None:
         if not remove_nodes:
             raise NotImplementedError(
 
@@ -0,0 +1,9 @@
+# Copyright (c) Microsoft Corporation.
+# Licensed under the MIT License.
+"""Fusion optimizations for ORT backend."""
+
+__all__ = [
+    "optimize_for_ort",
+]
+
+from onnxscript.rewriter.ort_fusions._core import optimize_for_ort
@@ -0,0 +1,28 @@
+# Copyright (c) Microsoft Corporation.
+# Licensed under the MIT License.
+from __future__ import annotations
+
+import onnxscript.ir as ir
+from onnxscript.optimizer import optimize, remove_unused_nodes
+from onnxscript.rewriter.ort_fusions.cos_sin_cache import fuse_cos_sin_cache
+from onnxscript.rewriter.ort_fusions.mha import fuse_mha
+from onnxscript.rewriter.ort_fusions.rms_normalization import fuse_rms_normalization
+from onnxscript.rewriter.ort_fusions.rotary_embedding import fuse_rotary_embedding
+from onnxscript.rewriter.ort_fusions.sdpa import fuse_sdpa
+from onnxscript.rewriter.ort_fusions.skip_normalization import fuse_normalization
+
+
+def fuse_xformers(model: ir.Model) -> None:
+    optimize(model)
+    fuse_rms_normalization(model)
+    fuse_normalization(model)
+    fuse_rotary_embedding(model)
+    fuse_cos_sin_cache(model)
+    fuse_sdpa(model)
+    fuse_mha(model)
+    remove_unused_nodes(model)
+
+
+def optimize_for_ort(model: ir.Model) -> None:
+    # TODO(rama): Include the other optimizations
+    fuse_xformers(model)