Xilinx
diff --git a/‎src/Compiler/OnnxToMlirPasses.cpp‎
Lines changed: 5 additions & 0 deletions b/‎src/Compiler/OnnxToMlirPasses.cpp‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎src/Compiler/OnnxToMlirPasses.hpp‎
Lines changed: 1 addition & 0 deletions b/‎src/Compiler/OnnxToMlirPasses.hpp‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src/Dialect/ONNX/ONNXOps/OpHelper.cpp‎
Lines changed: 68 additions & 0 deletions b/‎src/Dialect/ONNX/ONNXOps/OpHelper.cpp‎
Lines changed: 68 additions & 0 deletions
diff --git a/‎src/Dialect/ONNX/ONNXOps/OpHelper.hpp‎
Lines changed: 5 additions & 0 deletions b/‎src/Dialect/ONNX/ONNXOps/OpHelper.hpp‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎src/Dialect/ONNX/Transforms/CMakeLists.txt‎
Lines changed: 3 additions & 0 deletions b/‎src/Dialect/ONNX/Transforms/CMakeLists.txt‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/Dialect/ONNX/Transforms/QDQAroundOpOpt.cpp‎
Lines changed: 136 additions & 0 deletions b/‎src/Dialect/ONNX/Transforms/QDQAroundOpOpt.cpp‎
Lines changed: 136 additions & 0 deletions
diff --git a/‎src/Dialect/ONNX/Transforms/QDQOpt.cpp‎
Lines changed: 1 addition & 57 deletions b/‎src/Dialect/ONNX/Transforms/QDQOpt.cpp‎
Lines changed: 1 addition & 57 deletions
diff --git a/‎src/Pass/Passes.hpp‎
Lines changed: 1 addition & 0 deletions b/‎src/Pass/Passes.hpp‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src/Tools/onnx-mlir-opt/RegisterPasses.cpp‎
Lines changed: 8 additions & 0 deletions b/‎src/Tools/onnx-mlir-opt/RegisterPasses.cpp‎
Lines changed: 8 additions & 0 deletions
@@ -84,6 +84,11 @@ void addONNXToMLIRPasses(mlir::PassManager &pm, bool targetCPU,
   pm.addPass(onnx_mlir::createSimplifyShapeRelatedOpsPass(
       opts.enableQuarkQuantizedLegalization));
 
+  // Pass for removing Dq and Q around data movement in Dq->op->Q Ops chain
+  if (opts.enableRemoveDqQAroundOp)
+    pm.addPass(createQDQAroundOpOptONNXToONNXPass());
+
+  // Pass for removing redundant Dq->Q Ops chain
   // Passes for removing redundant concat, slice and cast QDQ Ops
   if (opts.enableRemoveDqQOp)
     pm.addPass(createQDQOptONNXToONNXPass());
 
@@ -17,6 +17,7 @@ struct OnnxToMlirOptions {
   bool enableConvTransposeDecomposeToPhasedConv = false;
   bool enableConvTranspose1dDecomposeToPhasedConv = false;
   bool enableRemoveDqQOp = true;
+  bool enableRemoveDqQAroundOp = true;
 
   bool disableRecomposeOption = false;
   bool enableONNXHybridPass = true;
 
@@ -17,6 +17,7 @@
 #include "llvm/ADT/TypeSwitch.h"
 #include "llvm/Support/Path.h"
 
+#include "mlir/IR/BuiltinTypes.h"
 #include "src/Dialect/Mlir/IndexExpr.hpp"
 #include "src/Dialect/ONNX/DialectBuilder.hpp"
 #include "src/Dialect/ONNX/ONNXLayoutHelper.hpp"
@@ -315,6 +316,25 @@ ElementsAttr getElementAttributeFromONNXValue(Value value) {
   return nullptr;
 }
 
+// compare two ElementsAttr, except for their internal buffer size
+bool compareValueFromElementAttribute(
+    ElementsAttr &attr1, ElementsAttr &attr2) {
+  if (attr1.getType() != attr2.getType()) {
+    return false;
+  }
+  if (attr1.getNumElements() != attr2.getNumElements()) {
+    return false;
+  }
+  auto it1 = attr1.getValues<mlir::Attribute>().begin();
+  auto it2 = attr2.getValues<mlir::Attribute>().begin();
+  for (; it1 != attr1.getValues<mlir::Attribute>().end(); ++it1, ++it2) {
+    if (*it1 != *it2) {
+      return false;
+    }
+  }
+  return true;
+}
+
 // Returns the ConstantOp which defines an MLIR Value or null.
 ONNXConstantOp getONNXConstantOp(Value value) {
   return mlir::dyn_cast_or_null<ONNXConstantOp>(value.getDefiningOp());
@@ -854,6 +874,54 @@ bool isIdentityReshape(
   return isIdentityReshape(inputTensor, outputTensor, dimAnalysis);
 }
 
+bool isDequantQuantSame(
+    mlir::ONNXDequantizeLinearOp dqOp, mlir::ONNXQuantizeLinearOp qOp) {
+
+  // 1. Check Attributes
+  if (qOp.getAxis() != dqOp.getAxis())
+    return false;
+  if (qOp.getBlockSize() != dqOp.getBlockSize())
+    return false;
+
+  // 2. Check zero-points
+  auto zpAttr1 = getElementAttributeFromONNXValue(dqOp.getXZeroPoint());
+  auto zpAttr2 = getElementAttributeFromONNXValue(qOp.getYZeroPoint());
+  if (!zpAttr1 || !zpAttr2)
+    return false;
+
+  if (!compareValueFromElementAttribute(zpAttr1, zpAttr2)) {
+    return false;
+  }
+  // 3. Check Scales.
+  auto scaleAttr1 = getElementAttributeFromONNXValue(dqOp.getXScale());
+  auto scaleAttr2 = getElementAttributeFromONNXValue(qOp.getYScale());
+  if (!scaleAttr1 || !scaleAttr2)
+    return false;
+
+  if (!compareValueFromElementAttribute(scaleAttr1, scaleAttr2)) {
+    return false;
+  }
+
+  // 4. Check data type consistency of the entire DQ->Q chain.
+  // The original quantized type before DQ must match the final quantized
+  // type after Q.
+  auto dqInTypeOp = dqOp.getX().getType();
+  auto qOutTypeOp = qOp.getResult().getType();
+
+  if (auto dqInTensorType = mlir::dyn_cast<TensorType>(dqInTypeOp)) {
+    if (auto qOutTensorType = mlir::dyn_cast<TensorType>(qOutTypeOp)) {
+      if (qOutTensorType.getElementType() != dqInTensorType.getElementType()) {
+        return false;
+      }
+    } else {
+      return false;
+    }
+  } else {
+    return false;
+  }
+  return true;
+}
+
 //===----------------------------------------------------------------------===//
 // Support for location.
 //===----------------------------------------------------------------------===//
 
@@ -174,6 +174,9 @@ void ArrayAttrIntVals(mlir::ArrayAttr a, mlir::SmallVectorImpl<int64_t> &i);
 
 mlir::ElementsAttr getElementAttributeFromONNXValue(mlir::Value value);
 
+bool compareValueFromElementAttribute(
+    mlir::ElementsAttr &attr1, mlir::ElementsAttr &attr2);
+
 mlir::ONNXConstantOp getONNXConstantOp(mlir::Value value);
 
 // Obtain an array of int64_t values stored in ONNXConstantOp and append it to
@@ -397,6 +400,8 @@ bool isIdentityReshape(
 bool isIdentityReshape(mlir::Value input, mlir::Value output,
     const DimAnalysis *dimAnalysis = nullptr);
 
+bool isDequantQuantSame(
+    mlir::ONNXDequantizeLinearOp dqOp, mlir::ONNXQuantizeLinearOp qOp);
 //===----------------------------------------------------------------------===//
 // Support for location.
 //===----------------------------------------------------------------------===//
 
@@ -7,6 +7,8 @@ add_onnx_mlir_rewriter(DecomposeConvTranspose1dPhased)
 
 add_onnx_mlir_rewriter(ConstProp)
 add_onnx_mlir_rewriter(ConvOpt)
+add_onnx_mlir_rewriter(QDQAroundOpOpt)
+add_onnx_mlir_rewriter(QDQOpt)
 
 add_onnx_mlir_library(OMShapeInference
   ShapeInference.cpp
@@ -42,6 +44,7 @@ add_onnx_mlir_library(OMInstrumentONNX
 
 add_onnx_mlir_library(OMONNXRewrite
   ConstProp.cpp
+  QDQAroundOpOpt.cpp    
   QDQOpt.cpp    
   ConvOpt.cpp
   Decompose.cpp
 
@@ -0,0 +1,136 @@
+//===- QDQAroundOpOpt.cpp - Remove DQ, Q operations around data movement ops
+//--------*- C++ -*-===//
+//
+// (c) Copyright 2022 - 2025 Advanced Micro Devices, Inc. All Rights Reserved.
+//
+//===----------------------------------------------------------------------===//
+
+#include <cmath>
+#include <mlir/IR/IRMapping.h>
+#include <mlir/IR/Operation.h>
+#include <mlir/IR/PatternMatch.h>
+#include <mlir/Pass/Pass.h>
+#include <mlir/Transforms/DialectConversion.h>
+#include <mlir/Transforms/GreedyPatternRewriteDriver.h>
+#include <src/Dialect/ONNX/ONNXOps.hpp>
+#include <src/Dialect/ONNX/ONNXOps/OpHelper.hpp>
+
+using namespace mlir;
+using namespace onnx_mlir;
+struct InputAndOutput {
+  Value input;
+  Value output;
+};
+
+InputAndOutput getDataInputOutput(ONNXTransposeOp transposeOp) {
+  return {transposeOp.getData(), transposeOp.getTransposed()};
+}
+InputAndOutput getDataInputOutput(ONNXUnsqueezeOp unsqueezeOp) {
+  return {unsqueezeOp.getData(), unsqueezeOp.getExpanded()};
+}
+InputAndOutput getDataInputOutput(ONNXSqueezeOp squeezeOp) {
+  return {squeezeOp.getData(), squeezeOp.getSqueezed()};
+}
+InputAndOutput getDataInputOutput(ONNXReshapeOp reshapeOp) {
+  return {reshapeOp.getData(), reshapeOp.getReshaped()};
+}
+InputAndOutput getDataInputOutput(ONNXGatherOp gatherOp) {
+  return {gatherOp.getData(), gatherOp.getOutput()};
+}
+InputAndOutput getDataInputOutput(ONNXSliceOp sliceOp) {
+  return {sliceOp.getData(), sliceOp.getOutput()};
+}
+InputAndOutput getDataInputOutput(ONNXResizeOp resizeOp) {
+  return {resizeOp.getX(), resizeOp.getY()};
+}
+InputAndOutput getDataInputOutput(ONNXFlattenOp flattenOp) {
+  return {flattenOp.getInput(), flattenOp.getOutput()};
+}
+namespace {
+template <typename T>
+class RemoveQDQAroundOpPattern : public OpRewritePattern<T> {
+public:
+  using OpRewritePattern<T>::OpRewritePattern;
+
+  LogicalResult matchAndRewrite(
+      T op, PatternRewriter &rewriter) const override {
+    if (llvm::isa<ONNXResizeOp>(op)) {
+      auto &resizeOp = llvm::cast<ONNXResizeOp>(op);
+      if (resizeOp.getMode() != "nearest") {
+        return failure();
+      }
+    }
+    InputAndOutput opIO = getDataInputOutput(op);
+
+    auto dqOp = opIO.input.getDefiningOp<ONNXDequantizeLinearOp>();
+    // Only run this pass if Quantizelization is on tensor
+    if (!dqOp || !isScalarConstantTensor(dqOp.getXScale()) ||
+        !isScalarConstantTensor(dqOp.getXZeroPoint())) {
+      return failure();
+    }
+    if (!opIO.output.hasOneUse()) {
+      return failure();
+    }
+
+    Operation *firstOp = *(opIO.output.getUsers().begin());
+    if (auto qOp = dyn_cast<ONNXQuantizeLinearOp>(firstOp)) {
+      if (!isScalarConstantTensor(qOp.getYScale()) ||
+          !isScalarConstantTensor(qOp.getYZeroPoint())) {
+        return failure();
+      }
+      if (!isDequantQuantSame(dqOp, qOp))
+        return failure();
+
+      // Map dqOp inputs to dqOp's inputs
+      IRMapping irMapping;
+      irMapping.map(dqOp, dqOp.getX());
+
+      SmallVector<Value> newInputs;
+      transform(op->getOperands(), std::back_inserter(newInputs),
+          [&](Value operand) { return irMapping.lookupOrDefault(operand); });
+
+      auto newOp =
+          rewriter.create<T>(op.getLoc(), TypeRange{qOp.getResult().getType()},
+              ValueRange{newInputs}, op->getAttrs());
+      rewriter.replaceOp(qOp, newOp.getResult());
+      return success();
+    }
+  };
+};
+struct QDQAroundOpOptONNXToONNXPass
+    : public PassWrapper<QDQAroundOpOptONNXToONNXPass,
+          OperationPass<func::FuncOp>> {
+  MLIR_DEFINE_EXPLICIT_INTERNAL_INLINE_TYPE_ID(QDQAroundOpOptONNXToONNXPass)
+  StringRef getArgument() const override {
+    return "qdq-around-op-opt-onnx-to-onnx";
+  }
+  StringRef getDescription() const override {
+    return "Remove QDQ around ops if safe.";
+  }
+
+  void runOnOperation() override {
+    auto function = getOperation();
+    auto *ctx = &getContext();
+    RewritePatternSet patterns(ctx);
+    // ONNXReduceSumOp is expecting high precision value, it failed to compile
+    // during applying this pass, so for now there is no dq, q removal around
+    // ReduceSum
+    patterns.add<RemoveQDQAroundOpPattern<ONNXTransposeOp>,
+        RemoveQDQAroundOpPattern<ONNXUnsqueezeOp>,
+        RemoveQDQAroundOpPattern<ONNXSqueezeOp>,
+        RemoveQDQAroundOpPattern<ONNXReshapeOp>,
+        RemoveQDQAroundOpPattern<ONNXResizeOp>,
+        RemoveQDQAroundOpPattern<ONNXGatherOp>,
+        RemoveQDQAroundOpPattern<ONNXSliceOp>,
+        RemoveQDQAroundOpPattern<ONNXFlattenOp>>(patterns.getContext());
+    if (failed(applyPatternsGreedily(function, std::move(patterns))))
+      signalPassFailure();
+  }
+};
+} // namespace
+
+namespace onnx_mlir {
+std::unique_ptr<mlir::Pass> createQDQAroundOpOptONNXToONNXPass() {
+  return std::make_unique<QDQAroundOpOptONNXToONNXPass>();
+}
+} // namespace onnx_mlir
@@ -4,37 +4,20 @@
 //
 //===----------------------------------------------------------------------===//
 
-#include "mlir/IR/Attributes.h"
-#include "mlir/IR/BuiltinTypes.h"
-#include "mlir/IR/Operation.h"
 #include "mlir/IR/PatternMatch.h"
 #include "mlir/Pass/Pass.h"
 #include "mlir/Transforms/GreedyPatternRewriteDriver.h"
 #include "src/Dialect/ONNX/ONNXOps.hpp"
 #include "src/Dialect/ONNX/ONNXOps/OpHelper.hpp"
 #include "src/Pass/Passes.hpp"
 
-#include "llvm/ADT/STLExtras.h"
-#include "llvm/ADT/SmallSet.h"
 #include <cmath>
 
 using namespace mlir;
 using namespace onnx_mlir;
 
 namespace {
 
-//===----------------------------------------------------------------------===//
-// Helper Functions
-//===----------------------------------------------------------------------===//
-
-static ElementsAttr getElementAttributeFromConstant(Value val) {
-  if (!val)
-    return nullptr;
-  if (auto constOp = val.getDefiningOp<ONNXConstantOp>())
-    return mlir::dyn_cast<ElementsAttr>(constOp.getValueAttr());
-  return nullptr;
-}
-
 //===----------------------------------------------------------------------===//
 // Pattern to remove QDQ pairs
 //===----------------------------------------------------------------------===//
@@ -47,47 +30,8 @@ struct FoldQDQPattern : public OpRewritePattern<ONNXQuantizeLinearOp> {
     auto dqOp = qOp.getX().getDefiningOp<ONNXDequantizeLinearOp>();
     if (!dqOp)
       return failure();
-
-    // 1. Check Attributes
-    if (qOp.getAxis() != dqOp.getAxis())
-      return failure();
-    if (qOp.getBlockSize() != dqOp.getBlockSize())
-      return failure();
-
-    // 2. Check zero-points
-    auto zpAttr1 = getElementAttributeFromConstant(dqOp.getXZeroPoint());
-    auto zpAttr2 = getElementAttributeFromConstant(qOp.getYZeroPoint());
-    if (!zpAttr1 && !zpAttr2)
-      return failure();
-    if (zpAttr1 != zpAttr2)
-      return failure();
-
-    // 3. Check Scales.
-    auto scaleAttr1 = getElementAttributeFromConstant(dqOp.getXScale());
-    auto scaleAttr2 = getElementAttributeFromConstant(qOp.getYScale());
-    if (!scaleAttr1 && !scaleAttr2)
-      return failure();
-    if (scaleAttr1 != scaleAttr2)
-      return failure();
-
-    // 4. Check data type consistency of the entire DQ->Q chain.
-    // The original quantized type before DQ must match the final quantized
-    // type after Q.
-    auto dqInTypeOp = dqOp.getX().getType();
-    auto qOutTypeOp = qOp.getResult().getType();
-
-    if (auto dqInTensorType = dqInTypeOp.dyn_cast<TensorType>()) {
-      if (auto qOutTensorType = qOutTypeOp.dyn_cast<TensorType>()) {
-        if (qOutTensorType.getElementType() !=
-            dqInTensorType.getElementType()) {
-          return failure();
-        }
-      } else {
-        return failure();
-      }
-    } else {
+    if (!isDequantQuantSame(dqOp, qOp))
       return failure();
-    }
     rewriter.replaceOp(qOp, dqOp.getX());
     return success();
   }
 
@@ -54,6 +54,7 @@ void configureConstPropONNXToONNXPass(bool roundFPToInt, int expansionBound,
     llvm::ArrayRef<std::string> disabledPatterns, bool constantPropIsDisabled);
 
 std::unique_ptr<mlir::Pass> createConstPropONNXToONNXPass();
+std::unique_ptr<mlir::Pass> createQDQAroundOpOptONNXToONNXPass();
 
 std::unique_ptr<mlir::Pass> createQDQOptONNXToONNXPass();
 
 
@@ -71,6 +71,14 @@ void registerOMPasses(int optLevel) {
     return createQDQOptONNXToONNXPass();
   });
 
+  mlir::registerPass([]() -> std::unique_ptr<mlir::Pass> {
+    return createQDQAroundOpOptONNXToONNXPass();
+  });
+
+  mlir::registerPass([]() -> std::unique_ptr<mlir::Pass> {
+    return createQDQOptONNXToONNXPass();
+  });
+
   mlir::registerPass(
       []() -> std::unique_ptr<mlir::Pass> { return createInstrumentPass(); });