attr chk simplified, renaming, add flag

sushmita · sushmita · commit ab6bb161e750 · 2025-08-14T04:35:07.000-05:00
diff --git a/src/Compiler/CompilerPasses.cpp b/src/Compiler/CompilerPasses.cpp
@@ -142,7 +142,8 @@ void addONNXToMLIRPasses(mlir::PassManager &pm, bool targetCPU,
       opts.enableQuarkQuantizedLegalization));
 
   // Passes for removing redundant concat, slice and cast QDQ Ops
-  pm.addPass(createQDQOptONNXToONNXPass());
+  if (opts.enableRemoveDqQOp)
+    pm.addPass(createQDQOptONNXToONNXPass());
 
   // One more call to ONNX shape inference/canonicalization/... to update
   // shape if possible.
diff --git a/src/Compiler/CompilerPasses.hpp b/src/Compiler/CompilerPasses.hpp
@@ -30,6 +30,7 @@ struct OnnxToMlirOptions {
   bool enableConvTransposeDecompose = false;
   bool enableConvTransposeDecomposeToPhasedConv = false;
   bool enableConvTranspose1dDecomposeToPhasedConv = false;
+  bool enableRemoveDqQOp = true;
 };
 
 void addONNXToMLIRPasses(mlir::PassManager &pm, bool targetCPU,
diff --git a/src/Dialect/ONNX/Transforms/QDQOpt.cpp b/src/Dialect/ONNX/Transforms/QDQOpt.cpp
@@ -35,70 +35,6 @@ static ElementsAttr getElementAttributeFromConstant(Value val) {
   return nullptr;
 }
 
-static mlir::LogicalResult equalsDefaultIntegerAttr(
-    mlir::IntegerAttr ia, int64_t defaultValue) {
-  auto it = mlir::cast<mlir::IntegerType>(ia.getType());
-  int64_t got = it.isUnsignedInteger()
-                    ? static_cast<int64_t>(ia.getValue().getZExtValue())
-                    : ia.getValue().getSExtValue();
-  return (got == defaultValue) ? mlir::success() : mlir::failure();
-}
-
-static mlir::LogicalResult equalsDefaultIntElements(
-    mlir::ElementsAttr ea, int64_t defaultValue) {
-  auto st = mlir::dyn_cast<mlir::ShapedType>(ea.getType());
-  if (!st)
-    return mlir::failure();
-  mlir::Type et = st.getElementType();
-  if (!et.isIntOrIndex())
-    return mlir::failure();
-  const bool isUnsigned = et.isa<mlir::IntegerType>() &&
-                          et.cast<mlir::IntegerType>().isUnsignedInteger();
-  if (ea.isSplat()) {
-    llvm::APInt api = ea.getSplatValue<llvm::APInt>();
-    int64_t got = isUnsigned ? static_cast<int64_t>(api.getZExtValue())
-                             : api.getSExtValue();
-    return (got == defaultValue) ? mlir::success() : mlir::failure();
-  }
-  for (const llvm::APInt &api : ea.getValues<llvm::APInt>()) {
-    int64_t got = isUnsigned ? static_cast<int64_t>(api.getZExtValue())
-                             : api.getSExtValue();
-    if (got != defaultValue)
-      return mlir::failure();
-  }
-  return mlir::success();
-}
-
-static mlir::LogicalResult checkAttrAgainstDefault(
-    mlir::Attribute attr, int64_t defaultValue) {
-  if (!attr)
-    return mlir::failure();
-  if (auto ia = mlir::dyn_cast<mlir::IntegerAttr>(attr))
-    return equalsDefaultIntegerAttr(ia, defaultValue);
-  if (auto ea = mlir::dyn_cast<mlir::ElementsAttr>(attr))
-    return equalsDefaultIntElements(ea, defaultValue);
-  return mlir::failure();
-}
-
-static mlir::LogicalResult checkIntegerAttributeEquals(mlir::Operation *op1,
-    mlir::Operation *op2, mlir::StringRef attrName, int64_t defaultValue) {
-  mlir::Attribute attr1 = op1->getAttr(attrName);
-  mlir::Attribute attr2 = op2->getAttr(attrName);
-  // Case 0: both missing => both implicitly default
-  if (!attr1 && !attr2)
-    return mlir::success();
-  // Case 1: both present and identical
-  if (attr1 && attr2 && attr1 == attr2)
-    return mlir::success();
-  // Case 2: one side missing => present side must equal default
-  if (!attr1)
-    return checkAttrAgainstDefault(attr2, defaultValue);
-  if (!attr2)
-    return checkAttrAgainstDefault(attr1, defaultValue);
-  // Case 3: both present but not identical
-  return mlir::failure();
-}
-
 //===----------------------------------------------------------------------===//
 // Pattern to remove QDQ pairs
 //===----------------------------------------------------------------------===//
@@ -107,23 +43,16 @@ struct FoldQDQPattern : public OpRewritePattern<ONNXQuantizeLinearOp> {
   using OpRewritePattern<ONNXQuantizeLinearOp>::OpRewritePattern;
   LogicalResult matchAndRewrite(
       ONNXQuantizeLinearOp qOp, PatternRewriter &rewriter) const override {
+
     auto dqOp = qOp.getX().getDefiningOp<ONNXDequantizeLinearOp>();
     if (!dqOp)
       return failure();
 
-    // 1. Check attributes with defaults (axis=1, block_size=0,
-    // saturate=1)
-    Operation *dqOperation = dqOp.getOperation();
-    Operation *qOperation = qOp.getOperation();
-
-    if (failed(
-            checkIntegerAttributeEquals(dqOperation, qOperation, "axis", 1)) ||
-        failed(checkIntegerAttributeEquals(
-            dqOperation, qOperation, "block_size", 0)) ||
-        failed(checkIntegerAttributeEquals(
-            dqOperation, qOperation, "saturate", 1))) {
+    // 1. Check Attributes
+    if (qOp.getAxis() != dqOp.getAxis())
+      return failure();
+    if (qOp.getBlockSize() != dqOp.getBlockSize())
       return failure();
-    }
 
     // 2. Check zero-points
     auto zpAttr1 = getElementAttributeFromConstant(dqOp.getXZeroPoint());
@@ -172,9 +101,9 @@ struct QDQOptONNXToONNXPass
     : public PassWrapper<QDQOptONNXToONNXPass, OperationPass<func::FuncOp>> {
 
   MLIR_DEFINE_EXPLICIT_INTERNAL_INLINE_TYPE_ID(QDQOptONNXToONNXPass)
-  StringRef getArgument() const override { return "qdq-opt-onnx-to-onnx"; }
+  StringRef getArgument() const override { return "dqq-opt-onnx-to-onnx"; }
   StringRef getDescription() const override {
-    return "Remove QDQ ops and surrounding QDQ if safe.";
+    return "Remove DqQ ops and surrounding DqQ if safe.";
   }
 
   void runOnOperation() override {
diff --git a/test/mlir/onnx/onnx_remove_cast.mlir b/test/mlir/onnx/onnx_remove_cast.mlir
@@ -1,27 +1,27 @@
-// RUN: onnx-mlir-opt --canonicalize --qdq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
+// RUN: onnx-mlir-opt --canonicalize --dqq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
 
-  func.func @test_cast_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16> {
-    %0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
-    %1 = onnx.Constant dense<39664> : tensor<ui16>
-    %2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
-    %3 = "onnx.Cast"(%2) {saturate = 1 : si64, to = f32} : (tensor<*xf32>) -> tensor<*xf32>
-    %4 = "onnx.QuantizeLinear"(%3, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
-    return %4 : tensor<*xui16>
-  }
+func.func @test_cast_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16> {
+%0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
+%1 = onnx.Constant dense<39664> : tensor<ui16>
+%2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
+%3 = "onnx.Cast"(%2) {saturate = 1 : si64, to = f32} : (tensor<*xf32>) -> tensor<*xf32>
+%4 = "onnx.QuantizeLinear"(%3, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
+return %4 : tensor<*xui16>
+}
 
-  // CHECK-LABEL: func.func @test_cast_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16>
-  // CHECK-NOT: onnx.DequantizeLinear
-  // CHECK-NOT: onnx.Cast
-  // CHECK-NOT: onnx.QuantizeLinear
+// CHECK-LABEL: func.func @test_cast_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16>
+// CHECK-NOT: onnx.DequantizeLinear
+// CHECK-NOT: onnx.Cast
+// CHECK-NOT: onnx.QuantizeLinear
 
 func.func @test_cast_pattern2(%arg0: tensor<*xui16>) -> tensor<*xui16> {
-  %0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
-  %1 = onnx.Constant dense<39664> : tensor<ui16>
-  %2 = "onnx.Cast"(%arg0) {saturate = 1 : si64, to = f32} : (tensor<*xui16>) -> tensor<*xf32>
-  %3 = "onnx.QuantizeLinear"(%2, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
-  return %3 : tensor<*xui16>
+%0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
+%1 = onnx.Constant dense<39664> : tensor<ui16>
+%2 = "onnx.Cast"(%arg0) {saturate = 1 : si64, to = f32} : (tensor<*xui16>) -> tensor<*xf32>
+%3 = "onnx.QuantizeLinear"(%2, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
+return %3 : tensor<*xui16>
 }
 
 // CHECK-LABEL: func.func @test_cast_pattern2(%arg0: tensor<*xui16>) -> tensor<*xui16>
 // CHECK: onnx.Cast
-// CHECK: onnx.QuantizeLinear
+// CHECK: onnx.QuantizeLinear
diff --git a/test/mlir/onnx/onnx_remove_concat.mlir b/test/mlir/onnx/onnx_remove_concat.mlir
@@ -1,31 +1,31 @@
-// RUN: onnx-mlir-opt --canonicalize --qdq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
+// RUN: onnx-mlir-opt --canonicalize --dqq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
 
-  func.func @test_concat_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16> {
-    %0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
-    %1 = onnx.Constant dense<39664> : tensor<ui16>
-    %2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
-    %3 = "onnx.Concat"(%2) {axis = 1 : si64} : (tensor<*xf32>) -> tensor<*xf32>
-    %4 = "onnx.QuantizeLinear"(%3, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
-    return %4 : tensor<*xui16>
-  }
+func.func @test_concat_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16> {
+%0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
+%1 = onnx.Constant dense<39664> : tensor<ui16>
+%2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
+%3 = "onnx.Concat"(%2) {axis = 1 : si64} : (tensor<*xf32>) -> tensor<*xf32>
+%4 = "onnx.QuantizeLinear"(%3, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
+return %4 : tensor<*xui16>
+}
 
-  // CHECK-LABEL: func.func @test_concat_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16>
-  // CHECK-NOT: onnx.DequantizeLinear
-  // CHECK-NOT: onnx.Concat
-  // CHECK-NOT: onnx.QuantizeLinear
-  // CHECK: return %arg0 : tensor<*xui16>
+// CHECK-LABEL: func.func @test_concat_pattern1(%arg0: tensor<*xui16>) -> tensor<*xui16>
+// CHECK-NOT: onnx.DequantizeLinear
+// CHECK-NOT: onnx.Concat
+// CHECK-NOT: onnx.QuantizeLinear
+// CHECK: return %arg0 : tensor<*xui16>
 
 func.func @test_concat_pattern2(%arg0: tensor<*xui16>) -> tensor<*xui16> {
-    %0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
-    %1 = onnx.Constant dense<39664> : tensor<ui16>
-    %2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
-    %3 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
-    %4 = "onnx.Concat"(%2, %3) {axis = 1 : si64} : (tensor<*xf32>, tensor<*xf32>) -> tensor<*xf32>
-    %5 = "onnx.QuantizeLinear"(%4, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
-    return %5 : tensor<*xui16>
-  }
+%0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
+%1 = onnx.Constant dense<39664> : tensor<ui16>
+%2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
+%3 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<*xui16>, tensor<f32>, tensor<ui16>) -> tensor<*xf32>
+%4 = "onnx.Concat"(%2, %3) {axis = 1 : si64} : (tensor<*xf32>, tensor<*xf32>) -> tensor<*xf32>
+%5 = "onnx.QuantizeLinear"(%4, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 1 : si64} : (tensor<*xf32>, tensor<f32>, tensor<ui16>) -> tensor<*xui16>
+return %5 : tensor<*xui16>
+}
 
-  // CHECK-LABEL: func.func @test_concat_pattern2(%arg0: tensor<*xui16>) -> tensor<*xui16>
-  // CHECK: onnx.DequantizeLinear
-  // CHECK: onnx.Concat
-  // CHECK: onnx.QuantizeLinear
+// CHECK-LABEL: func.func @test_concat_pattern2(%arg0: tensor<*xui16>) -> tensor<*xui16>
+// CHECK: onnx.DequantizeLinear
+// CHECK: onnx.Concat
+// CHECK: onnx.QuantizeLinear
diff --git a/test/mlir/onnx/onnx_remove_dqq.mlir b/test/mlir/onnx/onnx_remove_dqq.mlir
@@ -1,4 +1,4 @@
-// RUN: onnx-mlir-opt --qdq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
+// RUN: onnx-mlir-opt --dqq-opt-onnx-to-onnx %s -split-input-file | FileCheck %s
 
 func.func @test_qdq_pattern1(%arg0: tensor<1x128x768xui16>) -> tensor<1x128x768xui16> {
 %0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
@@ -54,19 +54,6 @@ return %3 : tensor<1x128x768xui16>
 // CHECK: onnx.DequantizeLinear
 // CHECK: onnx.QuantizeLinear
 
-func.func @test_qdq_pattern5(%arg0: tensor<1x128x768xui16>) -> tensor<1x128x768xui16> {
-%0 = onnx.Constant dense<2.57987776E-5> : tensor<f32>
-%1 = onnx.Constant dense<39664> : tensor<ui16>
-%2 = "onnx.DequantizeLinear"(%arg0, %0, %1) {axis = 1 : si64, block_size = 0 : si64} : (tensor<1x128x768xui16>, tensor<f32>, tensor<ui16>) -> tensor<1x128x768xf32>
-%3 = "onnx.QuantizeLinear"(%2, %0, %1) {axis = 1 : si64, block_size = 0 : si64, output_dtype = 0 : si64, saturate = 2 : si64} : (tensor<1x128x768xf32>, tensor<f32>, tensor<ui16>) -> tensor<1x128x768xui16>
-return %3 : tensor<1x128x768xui16>
-
-}
-
-// CHECK-LABEL: func.func @test_qdq_pattern5(%arg0: tensor<1x128x768xui16>) -> tensor<1x128x768xui16>
-// CHECK: onnx.DequantizeLinear
-// CHECK: onnx.QuantizeLinear
-
 func.func @test_qdq_pattern6(%arg0: tensor<1x128x768xui16>, %arg1: tensor<f32>) -> tensor<1x128x768xui16> {
 %0 = onnx.Constant dense<39664> : tensor<ui16>
 %1 = "onnx.DequantizeLinear"(%arg0, %arg1, %0) {axis = 1 : si64, block_size = 0 : si64} : (tensor<1x128x768xui16>, tensor<f32>, tensor<ui16>) -> tensor<1x128x768xf32>
diff --git a/test/mlir/onnx/onnx_remove_slice.mlir b/test/mlir/onnx/onnx_remove_slice.mlir