clang format

dhernandez0 · dhernandez0 · commit a7a804e8804f · 2025-04-07T14:22:50.000Z
diff --git a/mlir/include/mlir/Dialect/Rock/IR/GemmGemmSize.h b/mlir/include/mlir/Dialect/Rock/IR/GemmGemmSize.h
@@ -6,7 +6,7 @@
 //
 //===----------------------------------------------------------------------===//
 //
-// This file defines a utility struct, GemmGemmSize, that packages the sizes of 
+// This file defines a utility struct, GemmGemmSize, that packages the sizes of
 // gemm+gemm to ensure a cleaner API.
 //
 //===----------------------------------------------------------------------===//
@@ -31,7 +31,8 @@ struct GemmGemmSize {
       : g(g), m(m), k(k), n(n), o(o) {}
 
   bool operator==(const GemmGemmSize &other) {
-    return (g == other.g) && (m == other.m) && (k == other.k) && (n == other.n) && (o == other.o);
+    return (g == other.g) && (m == other.m) && (k == other.k) &&
+           (n == other.n) && (o == other.o);
   }
 };
 } // end namespace rock
diff --git a/mlir/include/mlir/Dialect/Rock/IR/RockGemmGemmWrapperInterface.h b/mlir/include/mlir/Dialect/Rock/IR/RockGemmGemmWrapperInterface.h
@@ -1,4 +1,5 @@
-//===- RockGemmGemmWrapperInterface.h - ops that wrap rock.attention -*- C++ -*-===//
+//===- RockGemmGemmWrapperInterface.h - ops that wrap rock.attention -*- C++
+//-*-===//
 //
 // Part of the rocMLIR Project, under the Apache License v2.0 with LLVM
 // Exceptions. See https://llvm.org/LICENSE.txt for license information.
diff --git a/mlir/include/mlir/Dialect/Rock/IR/RockGemmGemmWrapperInterface.td b/mlir/include/mlir/Dialect/Rock/IR/RockGemmGemmWrapperInterface.td
@@ -1,14 +1,16 @@
-//===- RockGemmGemmWrapperInterface.td - ops that wrap rock.attention ---------===//
+//===- RockGemmGemmWrapperInterface.td - ops that wrap rock.attention
+//---------===//
 //
-// Part of the rocMLIR Project, under the Apache License v2.0 with LLVM Exceptions.
-// See https://llvm.org/LICENSE.txt for license information.
+// Part of the rocMLIR Project, under the Apache License v2.0 with LLVM
+// Exceptions. See https://llvm.org/LICENSE.txt for license information.
 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 //
 // Copyright (c) 2025 Advanced Micro Devices INc.
 //===----------------------------------------------------------------------===//
 //
 // This file defines RockGemmGemmWrapperInterface, which abstracts attention and
-// gemm+gemm and friends (conv+gemm, ...) to allow code to operate on them generically.
+// gemm+gemm and friends (conv+gemm, ...) to allow code to operate on them
+// generically.
 //
 //===----------------------------------------------------------------------===//
 
diff --git a/mlir/include/mlir/Dialect/Rock/IR/RockOps.td b/mlir/include/mlir/Dialect/Rock/IR/RockOps.td
@@ -205,27 +205,24 @@ def Rock_ReduceOp :
     ::mlir::OpOperand* getOutArgument() { return &(*this)->getOpOperand(1); }
   }];
 }
-def Rock_AttentionOp :
-  Rock_Op<"attention", [DeclareOpInterfaceMethods<RockGemmGemmWrapperInterface>, DeclareOpInterfaceMethods<MemoryEffectsOpInterface>, RockFusionRoot, AttrSizedOperandSegments]>,
-  Arguments<(ins
-    TensorOrMemRefOf<[F32, F16, BF16, I8]>:$queries,
-    TensorOrMemRefOf<[F32, F16, BF16, I8]>:$keys,
-    TensorOrMemRefOf<[F32, F16, BF16]>:$values,
-    Variadic<AnyTensorOrMemRef>:$preSoftmaxElemWiseInputs,
-    Optional<TensorOrMemRefOf<[I32]>>:$currentSeqLen,
-    TensorOrMemRefOf<[F32, F16, BF16]>:$out,
-    UnitAttr:$qTransposed,
-    UnitAttr:$kTransposed,
-    UnitAttr:$vTransposed,
-    UnitAttr:$oTransposed,
-    StrAttr:$arch,
-    Rock_GemmFeaturesAttr:$features,
-    OptionalAttr<I32Attr>:$numCU,
-    OptionalAttr<RockTuningParamAttrInterface>:$params0,
-    OptionalAttr<RockTuningParamAttrInterface>:$params1,
-    I32Attr:$firstGemmIdx
-  )>,
-  Results<(outs Optional<TensorOf<[F32, F16, BF16]>>:$result)> {
+def Rock_AttentionOp
+    : Rock_Op<
+          "attention", [DeclareOpInterfaceMethods<RockGemmGemmWrapperInterface>,
+                        DeclareOpInterfaceMethods<MemoryEffectsOpInterface>,
+                        RockFusionRoot, AttrSizedOperandSegments]>,
+      Arguments<(ins TensorOrMemRefOf<[F32, F16, BF16, I8]>:$queries,
+          TensorOrMemRefOf<[F32, F16, BF16, I8]>:$keys,
+          TensorOrMemRefOf<[F32, F16, BF16]>:$values,
+          Variadic<AnyTensorOrMemRef>:$preSoftmaxElemWiseInputs,
+          Optional<TensorOrMemRefOf<[I32]>>:$currentSeqLen,
+          TensorOrMemRefOf<[F32, F16, BF16]>:$out, UnitAttr:$qTransposed,
+          UnitAttr:$kTransposed, UnitAttr:$vTransposed, UnitAttr:$oTransposed,
+          StrAttr:$arch, Rock_GemmFeaturesAttr:$features,
+          OptionalAttr<I32Attr>:$numCU,
+          OptionalAttr<RockTuningParamAttrInterface>:$params0,
+          OptionalAttr<RockTuningParamAttrInterface>:$params1,
+          I32Attr:$firstGemmIdx)>,
+      Results<(outs Optional<TensorOf<[F32, F16, BF16]>>:$result)> {
   let summary = "Attention operation of transformer models";
   let description = [{
     Performs the operation out = SOFTMAX(queries * keys) * values.
@@ -252,27 +249,23 @@ def Rock_AttentionOp :
   }];
 }
 
-def Rock_GemmElementwiseGemmOp:
-  Rock_Op<"gemm_elementwise_gemm", [DeclareOpInterfaceMethods<RockGemmGemmWrapperInterface>, DeclareOpInterfaceMethods<MemoryEffectsOpInterface>, RockFusionRoot]>,
-  AllElementTypesMatch<["a", "b", "c"]>,
-  Arguments<(ins
-    TensorOrMemRefOf<[F32]>:$a,
-    TensorOrMemRefOf<[F32]>:$b,
-    TensorOrMemRefOf<[F32]>:$c,
-    Variadic<AnyTensorOrMemRef>:$elemwiseInputs,
-    TensorOrMemRefOf<[F32]>:$out,
-    UnitAttr:$aTransposed,
-    UnitAttr:$bTransposed,
-    UnitAttr:$cTransposed,
-    UnitAttr:$oTransposed,
-    StrAttr:$arch,
-    Rock_GemmFeaturesAttr:$features,
-    OptionalAttr<I32Attr>:$numCU,
-    OptionalAttr<RockTuningParamAttrInterface>:$params0,
-    OptionalAttr<RockTuningParamAttrInterface>:$params1,
-    I32Attr:$firstGemmIdx
-  )>,
-  Results<(outs Optional<TensorOf<[F32]>>:$result)> {
+def Rock_GemmElementwiseGemmOp
+    : Rock_Op<"gemm_elementwise_gemm",
+              [DeclareOpInterfaceMethods<RockGemmGemmWrapperInterface>,
+               DeclareOpInterfaceMethods<MemoryEffectsOpInterface>,
+               RockFusionRoot]>,
+      AllElementTypesMatch<["a", "b", "c"]>,
+      Arguments<(ins TensorOrMemRefOf<[F32]>:$a, TensorOrMemRefOf<[F32]>:$b,
+          TensorOrMemRefOf<[F32]>:$c,
+          Variadic<AnyTensorOrMemRef>:$elemwiseInputs,
+          TensorOrMemRefOf<[F32]>:$out, UnitAttr:$aTransposed,
+          UnitAttr:$bTransposed, UnitAttr:$cTransposed, UnitAttr:$oTransposed,
+          StrAttr:$arch, Rock_GemmFeaturesAttr:$features,
+          OptionalAttr<I32Attr>:$numCU,
+          OptionalAttr<RockTuningParamAttrInterface>:$params0,
+          OptionalAttr<RockTuningParamAttrInterface>:$params1,
+          I32Attr:$firstGemmIdx)>,
+      Results<(outs Optional<TensorOf<[F32]>>:$result)> {
   let summary = "GEMM-elementwise-GEMM operation";
   let description = [{
     Performs the operation out = (a * b) * c.
diff --git a/mlir/lib/Dialect/Rock/IR/RockDialect.cpp b/mlir/lib/Dialect/Rock/IR/RockDialect.cpp
@@ -7,8 +7,8 @@
 //===----------------------------------------------------------------------===//
 
 #include "mlir/Dialect/Rock/IR/Rock.h"
-#include "mlir/Dialect/Rock/IR/RockGemmWrapperInterface.h"
 #include "mlir/Dialect/Rock/IR/RockGemmGemmWrapperInterface.h"
+#include "mlir/Dialect/Rock/IR/RockGemmWrapperInterface.h"
 #include "mlir/Dialect/Rock/IR/RockTypes.h"
 #include "mlir/Dialect/Rock/utility/math.h"
 
@@ -2081,48 +2081,38 @@ LogicalResult BlockwiseFillOp::verify() {
 //===-----------------------------------------------------===//
 
 OpOperand *GemmElementwiseGemmOp::getOutArgument() {
-  return &(*this)->getOpOperand(getNumOperands()-1);
+  return &(*this)->getOpOperand(getNumOperands() - 1);
 }
 
-Type GemmElementwiseGemmOp::getOutType() {
-  return getOut().getType();
-}
+Type GemmElementwiseGemmOp::getOutType() { return getOut().getType(); }
 
-Type GemmElementwiseGemmOp::getAType() {
-  return getA().getType();
-}
+Type GemmElementwiseGemmOp::getAType() { return getA().getType(); }
 
-Type GemmElementwiseGemmOp::getBType() {
-  return getB().getType();
-}
+Type GemmElementwiseGemmOp::getBType() { return getB().getType(); }
 
-Type GemmElementwiseGemmOp::getCType() {
-  return getC().getType();
-}
+Type GemmElementwiseGemmOp::getCType() { return getC().getType(); }
 
-bool GemmElementwiseGemmOp::getTransposedA() {
-  return getATransposed();
-}
+bool GemmElementwiseGemmOp::getTransposedA() { return getATransposed(); }
 
-bool GemmElementwiseGemmOp::getTransposedB() {
-  return getBTransposed();
-}
+bool GemmElementwiseGemmOp::getTransposedB() { return getBTransposed(); }
 
-bool GemmElementwiseGemmOp::getTransposedC() {
-  return getCTransposed();
-}
+bool GemmElementwiseGemmOp::getTransposedC() { return getCTransposed(); }
 
-bool GemmElementwiseGemmOp::getTransposedOut() {
-  return getOTransposed();
-}
+bool GemmElementwiseGemmOp::getTransposedOut() { return getOTransposed(); }
 
-KernelType GemmElementwiseGemmOp::getKernelType() { return KernelType::GemmElementwiseGemm; }
+KernelType GemmElementwiseGemmOp::getKernelType() {
+  return KernelType::GemmElementwiseGemm;
+}
 
-uint32_t GemmElementwiseGemmOp::getFirstGemmIndex() { return getFirstGemmIdx(); }
+uint32_t GemmElementwiseGemmOp::getFirstGemmIndex() {
+  return getFirstGemmIdx();
+}
 
 GemmGemmSize GemmElementwiseGemmOp::getGemmGemmSize() {
-  ShapedType typeA = getA().getType(), typeB = getB().getType(), typeC = getC().getType();
-  ArrayRef<int64_t> dimsA = typeA.getShape(), dimsB = typeB.getShape(), dimsC = typeC.getShape();
+  ShapedType typeA = getA().getType(), typeB = getB().getType(),
+             typeC = getC().getType();
+  ArrayRef<int64_t> dimsA = typeA.getShape(), dimsB = typeB.getShape(),
+                    dimsC = typeC.getShape();
   int64_t offsetA = dimsA.size() == 2 ? 0 : 1,
           offsetB = dimsB.size() == 2 ? 0 : 1,
           offsetC = dimsC.size() == 2 ? 0 : 1;
@@ -2134,25 +2124,28 @@ GemmGemmSize GemmElementwiseGemmOp::getGemmGemmSize() {
   return GemmGemmSize(g, m, k, n, o);
 }
 
-static LogicalResult verifyAttentionOp(RockGemmGemmWrapperInterface op, 
+static LogicalResult verifyAttentionOp(RockGemmGemmWrapperInterface op,
                                        Value currentSeqLen) {
   ShapedType qType = cast<ShapedType>(op.getAType());
   int64_t qBatchDim = qType.getShape().size() == 3 ? qType.getShape()[0] : 1;
   ArrayRef<int64_t> qLastDims = qType.getShape().slice(qType.getRank() - 2);
-  auto [queryM, queryK] = op.getTransposedA() ? std::tuple{qLastDims[1], qLastDims[0]}
-                                      : std::tuple{qLastDims[0], qLastDims[1]};
+  auto [queryM, queryK] = op.getTransposedA()
+                              ? std::tuple{qLastDims[1], qLastDims[0]}
+                              : std::tuple{qLastDims[0], qLastDims[1]};
 
   ShapedType kType = cast<ShapedType>(op.getBType());
   int64_t kBatchDim = kType.getShape().size() == 3 ? kType.getShape()[0] : 1;
   ArrayRef<int64_t> kLastDims = kType.getShape().slice(kType.getRank() - 2);
-  auto [keyK, keyN] = op.getTransposedB() ? std::tuple{kLastDims[1], kLastDims[0]}
-                                  : std::tuple{kLastDims[0], kLastDims[1]};
+  auto [keyK, keyN] = op.getTransposedB()
+                          ? std::tuple{kLastDims[1], kLastDims[0]}
+                          : std::tuple{kLastDims[0], kLastDims[1]};
 
   ShapedType vType = cast<ShapedType>(op.getCType());
   int64_t vBatchDim = vType.getShape().size() == 3 ? vType.getShape()[0] : 1;
   ArrayRef<int64_t> vLastDims = vType.getShape().slice(vType.getRank() - 2);
-  auto [valueK, valueN] = op.getTransposedC() ? std::tuple{vLastDims[1], vLastDims[0]}
-                                      : std::tuple{vLastDims[0], vLastDims[1]};
+  auto [valueK, valueN] = op.getTransposedC()
+                              ? std::tuple{vLastDims[1], vLastDims[0]}
+                              : std::tuple{vLastDims[0], vLastDims[1]};
 
   if (qBatchDim != kBatchDim || kBatchDim != vBatchDim) {
     return op.emitError("Batch dimensions do not match");
@@ -2171,7 +2164,7 @@ static LogicalResult verifyAttentionOp(RockGemmGemmWrapperInterface op,
   ArrayRef<int64_t> oLastDims = oType.getShape().slice(oType.getRank() - 2);
   auto [outputSeqLen, outputHeadDim] =
       op.getTransposedOut() ? std::tuple{oLastDims[1], oLastDims[0]}
-                          : std::tuple{oLastDims[0], oLastDims[1]};
+                            : std::tuple{oLastDims[0], oLastDims[1]};
 
   if (qType.getShape().size() != oType.getShape().size()) {
     return op.emitError("Number of dimensions do not match (Q and Output)");
@@ -2223,48 +2216,34 @@ void GemmElementwiseGemmOp::getEffects(
 //===-----------------------------------------------------===//
 
 OpOperand *AttentionOp::getOutArgument() {
-  return &(*this)->getOpOperand(getNumOperands()-1);
+  return &(*this)->getOpOperand(getNumOperands() - 1);
 }
 
-Type AttentionOp::getOutType() {
-  return getOut().getType();
-}
+Type AttentionOp::getOutType() { return getOut().getType(); }
 
-Type AttentionOp::getAType() {
-  return getQueries().getType();
-}
+Type AttentionOp::getAType() { return getQueries().getType(); }
 
-Type AttentionOp::getBType() {
-  return getKeys().getType();
-}
+Type AttentionOp::getBType() { return getKeys().getType(); }
 
-Type AttentionOp::getCType() {
-  return getValues().getType();
-}
+Type AttentionOp::getCType() { return getValues().getType(); }
 
-bool AttentionOp::getTransposedA() {
-  return getQTransposed();
-}
+bool AttentionOp::getTransposedA() { return getQTransposed(); }
 
-bool AttentionOp::getTransposedB() {
-  return getKTransposed();
-}
+bool AttentionOp::getTransposedB() { return getKTransposed(); }
 
-bool AttentionOp::getTransposedC() {
-  return getVTransposed();
-}
+bool AttentionOp::getTransposedC() { return getVTransposed(); }
 
-bool AttentionOp::getTransposedOut() {
-  return getOTransposed();
-}
+bool AttentionOp::getTransposedOut() { return getOTransposed(); }
 
 KernelType AttentionOp::getKernelType() { return KernelType::Attention; }
 
 uint32_t AttentionOp::getFirstGemmIndex() { return getFirstGemmIdx(); }
 
 GemmGemmSize AttentionOp::getGemmGemmSize() {
-  ShapedType typeA = getQueries().getType(), typeB = getKeys().getType(), typeC = getValues().getType();
-  ArrayRef<int64_t> dimsA = typeA.getShape(), dimsB = typeB.getShape(), dimsC = typeC.getShape();
+  ShapedType typeA = getQueries().getType(), typeB = getKeys().getType(),
+             typeC = getValues().getType();
+  ArrayRef<int64_t> dimsA = typeA.getShape(), dimsB = typeB.getShape(),
+                    dimsC = typeC.getShape();
   int64_t offsetA = dimsA.size() == 2 ? 0 : 1,
           offsetB = dimsB.size() == 2 ? 0 : 1,
           offsetC = dimsC.size() == 2 ? 0 : 1;
diff --git a/mlir/lib/Dialect/Rock/IR/RockGemmGemmWrapperInterface.cpp b/mlir/lib/Dialect/Rock/IR/RockGemmGemmWrapperInterface.cpp
@@ -1,4 +1,5 @@
-//===- RockGemmGemmWrapperInterface.cpp - ops that wrap rock.attention -------===//
+//===- RockGemmGemmWrapperInterface.cpp - ops that wrap rock.attention
+//-------===//
 //
 // Part of the rocMLIR Project, under the Apache License v2.0 with LLVM
 // Exceptions. See https://llvm.org/LICENSE.txt for license information.
diff --git a/mlir/lib/Dialect/Rock/Transforms/AffixTuningParameters.cpp b/mlir/lib/Dialect/Rock/Transforms/AffixTuningParameters.cpp
@@ -54,7 +54,8 @@ void AffixTuningParameters::runOnOperation() {
 
   func.walk(
       [&](RockGemmWrapperInterface op) { affixTuningParametersImpl(op); });
-  func.walk([&](RockGemmGemmWrapperInterface op) { affixTuningParametersImpl(op); });
+  func.walk(
+      [&](RockGemmGemmWrapperInterface op) { affixTuningParametersImpl(op); });
   func.walk([&](ReduceOp op) {
     func::FuncOp funcOp = getOperation();
     if (!funcOp->hasAttr("block_size")) {
@@ -243,13 +244,14 @@ deriveGemm1TuningParams(OpBuilder &builder, RockGemmGemmWrapperInterface op,
       gemm0TuningParams.getOutputSwizzle(), gemm0TuningParams.getForceUnroll());
 }
 
-void AffixTuningParameters::affixTuningParametersImpl(RockGemmGemmWrapperInterface op) {
+void AffixTuningParameters::affixTuningParametersImpl(
+    RockGemmGemmWrapperInterface op) {
   OpBuilder builder(op.getContext());
   bool isAccel = rock::isAccel(op.getGemmFeatures());
   if (!isAccel) {
     op.emitError("Currently, attention/gemm+gemm op is only "
-                        "supported on GPUs "
-                        "with matrix accelerator extentions");
+                 "supported on GPUs "
+                 "with matrix accelerator extentions");
     return signalPassFailure();
   }
   Attribute params0 = op.getGemm0Params().value_or(nullptr);
@@ -303,12 +305,14 @@ void AffixTuningParameters::affixTuningParametersImpl(RockGemmGemmWrapperInterfa
   LLVM_DEBUG(llvm::dbgs() << "accelParams1=" << accelParams1 << "\n");
   LogicalResult isValidBlockwiseGemm0 =
       populateParamsAccelPtr->isValidBlockwiseGemm(
-          accelParams0, cast<MemRefType>(op.getAType()).getElementType(), cast<MemRefType>(op.getBType()).getElementType(), op.getArch(),
+          accelParams0, cast<MemRefType>(op.getAType()).getElementType(),
+          cast<MemRefType>(op.getBType()).getElementType(), op.getArch(),
           /*enableBlockSizeUpperLimit=*/false,
           /*enableDPerWaveFiltering=*/false);
   LogicalResult isValidBlockwiseGemm1 =
       populateParamsAccelPtr->isValidBlockwiseGemm(
-          accelParams1, cast<MemRefType>(op.getCType()).getElementType(), cast<MemRefType>(op.getCType()).getElementType(), op.getArch(),
+          accelParams1, cast<MemRefType>(op.getCType()).getElementType(),
+          cast<MemRefType>(op.getCType()).getElementType(), op.getArch(),
           /*enableBlockSizeUpperLimit=*/false,
           /*enableDPerWaveFiltering=*/false);
   if (isValidBlockwiseGemm0.failed() || isValidBlockwiseGemm1.failed()) {
diff --git a/mlir/lib/Dialect/Rock/Transforms/GemmToGridwise.cpp b/mlir/lib/Dialect/Rock/Transforms/GemmToGridwise.cpp
diff --git a/mlir/lib/Dialect/Rock/Tuning/RockTuningImpl.cpp b/mlir/lib/Dialect/Rock/Tuning/RockTuningImpl.cpp
diff --git a/mlir/tools/rocmlir-tuning-driver/rocmlir-tuning-driver.cpp b/mlir/tools/rocmlir-tuning-driver/rocmlir-tuning-driver.cpp