Clang formatter

easyonaadit · easyonaadit · commit 25b80bd48a6e · 2025-02-10T10:58:08.000+05:30
diff --git a/llvm/include/llvm/IR/IntrinsicsAMDGPU.td b/llvm/include/llvm/IR/IntrinsicsAMDGPU.td
@@ -2328,13 +2328,13 @@ class AMDGPUWaveReduce<LLVMType data_ty = llvm_anyint_ty> : Intrinsic<
     [IntrNoMem, IntrConvergent, IntrWillReturn, IntrNoCallback, IntrNoFree, ImmArg<ArgIndex<1>>]>;
 
 multiclass AMDGPUWaveReduceOps<list<string> Operations> {
-   foreach Op = Operations in {
-    def Op : AMDGPUWaveReduce;
-  }
+  foreach Op = Operations in { def Op : AMDGPUWaveReduce; }
 }
 
-defvar Operations = ["umin", "min", "umax", "max", "uadd", "add", "usub", "sub", "and", "or", "xor"];
-defm int_amdgcn_wave_reduce_ :  AMDGPUWaveReduceOps<Operations>;
+defvar Operations = [
+  "umin", "min", "umax", "max", "uadd", "add", "usub", "sub", "and", "or", "xor"
+];
+defm int_amdgcn_wave_reduce_ : AMDGPUWaveReduceOps<Operations>;
 
 def int_amdgcn_readfirstlane :
   Intrinsic<[llvm_any_ty], [LLVMMatchType<0>],
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
@@ -4940,26 +4940,26 @@ static MachineBasicBlock *emitIndirectDst(MachineInstr &MI,
   return LoopBB;
 }
 
-static uint32_t getInitialValueForWaveReduction(unsigned Opc){
-  switch(Opc){
-      case AMDGPU::S_MIN_U32:
-        return std::numeric_limits<uint32_t>::max();
-      case AMDGPU::S_MIN_I32:
-        return std::numeric_limits<int32_t>::max();
-      case AMDGPU::S_MAX_U32:
-        return std::numeric_limits<u_int32_t>::lowest();
-      case AMDGPU::S_MAX_I32:
-        return std::numeric_limits<int32_t>::min();
-      case AMDGPU::S_ADD_I32:
-      case AMDGPU::S_SUB_I32:
-      case AMDGPU::S_OR_B32:
-      case AMDGPU::S_XOR_B32:
-        return 0x00000000;
-      case AMDGPU::S_AND_B32:
-        return 0xFFFFFFFF;
-      default:  
-        llvm_unreachable("Unexpected opcode in getInitialValueForWaveReduction");  
-    }
+static uint32_t getInitialValueForWaveReduction(unsigned Opc) {
+  switch (Opc) {
+  case AMDGPU::S_MIN_U32:
+    return std::numeric_limits<uint32_t>::max();
+  case AMDGPU::S_MIN_I32:
+    return std::numeric_limits<int32_t>::max();
+  case AMDGPU::S_MAX_U32:
+    return std::numeric_limits<uint32_t>::min();
+  case AMDGPU::S_MAX_I32:
+    return std::numeric_limits<int32_t>::min();
+  case AMDGPU::S_ADD_I32:
+  case AMDGPU::S_SUB_I32:
+  case AMDGPU::S_OR_B32:
+  case AMDGPU::S_XOR_B32:
+    return std::numeric_limits<uint32_t>::min();
+  case AMDGPU::S_AND_B32:
+    return std::numeric_limits<uint32_t>::max();
+  default:
+    llvm_unreachable("Unexpected opcode in getInitialValueForWaveReduction");
+  }
 }
 
 static MachineBasicBlock *lowerWaveReduce(MachineInstr &MI,
@@ -4977,72 +4977,77 @@ static MachineBasicBlock *lowerWaveReduce(MachineInstr &MI,
   Register DstReg = MI.getOperand(0).getReg();
   MachineBasicBlock *RetBB = nullptr;
   if (isSGPR) {
-    switch(Opc){
-      case AMDGPU::S_MIN_U32:
-      case AMDGPU::S_MIN_I32:
-      case AMDGPU::S_MAX_U32:
-      case AMDGPU::S_MAX_I32:
-      case AMDGPU::S_AND_B32:
-      case AMDGPU::S_OR_B32:{
-        // Idempotent operations.
-        BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MOV_B32), DstReg).addReg(SrcReg);
-        RetBB = &BB;
-        break;
-      }
-      case AMDGPU::S_XOR_B32:
-      case AMDGPU::S_ADD_I32:
-      case AMDGPU::S_SUB_I32:{
-        const TargetRegisterClass *WaveMaskRegClass = TRI->getWaveMaskRegClass();
-        const TargetRegisterClass *DstRegClass = MRI.getRegClass(DstReg);
-        Register ExecMask = MRI.createVirtualRegister(WaveMaskRegClass);
-        Register ActiveLanes = MRI.createVirtualRegister(DstRegClass);
-
-        bool IsWave32 = ST.isWave32();
-        unsigned MovOpc = IsWave32 ? AMDGPU::S_MOV_B32 : AMDGPU::S_MOV_B64;
-        unsigned ExecReg = IsWave32 ? AMDGPU::EXEC_LO : AMDGPU::EXEC;
-        unsigned CountReg = IsWave32 ? AMDGPU::S_BCNT1_I32_B32 : AMDGPU::S_BCNT1_I32_B64;
-
-        auto Exec =
-            BuildMI(BB, MI, DL, TII->get(MovOpc), ExecMask).addReg(ExecReg);
-
-        auto NewAccumulator = BuildMI(BB, MI, DL, TII->get(CountReg), ActiveLanes)
-                                  .addReg(Exec->getOperand(0).getReg());
-
-        switch(Opc){
-          case AMDGPU::S_XOR_B32:{
-            // Performing an XOR operation on a uniform value
-            // depends on the parity of the number of active lanes.
-            // For even parity, the result will be 0, for odd 
-            // parity the result will be the same as the input value.
-            Register ParityRegister = MRI.createVirtualRegister(DstRegClass);
-
-            auto ParityReg = BuildMI(BB, MI, DL, TII->get(AMDGPU::S_AND_B32), ParityRegister)
+    switch (Opc) {
+    case AMDGPU::S_MIN_U32:
+    case AMDGPU::S_MIN_I32:
+    case AMDGPU::S_MAX_U32:
+    case AMDGPU::S_MAX_I32:
+    case AMDGPU::S_AND_B32:
+    case AMDGPU::S_OR_B32: {
+      // Idempotent operations.
+      BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MOV_B32), DstReg).addReg(SrcReg);
+      RetBB = &BB;
+      break;
+    }
+    case AMDGPU::S_XOR_B32:
+    case AMDGPU::S_ADD_I32:
+    case AMDGPU::S_SUB_I32: {
+      const TargetRegisterClass *WaveMaskRegClass = TRI->getWaveMaskRegClass();
+      const TargetRegisterClass *DstRegClass = MRI.getRegClass(DstReg);
+      Register ExecMask = MRI.createVirtualRegister(WaveMaskRegClass);
+      Register ActiveLanes = MRI.createVirtualRegister(DstRegClass);
+
+      bool IsWave32 = ST.isWave32();
+      unsigned MovOpc = IsWave32 ? AMDGPU::S_MOV_B32 : AMDGPU::S_MOV_B64;
+      unsigned ExecReg = IsWave32 ? AMDGPU::EXEC_LO : AMDGPU::EXEC;
+      unsigned CountReg =
+          IsWave32 ? AMDGPU::S_BCNT1_I32_B32 : AMDGPU::S_BCNT1_I32_B64;
+
+      auto Exec =
+          BuildMI(BB, MI, DL, TII->get(MovOpc), ExecMask).addReg(ExecReg);
+
+      auto NewAccumulator = BuildMI(BB, MI, DL, TII->get(CountReg), ActiveLanes)
+                                .addReg(Exec->getOperand(0).getReg());
+
+      switch (Opc) {
+      case AMDGPU::S_XOR_B32: {
+        // Performing an XOR operation on a uniform value
+        // depends on the parity of the number of active lanes.
+        // For even parity, the result will be 0, for odd
+        // parity the result will be the same as the input value.
+        Register ParityRegister = MRI.createVirtualRegister(DstRegClass);
+
+        auto ParityReg =
+            BuildMI(BB, MI, DL, TII->get(AMDGPU::S_AND_B32), ParityRegister)
                 .addReg(NewAccumulator->getOperand(0).getReg())
                 .addImm(1);
-            BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)  
-                .addReg(SrcReg)
-                .addReg(ParityReg->getOperand(0).getReg())  ;
-            break;
-          }
-          case AMDGPU::S_SUB_I32:{
-            Register NegatedVal = MRI.createVirtualRegister(DstRegClass);
-
-            // Take the negation of the source operand.
-            auto InvertedValReg = BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), NegatedVal).addImm(-1).addReg(SrcReg);
-            BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)
-                .addReg(InvertedValReg->getOperand(0).getReg())
-                .addReg(NewAccumulator->getOperand(0).getReg());
-            break;
-          }
-          case AMDGPU::S_ADD_I32:{
-            BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)
-                .addReg(SrcReg)
-                .addReg(NewAccumulator->getOperand(0).getReg());
-            break;
-          }
-        }
-        RetBB = &BB;
+        BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)
+            .addReg(SrcReg)
+            .addReg(ParityReg->getOperand(0).getReg());
+        break;
+      }
+      case AMDGPU::S_SUB_I32: {
+        Register NegatedVal = MRI.createVirtualRegister(DstRegClass);
+
+        // Take the negation of the source operand.
+        auto InvertedValReg =
+            BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), NegatedVal)
+                .addImm(-1)
+                .addReg(SrcReg);
+        BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)
+            .addReg(InvertedValReg->getOperand(0).getReg())
+            .addReg(NewAccumulator->getOperand(0).getReg());
+        break;
+      }
+      case AMDGPU::S_ADD_I32: {
+        BuildMI(BB, MI, DL, TII->get(AMDGPU::S_MUL_I32), DstReg)
+            .addReg(SrcReg)
+            .addReg(NewAccumulator->getOperand(0).getReg());
+        break;
       }
+      }
+      RetBB = &BB;
+    }
     }
   } else {
     // TODO: Implement DPP Strategy and switch based on immediate strategy
diff --git a/llvm/lib/Target/AMDGPU/SIInstructions.td b/llvm/lib/Target/AMDGPU/SIInstructions.td
@@ -277,7 +277,7 @@ def : GCNPat <(vt (int_amdgcn_set_inactive vt:$src, vt:$inactive)),
 def : GCNPat<(i32 (int_amdgcn_set_inactive_chain_arg i32:$src, i32:$inactive)),
     (V_SET_INACTIVE_B32 0, VGPR_32:$src, 0, VGPR_32:$inactive, (IMPLICIT_DEF))>;
 
- // clang-format off
+// clang-format off
 defvar int_amdgcn_wave_reduce_ = "int_amdgcn_wave_reduce_";
 multiclass
     AMDGPUWaveReducePseudoGenerator<string Op, string DataType, string Size> {
@@ -288,9 +288,9 @@ multiclass
                         [(set i32 : $sdst, (!cast<AMDGPUWaveReduce>(int_amdgcn_wave_reduce_ #Op) i32 : $src, i32 : $strategy))]> {}
   }
 }
- // clang-format on
+// clang-format on
 
-// Input list : [Operation_name, 
+// Input list : [Operation_name,
 //              type - Signed(I)/Unsigned(U)/Float(F)/Bitwise(B),
 //              Size_in_bits]
 defvar Operations = [