[DAGCombiner] Fold freeze(fmul) + fadd/fsub into FMA combine

harrisonGPU · harrisonGPU · commit e64adf283b40 · 2025-06-07T09:59:32.000Z
diff --git a/llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp b/llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
@@ -16736,6 +16736,28 @@ SDValue DAGCombiner::visitFADDForFMACombine(SDNode *N) {
     }
   }
 
+  // fold (fadd (freeze (fmul x, y)), z) -> (fma x, y, z).
+  if ((Options.UnsafeFPMath || N->getFlags().hasAllowContract()) &&
+      N0.getOpcode() == ISD::FREEZE) {
+    SDValue FrozenMul = N0.getOperand(0);
+    if (matcher.match(FrozenMul, ISD::FMUL) && isContractableFMUL(FrozenMul)) {
+      SDValue X = FrozenMul.getOperand(0);
+      SDValue Y = FrozenMul.getOperand(1);
+      return matcher.getNode(PreferredFusedOpcode, SL, VT, X, Y, N1);
+    }
+  }
+
+  // fold (fadd x, (freeze (fmul y, z))) -> (fma y, z, x)
+  if ((Options.UnsafeFPMath || N->getFlags().hasAllowContract()) &&
+      N1.getOpcode() == ISD::FREEZE) {
+    SDValue FrozenMul = N1.getOperand(0);
+    if (matcher.match(FrozenMul, ISD::FMUL) && isContractableFMUL(FrozenMul)) {
+      SDValue X = FrozenMul.getOperand(0);
+      SDValue Y = FrozenMul.getOperand(1);
+      return matcher.getNode(PreferredFusedOpcode, SL, VT, X, Y, N0);
+    }
+  }
+
   // More folding opportunities when target permits.
   if (Aggressive) {
     // fold (fadd (fma x, y, (fpext (fmul u, v))), z)
@@ -17013,6 +17035,30 @@ SDValue DAGCombiner::visitFSUBForFMACombine(SDNode *N) {
     }
   }
 
+  // fold (fsub (freeze (fmul x, y)), z) -> (fma x, y, (fneg z))
+  if ((Options.UnsafeFPMath || N->getFlags().hasAllowContract()) &&
+      N0.getOpcode() == ISD::FREEZE) {
+    SDValue FrozenMul = N0.getOperand(0);
+    if (matcher.match(FrozenMul, ISD::FMUL) && isContractableFMUL(FrozenMul)) {
+      SDValue X = FrozenMul.getOperand(0);
+      SDValue Y = FrozenMul.getOperand(1);
+      SDValue NegZ = matcher.getNode(ISD::FNEG, SL, VT, N1);
+      return matcher.getNode(PreferredFusedOpcode, SL, VT, X, Y, NegZ);
+    }
+  }
+
+  // fold (fsub z, (freeze(fmul x, y))) -> (fma (fneg x), y, z)
+  if ((Options.UnsafeFPMath || N->getFlags().hasAllowContract()) &&
+      N1.getOpcode() == ISD::FREEZE) {
+    SDValue FrozenMul = N1.getOperand(0);
+    if (matcher.match(FrozenMul, ISD::FMUL) && isContractableFMUL(FrozenMul)) {
+      SDValue X = FrozenMul.getOperand(0);
+      SDValue Y = FrozenMul.getOperand(1);
+      SDValue NegX = matcher.getNode(ISD::FNEG, SL, VT, X);
+      return matcher.getNode(PreferredFusedOpcode, SL, VT, NegX, Y, N0);
+    }
+  }
+
   auto isReassociable = [&Options](SDNode *N) {
     return Options.UnsafeFPMath || N->getFlags().hasAllowReassociation();
   };
diff --git a/llvm/test/CodeGen/AMDGPU/fold-freeze-fmul-to-fma.ll b/llvm/test/CodeGen/AMDGPU/fold-freeze-fmul-to-fma.ll
@@ -1,106 +1,54 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
-; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx1100 < %s | FileCheck %s
+; RUN: llc -mtriple=amdgcn -mcpu=gfx1100 -verify-machineinstrs < %s | FileCheck %s -check-prefix GFX11
 
 define float @fma_from_freeze_mul_add_left(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_add_left:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_fma_f32 v0, v0, v1, 1.0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
+; GFX11-LABEL: fma_from_freeze_mul_add_left:
+; GFX11:       ; %bb.0: ; %bb
+; GFX11-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
+; GFX11-NEXT:    v_fma_f32 v0, v0, v1, 1.0
+; GFX11-NEXT:    s_setpc_b64 s[30:31]
+bb:
   %mul = fmul contract float %x, %y
   %mul.fr = freeze float %mul
   %add = fadd contract float %mul.fr, 1.000000e+00
   ret float %add
 }
 
-define float @fma_from_freeze_mul_add_left_with_nnan(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_add_left_with_nnan:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_mul_f32_e32 v0, v0, v1
-; CHECK-NEXT:    s_delay_alu instid0(VALU_DEP_1)
-; CHECK-NEXT:    v_add_f32_e32 v0, 1.0, v0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
-  %mul = fmul nnan contract afn float %x, %y
-  %mul.fr = freeze float %mul
-  %add = fadd nnan contract float %mul.fr, 1.000000e+00
-  ret float %add
-}
-
 define float @fma_from_freeze_mul_add_right(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_add_right:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_fma_f32 v0, v0, v1, 1.0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
+; GFX11-LABEL: fma_from_freeze_mul_add_right:
+; GFX11:       ; %bb.0: ; %bb
+; GFX11-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
+; GFX11-NEXT:    v_fma_f32 v0, v0, v1, 1.0
+; GFX11-NEXT:    s_setpc_b64 s[30:31]
+bb:
   %mul = fmul contract float %x, %y
   %mul.fr = freeze float %mul
   %add = fadd contract float 1.000000e+00, %mul.fr
   ret float %add
 }
 
-define float @fma_from_freeze_mul_add_right_with_nnan(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_add_right_with_nnan:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_mul_f32_e32 v0, v0, v1
-; CHECK-NEXT:    s_delay_alu instid0(VALU_DEP_1)
-; CHECK-NEXT:    v_add_f32_e32 v0, 1.0, v0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
-  %mul = fmul nnan contract float %x, %y
-  %mul.fr = freeze float %mul
-  %add = fadd nnan contract float 1.000000e+00, %mul.fr
-  ret float %add
-}
-
 define float @fma_from_freeze_mul_sub_left(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_sub_left:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_fma_f32 v0, v0, v1, -1.0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
+; GFX11-LABEL: fma_from_freeze_mul_sub_left:
+; GFX11:       ; %bb.0: ; %bb
+; GFX11-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
+; GFX11-NEXT:    v_fma_f32 v0, v0, v1, -1.0
+; GFX11-NEXT:    s_setpc_b64 s[30:31]
+bb:
   %mul = fmul contract float %x, %y
   %mul.fr = freeze float %mul
   %sub = fsub contract float %mul.fr, 1.000000e+00
   ret float %sub
 }
 
-define float @fma_from_freeze_mul_sub_left_with_nnan(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_sub_left_with_nnan:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_mul_f32_e32 v0, v0, v1
-; CHECK-NEXT:    s_delay_alu instid0(VALU_DEP_1)
-; CHECK-NEXT:    v_add_f32_e32 v0, -1.0, v0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
-  %mul = fmul nnan contract float %x, %y
-  %mul.fr = freeze float %mul
-  %sub = fsub nnan contract float %mul.fr, 1.000000e+00
-  ret float %sub
-}
-
 define float @fma_from_freeze_mul_sub_right(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_sub_right:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_fma_f32 v0, -v0, v1, 1.0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
+; GFX11-LABEL: fma_from_freeze_mul_sub_right:
+; GFX11:       ; %bb.0: ; %bb
+; GFX11-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
+; GFX11-NEXT:    v_fma_f32 v0, -v0, v1, 1.0
+; GFX11-NEXT:    s_setpc_b64 s[30:31]
+bb:
   %mul = fmul contract float %x, %y
   %mul.fr = freeze float %mul
   %sub = fsub contract float 1.000000e+00, %mul.fr
   ret float %sub
 }
-
-define float @fma_from_freeze_mul_sub_right_with_nnan(float %x, float %y) {
-; CHECK-LABEL: fma_from_freeze_mul_sub_right_with_nnan:
-; CHECK:       ; %bb.0:
-; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
-; CHECK-NEXT:    v_mul_f32_e32 v0, v0, v1
-; CHECK-NEXT:    s_delay_alu instid0(VALU_DEP_1)
-; CHECK-NEXT:    v_sub_f32_e32 v0, 1.0, v0
-; CHECK-NEXT:    s_setpc_b64 s[30:31]
-  %mul = fmul nnan contract float %x, %y
-  %mul.fr = freeze float %mul
-  %sub = fsub nnan contract float 1.000000e+00, %mul.fr
-  ret float %sub
-}