[VPlan] VPIRFlags kind for FCmp with predicate + fast-math flags (NFCI).

fhahn · fhahn · commit 1e3ea0329322 · 2025-11-18T22:09:53.000Z
FCmp instructions have both a predicate and fast-math flags. Introduce a
new FCmp kind, that combines both to model this correctly in the current
system.

This should be NFC modulo VPlan printing which now includes the correct
fast-math flags.
diff --git a/llvm/lib/Transforms/Vectorize/VPlan.h b/llvm/lib/Transforms/Vectorize/VPlan.h
@@ -609,6 +609,7 @@ class VPSingleDefRecipe : public VPRecipeBase, public VPValue {
 class VPIRFlags {
   enum class OperationType : unsigned char {
     Cmp,
+    FCmp,
     OverflowingBinOp,
     Trunc,
     DisjointOp,
@@ -659,6 +660,12 @@ class VPIRFlags {
 
     LLVM_ABI_FOR_TEST FastMathFlagsTy(const FastMathFlags &FMF);
   };
+  /// Holds both the predicate and fast-math flags for floating-point
+  /// comparisons.
+  struct FCmpFlagsTy {
+    CmpInst::Predicate Pred;
+    FastMathFlagsTy FMFs;
+  };
 
   OperationType OpType;
 
@@ -671,14 +678,19 @@ class VPIRFlags {
     GEPNoWrapFlags GEPFlags;
     NonNegFlagsTy NonNegFlags;
     FastMathFlagsTy FMFs;
+    FCmpFlagsTy FCmpFlags;
     unsigned AllFlags;
   };
 
 public:
   VPIRFlags() : OpType(OperationType::Other), AllFlags(0) {}
 
   VPIRFlags(Instruction &I) {
-    if (auto *Op = dyn_cast<CmpInst>(&I)) {
+    if (auto *FCmp = dyn_cast<FCmpInst>(&I)) {
+      OpType = OperationType::FCmp;
+      FCmpFlags.Pred = FCmp->getPredicate();
+      FCmpFlags.FMFs = FCmp->getFastMathFlags();
+    } else if (auto *Op = dyn_cast<CmpInst>(&I)) {
       OpType = OperationType::Cmp;
       CmpPredicate = Op->getPredicate();
     } else if (auto *Op = dyn_cast<PossiblyDisjointInst>(&I)) {
@@ -711,6 +723,12 @@ class VPIRFlags {
   VPIRFlags(CmpInst::Predicate Pred)
       : OpType(OperationType::Cmp), CmpPredicate(Pred) {}
 
+  VPIRFlags(CmpInst::Predicate Pred, FastMathFlags FMFs)
+      : OpType(OperationType::FCmp) {
+    FCmpFlags.Pred = Pred;
+    FCmpFlags.FMFs = FMFs;
+  }
+
   VPIRFlags(WrapFlagsTy WrapFlags)
       : OpType(OperationType::OverflowingBinOp), WrapFlags(WrapFlags) {}
 
@@ -760,8 +778,9 @@ class VPIRFlags {
       GEPFlags = GEPNoWrapFlags::none();
       break;
     case OperationType::FPMathOp:
-      FMFs.NoNaNs = false;
-      FMFs.NoInfs = false;
+    case OperationType::FCmp:
+      getFMFsRef().NoNaNs = false;
+      getFMFsRef().NoInfs = false;
       break;
     case OperationType::NonNegOp:
       NonNegFlags.NonNeg = false;
@@ -793,14 +812,17 @@ class VPIRFlags {
       cast<GetElementPtrInst>(&I)->setNoWrapFlags(GEPFlags);
       break;
     case OperationType::FPMathOp:
-      I.setHasAllowReassoc(FMFs.AllowReassoc);
-      I.setHasNoNaNs(FMFs.NoNaNs);
-      I.setHasNoInfs(FMFs.NoInfs);
-      I.setHasNoSignedZeros(FMFs.NoSignedZeros);
-      I.setHasAllowReciprocal(FMFs.AllowReciprocal);
-      I.setHasAllowContract(FMFs.AllowContract);
-      I.setHasApproxFunc(FMFs.ApproxFunc);
+    case OperationType::FCmp: {
+      const FastMathFlagsTy &F = getFMFsRef();
+      I.setHasAllowReassoc(F.AllowReassoc);
+      I.setHasNoNaNs(F.NoNaNs);
+      I.setHasNoInfs(F.NoInfs);
+      I.setHasNoSignedZeros(F.NoSignedZeros);
+      I.setHasAllowReciprocal(F.AllowReciprocal);
+      I.setHasAllowContract(F.AllowContract);
+      I.setHasApproxFunc(F.ApproxFunc);
       break;
+    }
     case OperationType::NonNegOp:
       I.setNonNeg(NonNegFlags.NonNeg);
       break;
@@ -811,24 +833,31 @@ class VPIRFlags {
   }
 
   CmpInst::Predicate getPredicate() const {
-    assert(OpType == OperationType::Cmp &&
+    assert((OpType == OperationType::Cmp || OpType == OperationType::FCmp) &&
            "recipe doesn't have a compare predicate");
-    return CmpPredicate;
+    return OpType == OperationType::FCmp ? FCmpFlags.Pred : CmpPredicate;
   }
 
   void setPredicate(CmpInst::Predicate Pred) {
-    assert(OpType == OperationType::Cmp &&
+    assert((OpType == OperationType::Cmp || OpType == OperationType::FCmp) &&
            "recipe doesn't have a compare predicate");
-    CmpPredicate = Pred;
+    if (OpType == OperationType::FCmp)
+      FCmpFlags.Pred = Pred;
+    else
+      CmpPredicate = Pred;
   }
 
   GEPNoWrapFlags getGEPNoWrapFlags() const { return GEPFlags; }
 
   /// Returns true if the recipe has a comparison predicate.
-  bool hasPredicate() const { return OpType == OperationType::Cmp; }
+  bool hasPredicate() const {
+    return OpType == OperationType::Cmp || OpType == OperationType::FCmp;
+  }
 
   /// Returns true if the recipe has fast-math flags.
-  bool hasFastMathFlags() const { return OpType == OperationType::FPMathOp; }
+  bool hasFastMathFlags() const {
+    return OpType == OperationType::FPMathOp || OpType == OperationType::FCmp;
+  }
 
   LLVM_ABI_FOR_TEST FastMathFlags getFastMathFlags() const;
 
@@ -869,6 +898,16 @@ class VPIRFlags {
     return DisjointFlags.IsDisjoint;
   }
 
+private:
+  /// Get a reference to the fast-math flags for FPMathOp or FCmp.
+  FastMathFlagsTy &getFMFsRef() {
+    return OpType == OperationType::FCmp ? FCmpFlags.FMFs : FMFs;
+  }
+  const FastMathFlagsTy &getFMFsRef() const {
+    return OpType == OperationType::FCmp ? FCmpFlags.FMFs : FMFs;
+  }
+
+public:
 #if !defined(NDEBUG)
   /// Returns true if the set flags are valid for \p Opcode.
   bool flagsValidForOpcode(unsigned Opcode) const;
diff --git a/llvm/lib/Transforms/Vectorize/VPlanRecipes.cpp b/llvm/lib/Transforms/Vectorize/VPlanRecipes.cpp
@@ -453,8 +453,12 @@ void VPIRFlags::intersectFlags(const VPIRFlags &Other) {
     GEPFlags &= Other.GEPFlags;
     break;
   case OperationType::FPMathOp:
-    FMFs.NoNaNs &= Other.FMFs.NoNaNs;
-    FMFs.NoInfs &= Other.FMFs.NoInfs;
+  case OperationType::FCmp:
+    assert((OpType != OperationType::FCmp ||
+            FCmpFlags.Pred == Other.FCmpFlags.Pred) &&
+           "Cannot drop CmpPredicate");
+    getFMFsRef().NoNaNs &= Other.getFMFsRef().NoNaNs;
+    getFMFsRef().NoInfs &= Other.getFMFsRef().NoInfs;
     break;
   case OperationType::NonNegOp:
     NonNegFlags.NonNeg &= Other.NonNegFlags.NonNeg;
@@ -469,16 +473,17 @@ void VPIRFlags::intersectFlags(const VPIRFlags &Other) {
 }
 
 FastMathFlags VPIRFlags::getFastMathFlags() const {
-  assert(OpType == OperationType::FPMathOp &&
+  assert((OpType == OperationType::FPMathOp || OpType == OperationType::FCmp) &&
          "recipe doesn't have fast math flags");
+  const FastMathFlagsTy &F = getFMFsRef();
   FastMathFlags Res;
-  Res.setAllowReassoc(FMFs.AllowReassoc);
-  Res.setNoNaNs(FMFs.NoNaNs);
-  Res.setNoInfs(FMFs.NoInfs);
-  Res.setNoSignedZeros(FMFs.NoSignedZeros);
-  Res.setAllowReciprocal(FMFs.AllowReciprocal);
-  Res.setAllowContract(FMFs.AllowContract);
-  Res.setApproxFunc(FMFs.ApproxFunc);
+  Res.setAllowReassoc(F.AllowReassoc);
+  Res.setNoNaNs(F.NoNaNs);
+  Res.setNoInfs(F.NoInfs);
+  Res.setNoSignedZeros(F.NoSignedZeros);
+  Res.setAllowReciprocal(F.AllowReciprocal);
+  Res.setAllowContract(F.AllowContract);
+  Res.setApproxFunc(F.ApproxFunc);
   return Res;
 }
 
@@ -2074,11 +2079,12 @@ bool VPIRFlags::flagsValidForOpcode(unsigned Opcode) const {
            Opcode == Instruction::FMul || Opcode == Instruction::FSub ||
            Opcode == Instruction::FNeg || Opcode == Instruction::FDiv ||
            Opcode == Instruction::FRem || Opcode == Instruction::FPExt ||
-           Opcode == Instruction::FPTrunc || Opcode == Instruction::FCmp ||
-           Opcode == Instruction::Select ||
+           Opcode == Instruction::FPTrunc || Opcode == Instruction::Select ||
            Opcode == VPInstruction::WideIVStep ||
            Opcode == VPInstruction::ReductionStartVector ||
            Opcode == VPInstruction::ComputeReductionResult;
+  case OperationType::FCmp:
+    return Opcode == Instruction::FCmp;
   case OperationType::NonNegOp:
     return Opcode == Instruction::ZExt || Opcode == Instruction::UIToFP;
   case OperationType::Cmp:
@@ -2096,6 +2102,10 @@ void VPIRFlags::printFlags(raw_ostream &O) const {
   case OperationType::Cmp:
     O << " " << CmpInst::getPredicateName(getPredicate());
     break;
+  case OperationType::FCmp:
+    O << " " << CmpInst::getPredicateName(getPredicate());
+    getFastMathFlags().print(O);
+    break;
   case OperationType::DisjointOp:
     if (DisjointFlags.IsDisjoint)
       O << " disjoint";
@@ -2204,15 +2214,14 @@ void VPWidenRecipe::execute(VPTransformState &State) {
     Value *B = State.get(getOperand(1));
     Value *C = nullptr;
     if (FCmp) {
-      // Propagate fast math flags.
-      C = Builder.CreateFCmpFMF(
-          getPredicate(), A, B,
-          dyn_cast_or_null<Instruction>(getUnderlyingValue()));
+      C = Builder.CreateFCmp(getPredicate(), A, B);
     } else {
       C = Builder.CreateICmp(getPredicate(), A, B);
     }
-    if (auto *I = dyn_cast<Instruction>(C))
+    if (auto *I = dyn_cast<Instruction>(C)) {
+      applyFlags(*I);
       applyMetadata(*I);
+    }
     State.set(this, C);
     break;
   }
diff --git a/llvm/test/Transforms/LoopVectorize/ARM/mve-icmpcost.ll b/llvm/test/Transforms/LoopVectorize/ARM/mve-icmpcost.ll
@@ -293,8 +293,8 @@ while.end:                                        ; preds = %while.end.loopexit,
 }
 
 ; CHECK: LV: Found an estimated cost of 1 for VF 1 For instruction:   %cmp1 = fcmp
-; CHECK: Cost of 12 for VF 2: WIDEN ir<%cmp1> = fcmp olt ir<%0>, ir<0.000000e+00>
-; CHECK: Cost of 24 for VF 4: WIDEN ir<%cmp1> = fcmp olt ir<%0>, ir<0.000000e+00>
+; CHECK: Cost of 12 for VF 2: WIDEN ir<%cmp1> = fcmp olt nnan ninf nsz ir<%0>, ir<0.000000e+00>
+; CHECK: Cost of 24 for VF 4: WIDEN ir<%cmp1> = fcmp olt nnan ninf nsz ir<%0>, ir<0.000000e+00>
 define void @floatcmp(ptr nocapture readonly %pSrc, ptr nocapture %pDst, i32 %blockSize) #0 {
 entry:
   %cmp.not7 = icmp eq i32 %blockSize, 0
diff --git a/llvm/test/Transforms/LoopVectorize/vplan-printing.ll b/llvm/test/Transforms/LoopVectorize/vplan-printing.ll
@@ -1035,7 +1035,7 @@ define void @print_select_with_fastmath_flags(ptr noalias %a, ptr noalias %b, pt
 ; CHECK-NEXT:     CLONE ir<[[GEP2:%.+]]> = getelementptr inbounds nuw ir<%c>, vp<[[ST]]>
 ; CHECK-NEXT:     vp<[[PTR2:%.+]]> = vector-pointer ir<[[GEP2]]>
 ; CHECK-NEXT:     WIDEN ir<[[LD2:%.+]]> = load vp<[[PTR2]]>
-; CHECK-NEXT:     WIDEN ir<[[FCMP:%.+]]> = fcmp ogt ir<[[LD1]]>, ir<[[LD2]]>
+; CHECK-NEXT:     WIDEN ir<[[FCMP:%.+]]> = fcmp ogt fast ir<[[LD1]]>, ir<[[LD2]]>
 ; CHECK-NEXT:     WIDEN ir<[[FADD:%.+]]> = fadd fast ir<[[LD1]]>, ir<1.000000e+01>
 ; CHECK-NEXT:     WIDEN-SELECT ir<[[SELECT:%.+]]> = select fast ir<[[FCMP]]>, ir<[[FADD]]>, ir<[[LD2]]>
 ; CHECK-NEXT:     CLONE ir<[[GEP3:%.+]]> = getelementptr inbounds nuw ir<%a>, vp<[[ST]]>