SelectionDAG/expandFMINIMUMNUM_FMAXIMUMNUM: FCANONICALIZE is needed only for sNaN

wzssyqa · wzssyqa · commit d65a0252687a · 2025-03-06T18:34:08.000+08:00
If we are sure that it is not sNaN, even it may be qNaN, we can use
it directly.
diff --git a/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp b/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
@@ -7676,6 +7676,9 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
          N2.getOpcode() != ISD::DELETED_NODE &&
          N3.getOpcode() != ISD::DELETED_NODE &&
          "Operand is DELETED_NODE!");
+
+  SDNodeFlags NewFlags = Flags;
+
   // Perform various simplifications.
   switch (Opcode) {
   case ISD::FMA:
@@ -7734,6 +7737,13 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
   }
   case ISD::SELECT:
   case ISD::VSELECT:
+    if ((N1->getFlags().hasNoSNaNs() && N2->getFlags().hasNoSNaNs()) ||
+        N3->getFlags().hasNoSNaNs())
+      NewFlags.setNoSNaNs(true);
+    if ((N1->getFlags().hasNoQNaNs() && N2->getFlags().hasNoQNaNs()) ||
+        N3->getFlags().hasNoQNaNs())
+      NewFlags.setNoQNaNs(true);
+
     if (SDValue V = simplifySelect(N1, N2, N3))
       return V;
     break;
@@ -7862,12 +7872,12 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
     AddNodeIDNode(ID, Opcode, VTs, Ops);
     void *IP = nullptr;
     if (SDNode *E = FindNodeOrInsertPos(ID, DL, IP)) {
-      E->intersectFlagsWith(Flags);
+      E->intersectFlagsWith(NewFlags);
       return SDValue(E, 0);
     }
 
     N = newSDNode<SDNode>(Opcode, DL.getIROrder(), DL.getDebugLoc(), VTs);
-    N->setFlags(Flags);
+    N->setFlags(NewFlags);
     createOperands(N, Ops);
     CSEMap.InsertNode(N, IP);
   } else {
@@ -10325,6 +10335,8 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
            "Operand is DELETED_NODE!");
 #endif
 
+  SDNodeFlags NewFlags = Flags;
+
   switch (Opcode) {
   default: break;
   case ISD::BUILD_VECTOR:
@@ -10349,6 +10361,10 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
                 VT.getVectorElementCount()) &&
            "Expected select_cc with vector result to have the same sized "
            "comparison type!");
+    if (Ops[2]->getFlags().hasNoSNaNs() && Ops[3]->getFlags().hasNoSNaNs())
+      NewFlags.setNoSNaNs(true);
+    if (Ops[2]->getFlags().hasNoQNaNs() && Ops[3]->getFlags().hasNoQNaNs())
+      NewFlags.setNoQNaNs(true);
     break;
   case ISD::BR_CC:
     assert(NumOps == 5 && "BR_CC takes 5 operands!");
@@ -10415,7 +10431,7 @@ SDValue SelectionDAG::getNode(unsigned Opcode, const SDLoc &DL, EVT VT,
     createOperands(N, Ops);
   }
 
-  N->setFlags(Flags);
+  N->setFlags(NewFlags);
   InsertNode(N);
   SDValue V(N, 0);
   NewSDValueDbgMsg(V, "Creating new node: ", this);
diff --git a/llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp b/llvm/lib/CodeGen/SelectionDAG/TargetLowering.cpp
@@ -8664,8 +8664,8 @@ SDValue TargetLowering::expandFMINIMUMNUM_FMAXIMUMNUM(SDNode *Node,
   SDValue MinMax =
       DAG.getSelectCC(DL, LHS, RHS, LHS, RHS, IsMax ? ISD::SETGT : ISD::SETLT);
   // If MinMax is NaN, let's quiet it.
-  if (!Flags.hasNoNaNs() && !DAG.isKnownNeverNaN(LHS) &&
-      !DAG.isKnownNeverNaN(RHS)) {
+  if (!Flags.hasNoNaNs() && !DAG.isKnownNeverSNaN(LHS) &&
+      !DAG.isKnownNeverSNaN(RHS)) {
     MinMax = DAG.getNode(ISD::FCANONICALIZE, DL, VT, MinMax, Flags);
   }
 
diff --git a/llvm/test/CodeGen/Mips/nofpclass-maximumnum-minimumnum.ll b/llvm/test/CodeGen/Mips/nofpclass-maximumnum-minimumnum.ll
@@ -0,0 +1,225 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc --mtriple=mipsisa64r6 < %s | FileCheck %s --check-prefix=MIPS64R6
+; RUN: llc --mtriple=mips64 < %s | FileCheck %s --check-prefix=MIPS64R2
+
+declare float @llvm.maximumnum.f32(float, float)
+declare double @llvm.maximumnum.f64(double, double)
+declare float @llvm.minimumnum.f32(float, float)
+declare double @llvm.minimumnum.f64(double, double)
+
+define float @maximumnum_float_nnan(float nofpclass(nan) %x, float nofpclass(nan) %y) {
+; MIPS64R6-LABEL: maximumnum_float_nnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.s $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: maximumnum_float_nnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.ule.s $f12, $f13
+; MIPS64R2-NEXT:    mov.s $f0, $f13
+; MIPS64R2-NEXT:    movf.s $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    mfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.s $f1, $f0
+; MIPS64R2-NEXT:    movz.s $f1, $f12, $1
+; MIPS64R2-NEXT:    mfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.s $f1, $f13, $1
+; MIPS64R2-NEXT:    mtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.s $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.s $f0, $f1, $fcc0
+  %z = call float @llvm.maximumnum.f32(float %x, float %y)
+  ret float %z
+}
+
+define float @maximumnum_float_nsnan(float nofpclass(snan) %x, float nofpclass(snan) %y) {
+; MIPS64R6-LABEL: maximumnum_float_nsnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.s $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: maximumnum_float_nsnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.un.s $f12, $f12
+; MIPS64R2-NEXT:    movt.s $f12, $f13, $fcc0
+; MIPS64R2-NEXT:    c.un.s $f13, $f13
+; MIPS64R2-NEXT:    movt.s $f13, $f12, $fcc0
+; MIPS64R2-NEXT:    c.ule.s $f12, $f13
+; MIPS64R2-NEXT:    mov.s $f0, $f13
+; MIPS64R2-NEXT:    movf.s $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    mfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.s $f1, $f0
+; MIPS64R2-NEXT:    movz.s $f1, $f12, $1
+; MIPS64R2-NEXT:    mfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.s $f1, $f13, $1
+; MIPS64R2-NEXT:    mtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.s $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.s $f0, $f1, $fcc0
+  %z = call float @llvm.maximumnum.f32(float %x, float %y)
+  ret float %z
+}
+
+define float @minimumnum_float_nnan(float nofpclass(nan) %x, float nofpclass(nan) %y) {
+; MIPS64R6-LABEL: minimumnum_float_nnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    min.s $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: minimumnum_float_nnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.olt.s $f12, $f13
+; MIPS64R2-NEXT:    mov.s $f0, $f13
+; MIPS64R2-NEXT:    movt.s $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    mfc1 $1, $f12
+; MIPS64R2-NEXT:    lui $2, 32768
+; MIPS64R2-NEXT:    xor $1, $1, $2
+; MIPS64R2-NEXT:    mov.s $f1, $f0
+; MIPS64R2-NEXT:    movz.s $f1, $f12, $1
+; MIPS64R2-NEXT:    mfc1 $1, $f13
+; MIPS64R2-NEXT:    xor $1, $1, $2
+; MIPS64R2-NEXT:    movz.s $f1, $f13, $1
+; MIPS64R2-NEXT:    mtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.s $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.s $f0, $f1, $fcc0
+  %z = call float @llvm.minimumnum.f32(float %x, float %y)
+  ret float %z
+}
+
+define float @minimumnum_float_nsnan(float nofpclass(snan) %x, float nofpclass(snan) %y) {
+; MIPS64R6-LABEL: minimumnum_float_nsnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.s $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: minimumnum_float_nsnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.un.s $f12, $f12
+; MIPS64R2-NEXT:    movt.s $f12, $f13, $fcc0
+; MIPS64R2-NEXT:    c.un.s $f13, $f13
+; MIPS64R2-NEXT:    movt.s $f13, $f12, $fcc0
+; MIPS64R2-NEXT:    c.ule.s $f12, $f13
+; MIPS64R2-NEXT:    mov.s $f0, $f13
+; MIPS64R2-NEXT:    movf.s $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    mfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.s $f1, $f0
+; MIPS64R2-NEXT:    movz.s $f1, $f12, $1
+; MIPS64R2-NEXT:    mfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.s $f1, $f13, $1
+; MIPS64R2-NEXT:    mtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.s $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.s $f0, $f1, $fcc0
+  %z = call float @llvm.maximumnum.f32(float %x, float %y)
+  ret float %z
+}
+
+
+
+define double @maximumnum_double_nnan(double nofpclass(nan) %x, double nofpclass(nan) %y) {
+; MIPS64R6-LABEL: maximumnum_double_nnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.d $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: maximumnum_double_nnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.ule.d $f12, $f13
+; MIPS64R2-NEXT:    mov.d $f0, $f13
+; MIPS64R2-NEXT:    movf.d $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    dmfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.d $f1, $f0
+; MIPS64R2-NEXT:    movz.d $f1, $f12, $1
+; MIPS64R2-NEXT:    dmfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.d $f1, $f13, $1
+; MIPS64R2-NEXT:    dmtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.d $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.d $f0, $f1, $fcc0
+  %z = call double @llvm.maximumnum.f64(double %x, double %y)
+  ret double %z
+}
+
+define double @maximumnum_double_nsnan(double nofpclass(snan) %x, double nofpclass(snan) %y) {
+; MIPS64R6-LABEL: maximumnum_double_nsnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.d $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: maximumnum_double_nsnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.un.d $f12, $f12
+; MIPS64R2-NEXT:    movt.d $f12, $f13, $fcc0
+; MIPS64R2-NEXT:    c.un.d $f13, $f13
+; MIPS64R2-NEXT:    movt.d $f13, $f12, $fcc0
+; MIPS64R2-NEXT:    c.ule.d $f12, $f13
+; MIPS64R2-NEXT:    mov.d $f0, $f13
+; MIPS64R2-NEXT:    movf.d $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    dmfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.d $f1, $f0
+; MIPS64R2-NEXT:    movz.d $f1, $f12, $1
+; MIPS64R2-NEXT:    dmfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.d $f1, $f13, $1
+; MIPS64R2-NEXT:    dmtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.d $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.d $f0, $f1, $fcc0
+  %z = call double @llvm.maximumnum.f64(double %x, double %y)
+  ret double %z
+}
+
+define double @minimumnum_double_nnan(double nofpclass(nan) %x, double nofpclass(nan) %y) {
+; MIPS64R6-LABEL: minimumnum_double_nnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    min.d $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: minimumnum_double_nnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.olt.d $f12, $f13
+; MIPS64R2-NEXT:    mov.d $f0, $f13
+; MIPS64R2-NEXT:    movt.d $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    daddiu $1, $zero, 1
+; MIPS64R2-NEXT:    dsll $1, $1, 63
+; MIPS64R2-NEXT:    dmfc1 $2, $f12
+; MIPS64R2-NEXT:    xor $2, $2, $1
+; MIPS64R2-NEXT:    mov.d $f1, $f0
+; MIPS64R2-NEXT:    movz.d $f1, $f12, $2
+; MIPS64R2-NEXT:    dmfc1 $2, $f13
+; MIPS64R2-NEXT:    xor $1, $2, $1
+; MIPS64R2-NEXT:    movz.d $f1, $f13, $1
+; MIPS64R2-NEXT:    dmtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.d $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.d $f0, $f1, $fcc0
+  %z = call double @llvm.minimumnum.f64(double %x, double %y)
+  ret double %z
+}
+
+define double @minimumnum_double_nsnan(double nofpclass(snan) %x, double nofpclass(snan) %y) {
+; MIPS64R6-LABEL: minimumnum_double_nsnan:
+; MIPS64R6:       # %bb.0:
+; MIPS64R6-NEXT:    jr $ra
+; MIPS64R6-NEXT:    max.d $f0, $f12, $f13
+;
+; MIPS64R2-LABEL: minimumnum_double_nsnan:
+; MIPS64R2:       # %bb.0:
+; MIPS64R2-NEXT:    c.un.d $f12, $f12
+; MIPS64R2-NEXT:    movt.d $f12, $f13, $fcc0
+; MIPS64R2-NEXT:    c.un.d $f13, $f13
+; MIPS64R2-NEXT:    movt.d $f13, $f12, $fcc0
+; MIPS64R2-NEXT:    c.ule.d $f12, $f13
+; MIPS64R2-NEXT:    mov.d $f0, $f13
+; MIPS64R2-NEXT:    movf.d $f0, $f12, $fcc0
+; MIPS64R2-NEXT:    dmfc1 $1, $f12
+; MIPS64R2-NEXT:    mov.d $f1, $f0
+; MIPS64R2-NEXT:    movz.d $f1, $f12, $1
+; MIPS64R2-NEXT:    dmfc1 $1, $f13
+; MIPS64R2-NEXT:    movz.d $f1, $f13, $1
+; MIPS64R2-NEXT:    dmtc1 $zero, $f2
+; MIPS64R2-NEXT:    c.eq.d $f0, $f2
+; MIPS64R2-NEXT:    jr $ra
+; MIPS64R2-NEXT:    movt.d $f0, $f1, $fcc0
+  %z = call double @llvm.maximumnum.f64(double %x, double %y)
+  ret double %z
+}