Addressed comments

guy-david · guy-david · commit 0df2dcc4766a · 2025-10-22T12:16:34.000+03:00
diff --git a/llvm/include/llvm/CodeGen/SelectionDAG.h b/llvm/include/llvm/CodeGen/SelectionDAG.h
@@ -2322,6 +2322,10 @@ class SelectionDAG {
   /// +nan are considered positive, -0.0, -inf and -nan are not.
   LLVM_ABI bool cannotBeOrderedNegativeFP(SDValue Op) const;
 
+  /// Check if all uses of a floating-point value are insensitive to signed
+  /// zeros.
+  LLVM_ABI bool allUsesSignedZeroInsensitive(SDValue Op) const;
+
   /// Test whether two SDValues are known to compare equal. This
   /// is true if they are the same value, or if one is negative zero and the
   /// other positive zero.
diff --git a/llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp b/llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
@@ -18871,37 +18871,6 @@ SDValue DAGCombiner::visitFPOW(SDNode *N) {
 
   return SDValue();
 }
-/// Check if a use of a floating-point operation doesn't care about the sign of
-/// zero. This allows us to optimize (sitofp (fptosi x)) -> ftrunc(x) even
-/// without NoSignedZerosFPMath, as long as all uses are sign-insensitive.
-static bool isSignInsensitiveUse(SDNode *Use, unsigned OperandNo,
-                                 SelectionDAG &DAG) {
-  switch (Use->getOpcode()) {
-  case ISD::SETCC:
-    // Comparisons: IEEE 754 specifies +0.0 == -0.0.
-  case ISD::FABS:
-    // fabs always produces +0.0.
-    return true;
-  case ISD::FADD:
-  case ISD::FSUB: {
-    // Arithmetic with non-zero constants fixes the uncertainty around the sign
-    // bit.
-    SDValue Other = Use->getOperand(1 - OperandNo);
-    return DAG.isKnownNeverZeroFloat(Other);
-  }
-  default:
-    return false;
-  }
-}
-
-/// Check if all uses of a value are insensitive to the sign of zero.
-static bool allUsesSignInsensitive(SDValue V, SelectionDAG &DAG) {
-  return all_of(V->uses(), [&](SDUse &Use) {
-    SDNode *User = Use.getUser();
-    unsigned OperandNo = Use.getOperandNo();
-    return isSignInsensitiveUse(User, OperandNo, DAG);
-  });
-}
 
 static SDValue foldFPToIntToFP(SDNode *N, const SDLoc &DL, SelectionDAG &DAG,
                                const TargetLowering &TLI) {
@@ -18924,7 +18893,7 @@ static SDValue foldFPToIntToFP(SDNode *N, const SDLoc &DL, SelectionDAG &DAG,
   assert(IsSigned || IsUnsigned);
 
   bool IsSignedZeroSafe = DAG.getTarget().Options.NoSignedZerosFPMath ||
-                          allUsesSignInsensitive(SDValue(N, 0), DAG);
+                          DAG.allUsesSignedZeroInsensitive(SDValue(N, 0));
   // For signed conversions: The optimization changes signed zero behavior.
   if (IsSigned && !IsSignedZeroSafe)
     return SDValue();
diff --git a/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp b/llvm/lib/CodeGen/SelectionDAG/SelectionDAG.cpp
@@ -6075,6 +6075,35 @@ bool SelectionDAG::isKnownNeverZeroFloat(SDValue Op) const {
       Op, [](ConstantFPSDNode *C) { return !C->isZero(); });
 }
 
+bool SelectionDAG::allUsesSignedZeroInsensitive(SDValue Op) const {
+  assert(Op.getValueType().isFloatingPoint());
+  return all_of(Op->uses(), [&](SDUse &Use) {
+    SDNode *User = Use.getUser();
+    unsigned OperandNo = Use.getOperandNo();
+
+    // Check if this use is insensitive to the sign of zero
+    switch (User->getOpcode()) {
+    case ISD::SETCC:
+      // Comparisons: IEEE-754 specifies +0.0 == -0.0.
+    case ISD::FABS:
+      // fabs always produces +0.0.
+      return true;
+    case ISD::FCOPYSIGN:
+      // copysign overwrites the sign bit of the first operand.
+      return OperandNo == 0;
+    case ISD::FADD:
+    case ISD::FSUB: {
+      // Arithmetic with non-zero constants fixes the uncertainty around the
+      // sign bit.
+      SDValue Other = User->getOperand(1 - OperandNo);
+      return isKnownNeverZeroFloat(Other);
+    }
+    default:
+      return false;
+    }
+  });
+}
+
 bool SelectionDAG::isKnownNeverZero(SDValue Op, unsigned Depth) const {
   if (Depth >= MaxRecursionDepth)
     return false; // Limit search depth.
diff --git a/llvm/test/CodeGen/AArch64/fp-to-int-to-fp.ll b/llvm/test/CodeGen/AArch64/fp-to-int-to-fp.ll
@@ -154,6 +154,48 @@ define i1 @test_fcmp(float %x) {
   ret i1 %cmp
 }
 
+define float @test_fabs(float %x) {
+; CHECK-LABEL: test_fabs:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    frintz s0, s0
+; CHECK-NEXT:    fabs s0, s0
+; CHECK-NEXT:    ret
+;
+; NO-SIGNED-ZEROS-LABEL: test_fabs:
+; NO-SIGNED-ZEROS:       // %bb.0:
+; NO-SIGNED-ZEROS-NEXT:    frintz s0, s0
+; NO-SIGNED-ZEROS-NEXT:    fabs s0, s0
+; NO-SIGNED-ZEROS-NEXT:    ret
+  %conv1 = fptosi float %x to i32
+  %conv2 = sitofp i32 %conv1 to float
+  %abs = call float @llvm.fabs.f32(float %conv2)
+  ret float %abs
+}
+
+define float @test_copysign(float %x, float %y) {
+; CHECK-LABEL: test_copysign:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    frintz s0, s0
+; CHECK-NEXT:    mvni v2.4s, #128, lsl #24
+; CHECK-NEXT:    // kill: def $s1 killed $s1 def $q1
+; CHECK-NEXT:    bif v0.16b, v1.16b, v2.16b
+; CHECK-NEXT:    // kill: def $s0 killed $s0 killed $q0
+; CHECK-NEXT:    ret
+;
+; NO-SIGNED-ZEROS-LABEL: test_copysign:
+; NO-SIGNED-ZEROS:       // %bb.0:
+; NO-SIGNED-ZEROS-NEXT:    frintz s0, s0
+; NO-SIGNED-ZEROS-NEXT:    mvni v2.4s, #128, lsl #24
+; NO-SIGNED-ZEROS-NEXT:    // kill: def $s1 killed $s1 def $q1
+; NO-SIGNED-ZEROS-NEXT:    bif v0.16b, v1.16b, v2.16b
+; NO-SIGNED-ZEROS-NEXT:    // kill: def $s0 killed $s0 killed $q0
+; NO-SIGNED-ZEROS-NEXT:    ret
+  %conv1 = fptosi float %x to i32
+  %conv2 = sitofp i32 %conv1 to float
+  %combine = call float @llvm.copysign.f32(float %conv2, float %y)
+  ret float %combine
+}
+
 define float @test_fadd(float %x) {
 ; CHECK-LABEL: test_fadd:
 ; CHECK:       // %bb.0:
@@ -174,26 +216,29 @@ define float @test_fadd(float %x) {
   ret float %add
 }
 
-define float @test_fabs(float %x) {
-; CHECK-LABEL: test_fabs:
+define float @test_fsub(float %x) {
+; CHECK-LABEL: test_fsub:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    frintz s0, s0
-; CHECK-NEXT:    fabs s0, s0
+; CHECK-NEXT:    fmov s1, #-1.00000000
+; CHECK-NEXT:    fadd s0, s0, s1
 ; CHECK-NEXT:    ret
 ;
-; NO-SIGNED-ZEROS-LABEL: test_fabs:
+; NO-SIGNED-ZEROS-LABEL: test_fsub:
 ; NO-SIGNED-ZEROS:       // %bb.0:
 ; NO-SIGNED-ZEROS-NEXT:    frintz s0, s0
-; NO-SIGNED-ZEROS-NEXT:    fabs s0, s0
+; NO-SIGNED-ZEROS-NEXT:    fmov s1, #-1.00000000
+; NO-SIGNED-ZEROS-NEXT:    fadd s0, s0, s1
 ; NO-SIGNED-ZEROS-NEXT:    ret
   %conv1 = fptosi float %x to i32
   %conv2 = sitofp i32 %conv1 to float
-  %abs = call float @llvm.fabs.f32(float %conv2)
-  ret float %abs
+  %sub = fsub float %conv2, 1.0
+  ret float %sub
 }
 
 declare i32 @llvm.smin.i32(i32, i32)
 declare i32 @llvm.smax.i32(i32, i32)
 declare i32 @llvm.umin.i32(i32, i32)
 declare i32 @llvm.umax.i32(i32, i32)
 declare float @llvm.fabs.f32(float)
+declare float @llvm.copysign.f32(float, float)