Addressed the review comments3

JaydeepChauhan14 · JaydeepChauhan14 · commit a998dad3b193 · 2025-09-23T09:24:29.000-07:00
diff --git a/llvm/lib/Target/X86/GISel/X86LegalizerInfo.cpp b/llvm/lib/Target/X86/GISel/X86LegalizerInfo.cpp
@@ -898,26 +898,23 @@ bool X86LegalizerInfo::legalizeSETROUNDING(MachineInstr &MI,
   // Check if Src is a constant
   auto *SrcDef = MRI.getVRegDef(Src);
   Register RMBits;
+  Register MXCSRRMBits;
+
   if (SrcDef && SrcDef->getOpcode() == TargetOpcode::G_CONSTANT) {
     uint64_t RM = getIConstantFromReg(Src, MRI).getZExtValue();
-    int FieldVal;
-    switch (static_cast<RoundingMode>(RM)) {
-    case RoundingMode::NearestTiesToEven:
-      FieldVal = X86::rmToNearest;
-      break;
-    case RoundingMode::TowardNegative:
-      FieldVal = X86::rmDownward;
-      break;
-    case RoundingMode::TowardPositive:
-      FieldVal = X86::rmUpward;
-      break;
-    case RoundingMode::TowardZero:
-      FieldVal = X86::rmTowardZero;
-      break;
-    default:
-      report_fatal_error("rounding mode is not supported by X86 hardware");
+    int FieldVal = X86::getRoundingModeX86(RM);
+
+    if (FieldVal == X86::rmInvalid) {
+      LLVMContext &C = MF.getFunction().getContext();
+      C.diagnose(DiagnosticInfoUnsupported(
+          MF.getFunction(), "rounding mode is not supported by X86 hardware",
+          DiagnosticLocation(MI.getDebugLoc()), DS_Error));
+      return false;
     }
+
+    FieldVal = FieldVal << 3;
     RMBits = MIRBuilder.buildConstant(s16, FieldVal).getReg(0);
+    MXCSRRMBits = MIRBuilder.buildConstant(s32, FieldVal).getReg(0);
   } else {
     // Convert Src (rounding mode) to bits for control word
     // (0xc9 << (2 * Src + 4)) & 0xc00
@@ -931,6 +928,12 @@ bool X86LegalizerInfo::legalizeSETROUNDING(MachineInstr &MI,
     RMBits =
         MIRBuilder.buildAnd(s16, Shifted, MIRBuilder.buildConstant(s16, 0xc00))
             .getReg(0);
+
+    // For non-constant case, we still need to compute MXCSR bits dynamically
+    auto RMBits32 = MIRBuilder.buildZExt(s32, RMBits);
+    MXCSRRMBits =
+        MIRBuilder.buildShl(s32, RMBits32, MIRBuilder.buildConstant(s32, 3))
+            .getReg(0);
   }
   // Update rounding mode bits
   auto NewCWD =
@@ -966,11 +969,6 @@ bool X86LegalizerInfo::legalizeSETROUNDING(MachineInstr &MI,
     auto ClearedMXCSR = MIRBuilder.buildAnd(
         s32, MXCSR, MIRBuilder.buildConstant(s32, 0xffff9fff));
 
-    // Shift x87 RM bits from 11:10 to 14:13
-    auto RMBits32 = MIRBuilder.buildZExt(s32, RMBits);
-    auto MXCSRRMBits =
-        MIRBuilder.buildShl(s32, RMBits32, MIRBuilder.buildConstant(s32, 3));
-
     // Update rounding mode bits
     auto NewMXCSR = MIRBuilder.buildOr(s32, ClearedMXCSR, MXCSRRMBits);
 
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -5346,6 +5346,19 @@ bool isConstantSplat(SDValue Op, APInt &SplatVal, bool AllowPartialUndefs) {
 
   return false;
 }
+
+int getRoundingModeX86(unsigned RM) {
+  switch (static_cast<::llvm::RoundingMode>(RM)) {
+    // clang-format off
+  case ::llvm::RoundingMode::NearestTiesToEven: return X86::rmToNearest; break;
+  case ::llvm::RoundingMode::TowardNegative:    return X86::rmDownward; break;
+  case ::llvm::RoundingMode::TowardPositive:    return X86::rmUpward; break;
+  case ::llvm::RoundingMode::TowardZero:        return X86::rmTowardZero; break;
+  default:
+    return X86::rmInvalid; // Invalid rounding mode
+  }
+}
+
 } // namespace X86
 } // namespace llvm
 
@@ -28698,16 +28711,14 @@ SDValue X86TargetLowering::LowerSET_ROUNDING(SDValue Op,
   SDValue RMBits;
   if (auto *CVal = dyn_cast<ConstantSDNode>(NewRM)) {
     uint64_t RM = CVal->getZExtValue();
-    int FieldVal;
-    switch (static_cast<RoundingMode>(RM)) {
-    // clang-format off
-    case RoundingMode::NearestTiesToEven: FieldVal = X86::rmToNearest; break;
-    case RoundingMode::TowardNegative:    FieldVal = X86::rmDownward; break;
-    case RoundingMode::TowardPositive:    FieldVal = X86::rmUpward; break;
-    case RoundingMode::TowardZero:        FieldVal = X86::rmTowardZero; break;
-    default:
-      llvm_unreachable("rounding mode is not supported by X86 hardware");
-    // clang-format on
+    int FieldVal = X86::getRoundingModeX86(RM);
+
+    if (FieldVal == X86::rmInvalid) {
+      LLVMContext &C = MF.getFunction().getContext();
+      C.diagnose(DiagnosticInfoUnsupported(
+          MF.getFunction(), "rounding mode is not supported by X86 hardware",
+          DiagnosticLocation(DL.getDebugLoc()), DS_Error));
+      return {};
     }
     RMBits = DAG.getConstant(FieldVal, DL, MVT::i16);
   } else {
diff --git a/llvm/lib/Target/X86/X86ISelLowering.h b/llvm/lib/Target/X86/X86ISelLowering.h
@@ -1004,13 +1004,14 @@ namespace llvm {
     /// Current rounding mode is represented in bits 11:10 of FPSR. These
     /// values are same as corresponding constants for rounding mode used
     /// in glibc.
-    enum RoundingMode {
-      rmToNearest   = 0,        // FE_TONEAREST
-      rmDownward    = 1 << 10,  // FE_DOWNWARD
-      rmUpward      = 2 << 10,  // FE_UPWARD
-      rmTowardZero  = 3 << 10,  // FE_TOWARDZERO
-      rmMask        = 3 << 10   // Bit mask selecting rounding mode
-    };
+  enum RoundingMode {
+    rmInvalid = -1,         // For handle Invalid rounding mode
+    rmToNearest = 0,        // FE_TONEAREST
+    rmDownward = 1 << 10,   // FE_DOWNWARD
+    rmUpward = 2 << 10,     // FE_UPWARD
+    rmTowardZero = 3 << 10, // FE_TOWARDZERO
+    rmMask = 3 << 10        // Bit mask selecting rounding mode
+  };
   }
 
   /// Define some predicates that are used for node matching.
@@ -1058,6 +1059,10 @@ namespace llvm {
     /// functions.
     bool isExtendedSwiftAsyncFrameSupported(const X86Subtarget &Subtarget,
                                             const MachineFunction &MF);
+
+    /// Convert LLVM rounding mode to X86 rounding mode.
+    int getRoundingModeX86(unsigned RM);
+
   } // end namespace X86
 
   //===--------------------------------------------------------------------===//
diff --git a/llvm/test/CodeGen/X86/isel-llvm.set.rounding.ll b/llvm/test/CodeGen/X86/isel-llvm.set.rounding.ll
@@ -30,7 +30,7 @@ define void @func_01() nounwind {
 ; GISEL-X86-NOSSE-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NOSSE-NEXT:    andw (%esp), %ax
-; GISEL-X86-NOSSE-NEXT:    orw $3072, %ax # imm = 0xC00
+; GISEL-X86-NOSSE-NEXT:    orw $24576, %ax # imm = 0x6000
 ; GISEL-X86-NOSSE-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NOSSE-NEXT:    fldcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    popl %eax
@@ -48,7 +48,7 @@ define void @func_01() nounwind {
 ; GISEL-X64-NOSSE-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NOSSE-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NOSSE-NEXT:    orw $3072, %ax # imm = 0xC00
+; GISEL-X64-NOSSE-NEXT:    orw $24576, %ax # imm = 0x6000
 ; GISEL-X64-NOSSE-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    retq
@@ -68,7 +68,7 @@ define void @func_01() nounwind {
 ; GISEL-X86-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NEXT:    andw (%esp), %ax
-; GISEL-X86-NEXT:    orw $3072, %ax # imm = 0xC00
+; GISEL-X86-NEXT:    orw $24576, %ax # imm = 0x6000
 ; GISEL-X86-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NEXT:    fldcw (%esp)
 ; GISEL-X86-NEXT:    popl %eax
@@ -89,16 +89,14 @@ define void @func_01() nounwind {
 ; GISEL-X64-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NEXT:    orw $3072, %ax # imm = 0xC00
+; GISEL-X64-NEXT:    orw $24576, %ax # imm = 0x6000
 ; GISEL-X64-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    stmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movl $-24577, %eax # imm = 0x9FFF
 ; GISEL-X64-NEXT:    andl -{{[0-9]+}}(%rsp), %eax
-; GISEL-X64-NEXT:    movl $3072, %ecx # imm = 0xC00
-; GISEL-X64-NEXT:    shll $3, %ecx
-; GISEL-X64-NEXT:    orl %eax, %ecx
-; GISEL-X64-NEXT:    movl %ecx, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    orl $24576, %eax # imm = 0x6000
+; GISEL-X64-NEXT:    movl %eax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    ldmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    retq
   call void @llvm.set.rounding(i32 0)  ; TowardZero (CW[11-10] = 11)
@@ -186,10 +184,8 @@ define void @func_02() nounwind {
 ; GISEL-X64-NEXT:    stmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movl $-24577, %eax # imm = 0x9FFF
 ; GISEL-X64-NEXT:    andl -{{[0-9]+}}(%rsp), %eax
-; GISEL-X64-NEXT:    xorl %ecx, %ecx
-; GISEL-X64-NEXT:    shll $3, %ecx
-; GISEL-X64-NEXT:    orl %eax, %ecx
-; GISEL-X64-NEXT:    movl %ecx, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    orl $0, %eax
+; GISEL-X64-NEXT:    movl %eax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    ldmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    retq
   call void @llvm.set.rounding(i32 1)  ; ToNearestTiesToEven (CW[11-10] = 00)
@@ -215,7 +211,7 @@ define void @func_03() nounwind {
 ; GISEL-X86-NOSSE-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NOSSE-NEXT:    andw (%esp), %ax
-; GISEL-X86-NOSSE-NEXT:    orw $2048, %ax # imm = 0x800
+; GISEL-X86-NOSSE-NEXT:    orw $16384, %ax # imm = 0x4000
 ; GISEL-X86-NOSSE-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NOSSE-NEXT:    fldcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    popl %eax
@@ -236,7 +232,7 @@ define void @func_03() nounwind {
 ; GISEL-X64-NOSSE-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NOSSE-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NOSSE-NEXT:    orw $2048, %ax # imm = 0x800
+; GISEL-X64-NOSSE-NEXT:    orw $16384, %ax # imm = 0x4000
 ; GISEL-X64-NOSSE-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    retq
@@ -259,7 +255,7 @@ define void @func_03() nounwind {
 ; GISEL-X86-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NEXT:    andw (%esp), %ax
-; GISEL-X86-NEXT:    orw $2048, %ax # imm = 0x800
+; GISEL-X86-NEXT:    orw $16384, %ax # imm = 0x4000
 ; GISEL-X86-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NEXT:    fldcw (%esp)
 ; GISEL-X86-NEXT:    popl %eax
@@ -286,16 +282,14 @@ define void @func_03() nounwind {
 ; GISEL-X64-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NEXT:    orw $2048, %ax # imm = 0x800
+; GISEL-X64-NEXT:    orw $16384, %ax # imm = 0x4000
 ; GISEL-X64-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    stmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movl $-24577, %eax # imm = 0x9FFF
 ; GISEL-X64-NEXT:    andl -{{[0-9]+}}(%rsp), %eax
-; GISEL-X64-NEXT:    movl $2048, %ecx # imm = 0x800
-; GISEL-X64-NEXT:    shll $3, %ecx
-; GISEL-X64-NEXT:    orl %eax, %ecx
-; GISEL-X64-NEXT:    movl %ecx, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    orl $16384, %eax # imm = 0x4000
+; GISEL-X64-NEXT:    movl %eax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    ldmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    retq
   call void @llvm.set.rounding(i32 2)  ; Upward (CW[11-10] = 10)
@@ -321,7 +315,7 @@ define void @func_04() nounwind {
 ; GISEL-X86-NOSSE-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NOSSE-NEXT:    andw (%esp), %ax
-; GISEL-X86-NOSSE-NEXT:    orw $1024, %ax # imm = 0x400
+; GISEL-X86-NOSSE-NEXT:    orw $8192, %ax # imm = 0x2000
 ; GISEL-X86-NOSSE-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NOSSE-NEXT:    fldcw (%esp)
 ; GISEL-X86-NOSSE-NEXT:    popl %eax
@@ -342,7 +336,7 @@ define void @func_04() nounwind {
 ; GISEL-X64-NOSSE-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NOSSE-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NOSSE-NEXT:    orw $1024, %ax # imm = 0x400
+; GISEL-X64-NOSSE-NEXT:    orw $8192, %ax # imm = 0x2000
 ; GISEL-X64-NOSSE-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NOSSE-NEXT:    retq
@@ -365,7 +359,7 @@ define void @func_04() nounwind {
 ; GISEL-X86-NEXT:    fnstcw (%esp)
 ; GISEL-X86-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X86-NEXT:    andw (%esp), %ax
-; GISEL-X86-NEXT:    orw $1024, %ax # imm = 0x400
+; GISEL-X86-NEXT:    orw $8192, %ax # imm = 0x2000
 ; GISEL-X86-NEXT:    movw %ax, (%esp)
 ; GISEL-X86-NEXT:    fldcw (%esp)
 ; GISEL-X86-NEXT:    popl %eax
@@ -392,16 +386,14 @@ define void @func_04() nounwind {
 ; GISEL-X64-NEXT:    fnstcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movw $-3073, %ax # imm = 0xF3FF
 ; GISEL-X64-NEXT:    andw -{{[0-9]+}}(%rsp), %ax
-; GISEL-X64-NEXT:    orw $1024, %ax # imm = 0x400
+; GISEL-X64-NEXT:    orw $8192, %ax # imm = 0x2000
 ; GISEL-X64-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    stmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movl $-24577, %eax # imm = 0x9FFF
 ; GISEL-X64-NEXT:    andl -{{[0-9]+}}(%rsp), %eax
-; GISEL-X64-NEXT:    movl $1024, %ecx # imm = 0x400
-; GISEL-X64-NEXT:    shll $3, %ecx
-; GISEL-X64-NEXT:    orl %eax, %ecx
-; GISEL-X64-NEXT:    movl %ecx, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    orl $8192, %eax # imm = 0x2000
+; GISEL-X64-NEXT:    movl %eax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    ldmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    retq
   call void @llvm.set.rounding(i32 3)  ; Downward (CW[11-10] = 01)
@@ -550,16 +542,16 @@ define void @func_05(i32 %x) nounwind {
 ; GISEL-X64-NEXT:    # kill: def $cl killed $cl killed $ecx
 ; GISEL-X64-NEXT:    shlw %cl, %dx
 ; GISEL-X64-NEXT:    andw $3072, %dx # imm = 0xC00
-; GISEL-X64-NEXT:    orw %dx, %ax
-; GISEL-X64-NEXT:    movw %ax, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    movzwl %dx, %ecx
+; GISEL-X64-NEXT:    leal (,%rcx,8), %edx
+; GISEL-X64-NEXT:    orw %ax, %cx
+; GISEL-X64-NEXT:    movw %cx, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    fldcw -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    stmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    movl $-24577, %eax # imm = 0x9FFF
 ; GISEL-X64-NEXT:    andl -{{[0-9]+}}(%rsp), %eax
-; GISEL-X64-NEXT:    movzwl %dx, %ecx
-; GISEL-X64-NEXT:    shll $3, %ecx
-; GISEL-X64-NEXT:    orl %eax, %ecx
-; GISEL-X64-NEXT:    movl %ecx, -{{[0-9]+}}(%rsp)
+; GISEL-X64-NEXT:    orl %edx, %eax
+; GISEL-X64-NEXT:    movl %eax, -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    ldmxcsr -{{[0-9]+}}(%rsp)
 ; GISEL-X64-NEXT:    retq
   call void @llvm.set.rounding(i32 %x)  ; Downward
diff --git a/llvm/test/TableGen/RegClassByHwMode.td b/llvm/test/TableGen/RegClassByHwMode.td
@@ -50,7 +50,7 @@ include "llvm/Target/Target.td"
 // INSTRINFO-NEXT: };
 
 // INSTRINFO: static inline void InitMyTargetMCInstrInfo(
-// INSTRINFO-NEXT: II->InitMCInstrInfo(MyTargetDescs.Insts, MyTargetInstrNameIndices, MyTargetInstrNameData, nullptr, nullptr, 321, &MyTargetRegClassByHwModeTables[0][0], 3);
+// INSTRINFO-NEXT: II->InitMCInstrInfo(MyTargetDescs.Insts, MyTargetInstrNameIndices, MyTargetInstrNameData, nullptr, nullptr, {{[0-9]+}}, &MyTargetRegClassByHwModeTables[0][0], 3);