[EraVM] Enable CSE between sub and cmp

vladimirradosavljevic · akiramenai · commit 1e7bf662e6e5 · 2024-06-20T18:19:32.000+02:00
In order to enable this, we need to do following: 1. Generate _v instead of _s variants of the sub instructions, following the same patterns as for the cmp instruction. 2. Remove Flags from reserved registers. 3. Convert from _v to _s variants in Peephole Optimizer if flags register is not used. 4. Remove identical cmp instructions. This is the same design that AArch64 is using and that is to generate fake cmp instructions from sub to leverage MachineCSE, and to convert fake cmp instructions back to subs in the PeepholeOptimizer. If we want to use different approach we would probably need to teach MachineCSE flag setting counterparts have the same semantic. This could be problematic since MachineCSE uses lookup table to identify identical instructions, so we would always need to generate MI counterparts to check the lookup table and to worry about deallocation of that MI (a lot of local changes + we would need to be very careful not to introduce some issues). PR: #612. Signed-off-by: Vladimir Radosavljevic <vr@matterlabs.dev>
diff --git a/llvm/lib/Target/EraVM/EraVMInstrFormats.td b/llvm/lib/Target/EraVM/EraVMInstrFormats.td
@@ -435,6 +435,7 @@ class IBinary<EraVMOpcode opcode,
   let Defs = !if(!eq(set_flags, PreserveFlags), [], [Flags]);
   let mayLoad = !or(isStackIn<src>.Value, !eq(src, SrcCodeAddr));
   let mayStore = isStackOut<dst>.Value;
+  let isCompare = !and(!eq(opcode, OpSub), !eq(set_flags, SetFlags));
 
   let Opcode = ArithOpcEncoder<opcode.Encoding, opcode.BaseOpcode,
                                src, dst,
diff --git a/llvm/lib/Target/EraVM/EraVMInstrInfo.cpp b/llvm/lib/Target/EraVM/EraVMInstrInfo.cpp
@@ -417,6 +417,69 @@ unsigned EraVMInstrInfo::insertBranch(
   return Count;
 }
 
+bool EraVMInstrInfo::analyzeCompare(const MachineInstr &MI, Register &SrcReg,
+                                    Register &SrcReg2, int64_t &CmpMask,
+                                    int64_t &CmpValue) const {
+  return isSub(MI) && isFlagSettingInstruction(MI);
+}
+
+bool EraVMInstrInfo::optimizeCompareInstr(
+    MachineInstr &CmpInstr, Register SrcReg, Register SrcReg2, int64_t CmpMask,
+    int64_t CmpValue, const MachineRegisterInfo *MRI) const {
+  assert(CmpInstr.getParent() && "CmpInstr must be in a basic block");
+  assert(MRI && "MachineRegisterInfo is required");
+
+  // If Flags register is not used, convert this compare instruction (sub
+  // instruction that sets flags) to a sub that doesn't set flags.
+  int DeadFlagsIdx = CmpInstr.findRegisterDefOperandIdx(EraVM::Flags, true);
+  if (DeadFlagsIdx != -1) {
+    int NewOpc = EraVM::getNonFlagSettingOpcode(CmpInstr.getOpcode());
+    assert(NewOpc != -1 && "Invalid opcode for compare instruction");
+    CmpInstr.setDesc(get(NewOpc));
+    CmpInstr.removeOperand(DeadFlagsIdx);
+    return true;
+  }
+
+  // TODO: #621 Support removing compare instruction which output is used if the
+  // nearest flag setting instruction is identical.
+  if (!EraVM::hasRROutAddressingMode(CmpInstr) ||
+      !MRI->use_nodbg_empty(CmpInstr.getOperand(0).getReg()))
+    return false;
+
+  // In some cases, we can have the following sequence:
+  //   Out1 = SUB_v In1, In2, CondCC1, implicit-def $flags
+  //   ...
+  //   Out2 = SUB_v In3, In4, CondCC2, implicit-def dead $flags
+  //   ...
+  //   Out3 = SUB_v In1, In2, CondCC1, implicit-def $flags
+  //
+  // In this case, `Out2 = SUB_v` prevents MachineCSE to remove
+  // `Out3 = SUB_v` in favor of `Out1 = SUB_v`, just because of
+  // `implicit-def dead $flags`.
+  // Since in this function we will convert `Out2 = SUB_v` to
+  // `Out2 = SUB_s` and implicit dead $flags will be dropped,
+  // we can try to find identical compare instruction and remove it here.
+  //
+  // Search backwards in order to find the nearest flag setting instruction that
+  // can be identical to this compare instruction.
+  auto From = std::next(MachineBasicBlock::reverse_iterator(CmpInstr));
+  auto FlagSettingInst = std::find_if(
+      From, CmpInstr.getParent()->rend(), [](const MachineInstr &MI) {
+        return any_of(MI.implicit_operands(), [](const MachineOperand &MO) {
+          return MO.isReg() && MO.isDef() && MO.getReg() == EraVM::Flags;
+        });
+      });
+
+  // Bail out if we didn't find identical compare instruction.
+  if (FlagSettingInst == CmpInstr.getParent()->rend() ||
+      !isFlagSettingInstruction(*FlagSettingInst) ||
+      !FlagSettingInst->isIdenticalTo(CmpInstr, MachineInstr::IgnoreVRegDefs))
+    return false;
+
+  CmpInstr.eraseFromParent();
+  return true;
+}
+
 void EraVMInstrInfo::storeRegToStackSlot(
     MachineBasicBlock &MBB, MachineBasicBlock::iterator MI, Register SrcReg,
     bool isKill, int FrameIndex, const TargetRegisterClass *RC,
diff --git a/llvm/lib/Target/EraVM/EraVMInstrInfo.h b/llvm/lib/Target/EraVM/EraVMInstrInfo.h
@@ -313,6 +313,19 @@ class EraVMInstrInfo : public EraVMGenInstrInfo {
                         const DebugLoc &DL,
                         int *BytesAdded = nullptr) const override;
 
+  // Return true if this is a compare instruction (sub instruction that
+  // sets flags).
+  bool analyzeCompare(const MachineInstr &MI, Register &SrcReg,
+                      Register &SrcReg2, int64_t &CmpMask,
+                      int64_t &CmpValue) const override;
+
+  // In case flags register is not used, convert compare instruction (sub
+  // instruction that sets flag) into sub instruction that does not set flags.
+  // Also, try to remove redundant compare instruction.
+  bool optimizeCompareInstr(MachineInstr &CmpInstr, Register SrcReg,
+                            Register SrcReg2, int64_t CmpMask, int64_t CmpValue,
+                            const MachineRegisterInfo *MRI) const override;
+
   int64_t getFramePoppedByCallee(const MachineInstr &I) const { return 0; }
 
   unsigned int getTailDuplicateSize(CodeGenOpt::Level OptLevel) const override;
diff --git a/llvm/lib/Target/EraVM/EraVMInstrInfo.td b/llvm/lib/Target/EraVM/EraVMInstrInfo.td
@@ -124,6 +124,13 @@ def constant_pool : SDNodeXForm<imm, [{
   return CurDAG->getTargetConstantPool(N->getConstantIntValue(), PtrVT);
 }]>;
 
+def negate_constant_pool : SDNodeXForm<imm, [{
+  APInt Val = -N->getAPIntValue();
+  const Constant *C = ConstantInt::get(*CurDAG->getContext(), Val);
+  MVT PtrVT = getTargetLowering()->getPointerTy(CurDAG->getDataLayout());
+  return CurDAG->getTargetConstantPool(C, PtrVT);
+}]>;
+
 def default_far_return : SDNodeXForm<imm, [{
   (void)N;
   MVT PtrVT = getTargetLowering()->getPointerTy(CurDAG->getDataLayout());
@@ -690,6 +697,32 @@ def : Pat<(store_stack GRPTR:$src, stackaddr:$dst), (PTR_ADDrrs_s GRPTR:$src, R0
 
 def : Pat<(EraVMcopy_from_ptrreg GRPTR:$src), (PTR_ADDrrr_s GRPTR:$src, R0, 0)>;
 
+// In order to support CSE between sub and cmp, we need to generate _v variants
+// of the sub instructions. These patterns are similar to the cmp patterns
+// below, so we can enable CSE between them. Complexity is added in order to
+// select _v instead of _s variants.
+// After MachineCSE, we convert _v to _s variants in PeepholeOptimizer if
+// the definition of the flags register is dead. Whether the flags register is
+// dead or not, is calculated during generation of MI instructions.
+// The PeepholeOptimizer is not invoked for OptNone functions, preventing the
+// conversion of _v to _s variants. As a result, these patterns are disabled
+// for OptNone functions.
+def Optimize : Predicate<"!MF->getFunction().hasOptNone()">;
+let Predicates = [Optimize], AddedComplexity = 1 in {
+  def : Pat<(sub GR256:$lhs, GR256:$rhs), (SUBrrr_v GR256:$lhs, GR256:$rhs, 0)>;
+  def : Pat<(sub GR256:$lhs, imm16:$rhs), (SUBxrr_v imm:$rhs, GR256:$lhs, 0)>;
+  def : Pat<(sub GR256:$lhs, large_imm:$rhs), (SUByrr_v (constant_pool imm:$rhs), 0, GR256:$lhs, 0)>;
+
+  def : Pat<(sub (load_code memaddr:$lhs), GR256:$rhs), (SUBcrr_v memaddr:$lhs, GR256:$rhs, 0)>;
+  def : Pat<(sub GR256:$lhs, (load_code memaddr:$rhs)), (SUByrr_v memaddr:$rhs, GR256:$lhs, 0)>;
+  def : Pat<(sub (load_stack stackaddr:$lhs), GR256:$rhs), (SUBsrr_v stackaddr:$lhs, GR256:$rhs, 0)>;
+  def : Pat<(sub GR256:$lhs, (load_stack stackaddr:$rhs)), (SUBzrr_v stackaddr:$rhs, GR256:$lhs, 0)>;
+
+  // Generate sub instructions from add, so these instructions can be CSE'd with cmp.
+  def : Pat<(add GR256:$rs0, neg_imm16:$imm), (SUBxrr_v (negate_imm imm:$imm), GR256:$rs0, 0)>;
+  def : Pat<(add GR256:$lhs, large_imm:$rhs), (SUByrr_v (negate_constant_pool imm:$rhs), 0, GR256:$lhs, 0)>;
+}
+
 // SelecCC, BR_CC supplement
 def : Pat<(EraVMcmp GR256:$lhs, GR256:$rhs), (SUBrrr_v GR256:$lhs, GR256:$rhs, 0)>;
 // r0 is more profitable than imm 0 because it makes sub! x, r0 combinable with x = load y.
diff --git a/llvm/lib/Target/EraVM/EraVMRegisterInfo.cpp b/llvm/lib/Target/EraVM/EraVMRegisterInfo.cpp
@@ -41,7 +41,6 @@ EraVMRegisterInfo::getCalleeSavedRegs(const MachineFunction *MF) const {
 BitVector EraVMRegisterInfo::getReservedRegs(const MachineFunction &MF) const {
   BitVector Reserved(getNumRegs());
   Reserved.set(EraVM::SP);
-  Reserved.set(EraVM::Flags);
   Reserved.set(EraVM::R0);
   return Reserved;
 }
diff --git a/llvm/test/CodeGen/EraVM/cse-sub-cmp.ll b/llvm/test/CodeGen/EraVM/cse-sub-cmp.ll
@@ -9,11 +9,9 @@ declare void @use(i256)
 define i256 @test_small_imm(i256 %a) {
 ; CHECK-LABEL: test_small_imm:
 ; CHECK:       ; %bb.0:
-; CHECK-NEXT:    sub.s 10, r1, r3
-; CHECK-NEXT:    mul 10, r1, r2, r4
-; CHECK-NEXT:    sub.s! 10, r1, r1
-; CHECK-NEXT:    add.ge r3, r0, r2
-; CHECK-NEXT:    add r2, r0, r1
+; CHECK-NEXT:    sub.s! 10, r1, r2
+; CHECK-NEXT:    mul 10, r1, r1, r3
+; CHECK-NEXT:    add.ge r2, r0, r1
 ; CHECK-NEXT:    ret
   %sub = sub i256 %a, 10
   %mul = mul i256 %a, 10
@@ -25,11 +23,9 @@ define i256 @test_small_imm(i256 %a) {
 define i256 @test_large_imm(i256 %a) {
 ; CHECK-LABEL: test_large_imm:
 ; CHECK:       ; %bb.0:
-; CHECK-NEXT:    add @CPI1_0[0], r1, r3
-; CHECK-NEXT:    mul @CPI1_1[0], r1, r2, r4
-; CHECK-NEXT:    sub.s! @CPI1_1[0], r1, r1
-; CHECK-NEXT:    add.ge r3, r0, r2
-; CHECK-NEXT:    add r2, r0, r1
+; CHECK-NEXT:    sub.s! @CPI1_0[0], r1, r2
+; CHECK-NEXT:    mul @CPI1_0[0], r1, r1, r3
+; CHECK-NEXT:    add.ge r2, r0, r1
 ; CHECK-NEXT:    ret
   %sub = sub i256 %a, 123456789
   %mul = mul i256 %a, 123456789
@@ -41,11 +37,9 @@ define i256 @test_large_imm(i256 %a) {
 define i256 @test_reg(i256 %a, i256 %b) {
 ; CHECK-LABEL: test_reg:
 ; CHECK:       ; %bb.0:
-; CHECK-NEXT:    sub r1, r2, r4
-; CHECK-NEXT:    mul r1, r2, r3, r5
-; CHECK-NEXT:    sub! r1, r2, r1
-; CHECK-NEXT:    add.ge r4, r0, r3
-; CHECK-NEXT:    add r3, r0, r1
+; CHECK-NEXT:    sub! r1, r2, r3
+; CHECK-NEXT:    mul r1, r2, r1, r2
+; CHECK-NEXT:    add.ge r3, r0, r1
 ; CHECK-NEXT:    ret
   %sub = sub i256 %a, %b
   %mul = mul i256 %a, %b
@@ -57,9 +51,9 @@ define i256 @test_reg(i256 %a, i256 %b) {
 define i256 @test_in_different_bb(i256 %a, i256 %b) {
 ; CHECK-LABEL: test_in_different_bb:
 ; CHECK:       ; %bb.0:
-; CHECK-NEXT:    sub! r1, r2, r3
-; CHECK-NEXT:    sub.ge r1, r2, r1
+; CHECK-NEXT:    sub! r1, r2, r1
 ; CHECK-NEXT:    add.lt r0, r0, r1
+; CHECK-NEXT:  ; %bb.1: ; %bb2
 ; CHECK-NEXT:    ret
   %cmp = icmp ult i256 %a, %b
   br i1 %cmp, label %bb1, label %bb2
@@ -75,15 +69,12 @@ bb2:
 define i256 @test_with_call(i256 %a, i256 %b) {
 ; CHECK-LABEL: test_with_call:
 ; CHECK:       ; %bb.0:
-; CHECK-NEXT:    nop stack+=[2 + r0]
-; CHECK-NEXT:    add r2, r0, stack-[1] ; 32-byte Folded Spill
-; CHECK-NEXT:    add r1, r0, stack-[2] ; 32-byte Folded Spill
-; CHECK-NEXT:    sub! r1, r2, r3
+; CHECK-NEXT:    nop stack+=[1 + r0]
+; CHECK-NEXT:    sub! r1, r2, stack-[1]
 ; CHECK-NEXT:    add 10, r0, r1
 ; CHECK-NEXT:    add.lt 15, r0, r1
 ; CHECK-NEXT:    near_call r0, @use, @DEFAULT_UNWIND
-; CHECK-NEXT:    add stack-[1], r0, r2 ; 32-byte Folded Reload
-; CHECK-NEXT:    sub stack-[2], r2, r1
+; CHECK-NEXT:    add stack-[1], r0, r1 ; 32-byte Folded Reload
 ; CHECK-NEXT:    ret
   %cmp = icmp ult i256 %a, %b
   %select = select i1 %cmp, i256 15, i256 10
diff --git a/llvm/test/CodeGen/EraVM/fold-add-to-select.ll b/llvm/test/CodeGen/EraVM/fold-add-to-select.ll
@@ -12,7 +12,7 @@ define i256 @test_large_imm1(i256 %a) {
 ; CHECK-LABEL: test_large_imm1:
 ; CHECK:       ; %bb.0:
 ; CHECK-NEXT:    sub.s! @CPI0_1[0], r1, r2
-; CHECK-NEXT:    add.lt @CPI0_0[0], r1, r1
+; CHECK-NEXT:    sub.s.lt @CPI0_0[0], r1, r1
 ; CHECK-NEXT:    ret
   %add = add i256 %a, 26959946660873538059280334323183841250350249843923952699046031785980
   %cmp = icmp ult i256 %a, -26959946660873538059280334323183841250350249843923952699046031785985
@@ -24,7 +24,7 @@ define i256 @test_large_imm2(i256 %a) {
 ; CHECK-LABEL: test_large_imm2:
 ; CHECK:       ; %bb.0:
 ; CHECK-NEXT:    sub.s! @CPI1_1[0], r1, r2
-; CHECK-NEXT:    add.lt @CPI1_0[0], r1, r1
+; CHECK-NEXT:    sub.s.lt @CPI1_0[0], r1, r1
 ; CHECK-NEXT:    ret
   %add = add i256 %a, -26959946660873538059280334323183841250350249843923952699046031785985
   %cmp = icmp ult i256 %a, 26959946660873538059280334323183841250350249843923952699046031785980
@@ -36,7 +36,7 @@ define i256 @test_large_imm3(i256 %a) {
 ; CHECK-LABEL: test_large_imm3:
 ; CHECK:       ; %bb.0:
 ; CHECK-NEXT:    sub.s! @CPI2_1[0], r1, r2
-; CHECK-NEXT:    add.ge @CPI2_0[0], r1, r1
+; CHECK-NEXT:    sub.s.ge @CPI2_0[0], r1, r1
 ; CHECK-NEXT:    ret
   %add = add i256 %a, 26959946660873538059280334323183841250350249843923952699046031785980
   %cmp = icmp ult i256 %a, -26959946660873538059280334323183841250350249843923952699046031785985
@@ -48,7 +48,7 @@ define i256 @test_large_imm4(i256 %a) {
 ; CHECK-LABEL: test_large_imm4:
 ; CHECK:       ; %bb.0:
 ; CHECK-NEXT:    sub.s! @CPI3_1[0], r1, r2
-; CHECK-NEXT:    add.ge @CPI3_0[0], r1, r1
+; CHECK-NEXT:    sub.s.ge @CPI3_0[0], r1, r1
 ; CHECK-NEXT:    ret
   %add = add i256 %a, -26959946660873538059280334323183841250350249843923952699046031785985
   %cmp = icmp ult i256 %a, 26959946660873538059280334323183841250350249843923952699046031785980
@@ -253,7 +253,7 @@ define i256 @test_use_in_other_bb(i256 %a, i1 %cond) {
 ; CHECK-NEXT:    ret
 ; CHECK-NEXT:  .BB18_2: ; %else
 ; CHECK-NEXT:    sub.s! @CPI18_1[0], r1, r2
-; CHECK-NEXT:    add.lt @CPI18_0[0], r1, r1
+; CHECK-NEXT:    sub.s.lt @CPI18_0[0], r1, r1
 ; CHECK-NEXT:    ret
   %add = add i256 %a, 26959946660873538059280334323183841250350249843923952699046031785980
   br i1 %cond, label %then, label %else
diff --git a/llvm/test/CodeGen/EraVM/fold-similar-instructions.ll b/llvm/test/CodeGen/EraVM/fold-similar-instructions.ll
@@ -7,7 +7,7 @@ target triple = "eravm"
 
 define i256 @test_large_imm_no_fold1(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_no_fold1
-; CHECK:       add @CPI0_0[0], r1, r3
+; CHECK:       sub.s @CPI0_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI0_1[0], r1, r4
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
@@ -22,7 +22,7 @@ define i256 @test_large_imm_no_fold1(i256 %a, i1 %cond) {
 
 define i256 @test_large_imm_no_fold2(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_no_fold2
-; CHECK:       add @CPI1_0[0], r1, r3
+; CHECK:       sub.s @CPI1_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI1_1[0], r1, r4
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
@@ -52,7 +52,7 @@ define i256 @test_small_imm_no_fold(i256 %a, i1 %cond) {
 
 define i256 @test_large_imm_ult1(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_ult1
-; CHECK:       sub.s! @CPI3_1[0], r1, r3
+; CHECK:       sub.s! @CPI3_0[0], r1, r3
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
 ; CHECK-NEXT:  add.eq r3, r0, r1
@@ -66,7 +66,7 @@ define i256 @test_large_imm_ult1(i256 %a, i1 %cond) {
 
 define i256 @test_large_imm_ult2(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_ult2
-; CHECK:       sub.s! @CPI4_1[0], r1, r3
+; CHECK:       sub.s! @CPI4_0[0], r1, r3
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
 ; CHECK-NEXT:  add.eq r3, r0, r1
@@ -81,7 +81,7 @@ define i256 @test_large_imm_ult2(i256 %a, i1 %cond) {
 ; TODO: CPR-1543 This can be folded.
 define i256 @test_large_imm_ule1(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_ule1
-; CHECK:       add @CPI5_0[0], r1, r3
+; CHECK:       sub.s @CPI5_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI5_1[0], r1, r4
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
@@ -97,7 +97,7 @@ define i256 @test_large_imm_ule1(i256 %a, i1 %cond) {
 ; TODO: CPR-1543 This can be folded.
 define i256 @test_large_imm_ule2(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_ule2
-; CHECK:       add @CPI6_0[0], r1, r3
+; CHECK:       sub.s @CPI6_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI6_1[0], r1, r4
 ; CHECK-NEXT:  add.lt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
@@ -113,7 +113,7 @@ define i256 @test_large_imm_ule2(i256 %a, i1 %cond) {
 ; TODO: CPR-1543 This can be folded.
 define i256 @test_large_imm_uge1(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_uge1
-; CHECK:       add @CPI7_0[0], r1, r3
+; CHECK:       sub.s @CPI7_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI7_1[0], r1, r4
 ; CHECK-NEXT:  add.gt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
@@ -129,7 +129,7 @@ define i256 @test_large_imm_uge1(i256 %a, i1 %cond) {
 ; TODO: CPR-1543 This can be folded.
 define i256 @test_large_imm_uge2(i256 %a, i1 %cond) {
 ; CHECK-LABEL: test_large_imm_uge2
-; CHECK:       add @CPI8_0[0], r1, r3
+; CHECK:       sub.s @CPI8_0[0], r1, r3
 ; CHECK-NEXT:  sub.s! @CPI8_1[0], r1, r4
 ; CHECK-NEXT:  add.gt r3, r0, r1
 ; CHECK-NEXT:  sub! r2, r0, r2
diff --git a/llvm/test/CodeGen/EraVM/fold-similar-instructions.mir b/llvm/test/CodeGen/EraVM/fold-similar-instructions.mir
@@ -170,7 +170,7 @@ frameInfo:
 machineFunctionInfo: {}
 body:             |
   bb.0:
-    liveins: $r1, $r2
+    liveins: $r1, $r2, $flags
 
     %0:gr256 = COPY killed $r1
     %1:gr256 = COPY killed $r2
@@ -305,7 +305,7 @@ frameInfo:
 machineFunctionInfo: {}
 body:             |
   bb.0:
-    liveins: $r1, $r2
+    liveins: $r1, $r2, $flags
 
     %0:gr256 = COPY killed $r1
     %1:gr256 = COPY killed $r2
diff --git a/llvm/test/CodeGen/EraVM/intrinsic.ll b/llvm/test/CodeGen/EraVM/intrinsic.ll
@@ -1,4 +1,5 @@
-; RUN: opt -O3 < %s | llc | FileCheck %s
+; RUN: opt -O3 < %s | llc --verify-regalloc=false | FileCheck %s
+; Don't verify regalloc, because there is no definition of flags register in flags intrinsics functions (e.g. ifeqrr).
 
 target datalayout = "E-p:256:256-i256:256:256-S32-a:256:256"
 target triple = "eravm"
diff --git a/llvm/test/CodeGen/EraVM/memintrinsics.ll b/llvm/test/CodeGen/EraVM/memintrinsics.ll
diff --git a/llvm/test/CodeGen/EraVM/select_fold.ll b/llvm/test/CodeGen/EraVM/select_fold.ll
diff --git a/llvm/test/CodeGen/EraVM/select_fold.mir b/llvm/test/CodeGen/EraVM/select_fold.mir

Original file line number	Diff line number	Diff line change
`@@ -41,7 +41,6 @@ EraVMRegisterInfo::getCalleeSavedRegs(const MachineFunction *MF) const {`
`41`	`41`	`BitVector EraVMRegisterInfo::getReservedRegs(const MachineFunction &MF) const {`
`42`	`42`	`BitVector Reserved(getNumRegs());`
`43`	`43`	`Reserved.set(EraVM::SP);`
`44`		`- Reserved.set(EraVM::Flags);`
`45`	`44`	`Reserved.set(EraVM::R0);`
`46`	`45`	`return Reserved;`
`47`	`46`	`}`