[LoongArch][test] Add tests for issue 97975 and 97981

heiher · heiher · commit cda651c62cd9 · 2024-09-20T11:58:52.000+08:00
diff --git a/llvm/test/CodeGen/LoongArch/issue97975.ll b/llvm/test/CodeGen/LoongArch/issue97975.ll
@@ -0,0 +1,240 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc --mtriple=loongarch32 --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32S
+; RUN: llc --mtriple=loongarch32 --mattr=+f --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32F
+; RUN: llc --mtriple=loongarch32 --mattr=+d --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32D
+; RUN: llc --mtriple=loongarch64 --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64S
+; RUN: llc --mtriple=loongarch64 --mattr=+f --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64F
+; RUN: llc --mtriple=loongarch64 --mattr=+d --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64D
+
+define half @f(half %a, half %b, half %c) {
+; LA32S-LABEL: f:
+; LA32S:       # %bb.0:
+; LA32S-NEXT:    addi.w $sp, $sp, -16
+; LA32S-NEXT:    .cfi_def_cfa_offset 16
+; LA32S-NEXT:    st.w $ra, $sp, 12 # 4-byte Folded Spill
+; LA32S-NEXT:    st.w $fp, $sp, 8 # 4-byte Folded Spill
+; LA32S-NEXT:    st.w $s0, $sp, 4 # 4-byte Folded Spill
+; LA32S-NEXT:    st.w $s1, $sp, 0 # 4-byte Folded Spill
+; LA32S-NEXT:    .cfi_offset 1, -4
+; LA32S-NEXT:    .cfi_offset 22, -8
+; LA32S-NEXT:    .cfi_offset 23, -12
+; LA32S-NEXT:    .cfi_offset 24, -16
+; LA32S-NEXT:    move $fp, $a2
+; LA32S-NEXT:    move $s0, $a0
+; LA32S-NEXT:    bstrpick.w $a0, $a1, 15, 0
+; LA32S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32S-NEXT:    move $s1, $a0
+; LA32S-NEXT:    bstrpick.w $a0, $s0, 15, 0
+; LA32S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32S-NEXT:    move $a1, $s1
+; LA32S-NEXT:    bl %plt(__addsf3)
+; LA32S-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32S-NEXT:    move $s0, $a0
+; LA32S-NEXT:    bstrpick.w $a0, $fp, 15, 0
+; LA32S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32S-NEXT:    move $fp, $a0
+; LA32S-NEXT:    bstrpick.w $a0, $s0, 15, 0
+; LA32S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32S-NEXT:    move $a1, $fp
+; LA32S-NEXT:    bl %plt(__addsf3)
+; LA32S-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32S-NEXT:    ld.w $s1, $sp, 0 # 4-byte Folded Reload
+; LA32S-NEXT:    ld.w $s0, $sp, 4 # 4-byte Folded Reload
+; LA32S-NEXT:    ld.w $fp, $sp, 8 # 4-byte Folded Reload
+; LA32S-NEXT:    ld.w $ra, $sp, 12 # 4-byte Folded Reload
+; LA32S-NEXT:    addi.w $sp, $sp, 16
+; LA32S-NEXT:    ret
+;
+; LA32F-LABEL: f:
+; LA32F:       # %bb.0:
+; LA32F-NEXT:    addi.w $sp, $sp, -16
+; LA32F-NEXT:    .cfi_def_cfa_offset 16
+; LA32F-NEXT:    st.w $ra, $sp, 12 # 4-byte Folded Spill
+; LA32F-NEXT:    fst.s $fs0, $sp, 8 # 4-byte Folded Spill
+; LA32F-NEXT:    fst.s $fs1, $sp, 4 # 4-byte Folded Spill
+; LA32F-NEXT:    fst.s $fs2, $sp, 0 # 4-byte Folded Spill
+; LA32F-NEXT:    .cfi_offset 1, -4
+; LA32F-NEXT:    .cfi_offset 56, -8
+; LA32F-NEXT:    .cfi_offset 57, -12
+; LA32F-NEXT:    .cfi_offset 58, -16
+; LA32F-NEXT:    fmov.s $fs0, $fa2
+; LA32F-NEXT:    fmov.s $fs1, $fa0
+; LA32F-NEXT:    fmov.s $fa0, $fa1
+; LA32F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32F-NEXT:    fmov.s $fs2, $fa0
+; LA32F-NEXT:    fmov.s $fa0, $fs1
+; LA32F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32F-NEXT:    fadd.s $fa0, $fa0, $fs2
+; LA32F-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32F-NEXT:    fmov.s $fs1, $fa0
+; LA32F-NEXT:    fmov.s $fa0, $fs0
+; LA32F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32F-NEXT:    fadd.s $fa0, $fs1, $fa0
+; LA32F-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32F-NEXT:    movfr2gr.s $a0, $fa0
+; LA32F-NEXT:    lu12i.w $a1, -16
+; LA32F-NEXT:    or $a0, $a0, $a1
+; LA32F-NEXT:    movgr2fr.w $fa0, $a0
+; LA32F-NEXT:    fld.s $fs2, $sp, 0 # 4-byte Folded Reload
+; LA32F-NEXT:    fld.s $fs1, $sp, 4 # 4-byte Folded Reload
+; LA32F-NEXT:    fld.s $fs0, $sp, 8 # 4-byte Folded Reload
+; LA32F-NEXT:    ld.w $ra, $sp, 12 # 4-byte Folded Reload
+; LA32F-NEXT:    addi.w $sp, $sp, 16
+; LA32F-NEXT:    ret
+;
+; LA32D-LABEL: f:
+; LA32D:       # %bb.0:
+; LA32D-NEXT:    addi.w $sp, $sp, -32
+; LA32D-NEXT:    .cfi_def_cfa_offset 32
+; LA32D-NEXT:    st.w $ra, $sp, 28 # 4-byte Folded Spill
+; LA32D-NEXT:    fst.d $fs0, $sp, 16 # 8-byte Folded Spill
+; LA32D-NEXT:    fst.d $fs1, $sp, 8 # 8-byte Folded Spill
+; LA32D-NEXT:    fst.d $fs2, $sp, 0 # 8-byte Folded Spill
+; LA32D-NEXT:    .cfi_offset 1, -4
+; LA32D-NEXT:    .cfi_offset 56, -16
+; LA32D-NEXT:    .cfi_offset 57, -24
+; LA32D-NEXT:    .cfi_offset 58, -32
+; LA32D-NEXT:    fmov.s $fs0, $fa2
+; LA32D-NEXT:    fmov.s $fs1, $fa0
+; LA32D-NEXT:    fmov.s $fa0, $fa1
+; LA32D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32D-NEXT:    fmov.s $fs2, $fa0
+; LA32D-NEXT:    fmov.s $fa0, $fs1
+; LA32D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32D-NEXT:    fadd.s $fa0, $fa0, $fs2
+; LA32D-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32D-NEXT:    fmov.s $fs1, $fa0
+; LA32D-NEXT:    fmov.s $fa0, $fs0
+; LA32D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA32D-NEXT:    fadd.s $fa0, $fs1, $fa0
+; LA32D-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA32D-NEXT:    movfr2gr.s $a0, $fa0
+; LA32D-NEXT:    lu12i.w $a1, -16
+; LA32D-NEXT:    or $a0, $a0, $a1
+; LA32D-NEXT:    movgr2fr.w $fa0, $a0
+; LA32D-NEXT:    fld.d $fs2, $sp, 0 # 8-byte Folded Reload
+; LA32D-NEXT:    fld.d $fs1, $sp, 8 # 8-byte Folded Reload
+; LA32D-NEXT:    fld.d $fs0, $sp, 16 # 8-byte Folded Reload
+; LA32D-NEXT:    ld.w $ra, $sp, 28 # 4-byte Folded Reload
+; LA32D-NEXT:    addi.w $sp, $sp, 32
+; LA32D-NEXT:    ret
+;
+; LA64S-LABEL: f:
+; LA64S:       # %bb.0:
+; LA64S-NEXT:    addi.d $sp, $sp, -32
+; LA64S-NEXT:    .cfi_def_cfa_offset 32
+; LA64S-NEXT:    st.d $ra, $sp, 24 # 8-byte Folded Spill
+; LA64S-NEXT:    st.d $fp, $sp, 16 # 8-byte Folded Spill
+; LA64S-NEXT:    st.d $s0, $sp, 8 # 8-byte Folded Spill
+; LA64S-NEXT:    st.d $s1, $sp, 0 # 8-byte Folded Spill
+; LA64S-NEXT:    .cfi_offset 1, -8
+; LA64S-NEXT:    .cfi_offset 22, -16
+; LA64S-NEXT:    .cfi_offset 23, -24
+; LA64S-NEXT:    .cfi_offset 24, -32
+; LA64S-NEXT:    move $fp, $a2
+; LA64S-NEXT:    move $s0, $a0
+; LA64S-NEXT:    bstrpick.d $a0, $a1, 15, 0
+; LA64S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64S-NEXT:    move $s1, $a0
+; LA64S-NEXT:    bstrpick.d $a0, $s0, 15, 0
+; LA64S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64S-NEXT:    move $a1, $s1
+; LA64S-NEXT:    bl %plt(__addsf3)
+; LA64S-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64S-NEXT:    move $s0, $a0
+; LA64S-NEXT:    bstrpick.d $a0, $fp, 15, 0
+; LA64S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64S-NEXT:    move $fp, $a0
+; LA64S-NEXT:    bstrpick.d $a0, $s0, 15, 0
+; LA64S-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64S-NEXT:    move $a1, $fp
+; LA64S-NEXT:    bl %plt(__addsf3)
+; LA64S-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64S-NEXT:    ld.d $s1, $sp, 0 # 8-byte Folded Reload
+; LA64S-NEXT:    ld.d $s0, $sp, 8 # 8-byte Folded Reload
+; LA64S-NEXT:    ld.d $fp, $sp, 16 # 8-byte Folded Reload
+; LA64S-NEXT:    ld.d $ra, $sp, 24 # 8-byte Folded Reload
+; LA64S-NEXT:    addi.d $sp, $sp, 32
+; LA64S-NEXT:    ret
+;
+; LA64F-LABEL: f:
+; LA64F:       # %bb.0:
+; LA64F-NEXT:    addi.d $sp, $sp, -32
+; LA64F-NEXT:    .cfi_def_cfa_offset 32
+; LA64F-NEXT:    st.d $ra, $sp, 24 # 8-byte Folded Spill
+; LA64F-NEXT:    fst.s $fs0, $sp, 20 # 4-byte Folded Spill
+; LA64F-NEXT:    fst.s $fs1, $sp, 16 # 4-byte Folded Spill
+; LA64F-NEXT:    fst.s $fs2, $sp, 12 # 4-byte Folded Spill
+; LA64F-NEXT:    .cfi_offset 1, -8
+; LA64F-NEXT:    .cfi_offset 56, -12
+; LA64F-NEXT:    .cfi_offset 57, -16
+; LA64F-NEXT:    .cfi_offset 58, -20
+; LA64F-NEXT:    fmov.s $fs0, $fa2
+; LA64F-NEXT:    fmov.s $fs1, $fa0
+; LA64F-NEXT:    fmov.s $fa0, $fa1
+; LA64F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64F-NEXT:    fmov.s $fs2, $fa0
+; LA64F-NEXT:    fmov.s $fa0, $fs1
+; LA64F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64F-NEXT:    fadd.s $fa0, $fa0, $fs2
+; LA64F-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64F-NEXT:    fmov.s $fs1, $fa0
+; LA64F-NEXT:    fmov.s $fa0, $fs0
+; LA64F-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64F-NEXT:    fadd.s $fa0, $fs1, $fa0
+; LA64F-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64F-NEXT:    movfr2gr.s $a0, $fa0
+; LA64F-NEXT:    lu12i.w $a1, -16
+; LA64F-NEXT:    or $a0, $a0, $a1
+; LA64F-NEXT:    movgr2fr.w $fa0, $a0
+; LA64F-NEXT:    fld.s $fs2, $sp, 12 # 4-byte Folded Reload
+; LA64F-NEXT:    fld.s $fs1, $sp, 16 # 4-byte Folded Reload
+; LA64F-NEXT:    fld.s $fs0, $sp, 20 # 4-byte Folded Reload
+; LA64F-NEXT:    ld.d $ra, $sp, 24 # 8-byte Folded Reload
+; LA64F-NEXT:    addi.d $sp, $sp, 32
+; LA64F-NEXT:    ret
+;
+; LA64D-LABEL: f:
+; LA64D:       # %bb.0:
+; LA64D-NEXT:    addi.d $sp, $sp, -32
+; LA64D-NEXT:    .cfi_def_cfa_offset 32
+; LA64D-NEXT:    st.d $ra, $sp, 24 # 8-byte Folded Spill
+; LA64D-NEXT:    fst.d $fs0, $sp, 16 # 8-byte Folded Spill
+; LA64D-NEXT:    fst.d $fs1, $sp, 8 # 8-byte Folded Spill
+; LA64D-NEXT:    fst.d $fs2, $sp, 0 # 8-byte Folded Spill
+; LA64D-NEXT:    .cfi_offset 1, -8
+; LA64D-NEXT:    .cfi_offset 56, -16
+; LA64D-NEXT:    .cfi_offset 57, -24
+; LA64D-NEXT:    .cfi_offset 58, -32
+; LA64D-NEXT:    fmov.s $fs0, $fa2
+; LA64D-NEXT:    fmov.s $fs1, $fa0
+; LA64D-NEXT:    fmov.s $fa0, $fa1
+; LA64D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64D-NEXT:    fmov.s $fs2, $fa0
+; LA64D-NEXT:    fmov.s $fa0, $fs1
+; LA64D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64D-NEXT:    fadd.s $fa0, $fa0, $fs2
+; LA64D-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64D-NEXT:    fmov.s $fs1, $fa0
+; LA64D-NEXT:    fmov.s $fa0, $fs0
+; LA64D-NEXT:    bl %plt(__gnu_h2f_ieee)
+; LA64D-NEXT:    fadd.s $fa0, $fs1, $fa0
+; LA64D-NEXT:    bl %plt(__gnu_f2h_ieee)
+; LA64D-NEXT:    movfr2gr.s $a0, $fa0
+; LA64D-NEXT:    lu12i.w $a1, -16
+; LA64D-NEXT:    or $a0, $a0, $a1
+; LA64D-NEXT:    movgr2fr.w $fa0, $a0
+; LA64D-NEXT:    fld.d $fs2, $sp, 0 # 8-byte Folded Reload
+; LA64D-NEXT:    fld.d $fs1, $sp, 8 # 8-byte Folded Reload
+; LA64D-NEXT:    fld.d $fs0, $sp, 16 # 8-byte Folded Reload
+; LA64D-NEXT:    ld.d $ra, $sp, 24 # 8-byte Folded Reload
+; LA64D-NEXT:    addi.d $sp, $sp, 32
+; LA64D-NEXT:    ret
+    %d = fadd half %a, %b
+    %e = fadd half %d, %c
+    ret half %e
+}
diff --git a/llvm/test/CodeGen/LoongArch/issue97981.ll b/llvm/test/CodeGen/LoongArch/issue97981.ll
@@ -0,0 +1,79 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc --mtriple=loongarch32 --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32S
+; RUN: llc --mtriple=loongarch32 --mattr=+f --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32F
+; RUN: llc --mtriple=loongarch32 --mattr=+d --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA32D
+; RUN: llc --mtriple=loongarch64 --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64S
+; RUN: llc --mtriple=loongarch64 --mattr=+f --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64F
+; RUN: llc --mtriple=loongarch64 --mattr=+d --verify-machineinstrs < %s | FileCheck %s --check-prefix=LA64D
+
+define half @to_half(i16 %bits) {
+; LA32S-LABEL: to_half:
+; LA32S:       # %bb.0:
+; LA32S-NEXT:    ret
+;
+; LA32F-LABEL: to_half:
+; LA32F:       # %bb.0:
+; LA32F-NEXT:    lu12i.w $a1, -16
+; LA32F-NEXT:    or $a0, $a0, $a1
+; LA32F-NEXT:    movgr2fr.w $fa0, $a0
+; LA32F-NEXT:    ret
+;
+; LA32D-LABEL: to_half:
+; LA32D:       # %bb.0:
+; LA32D-NEXT:    lu12i.w $a1, -16
+; LA32D-NEXT:    or $a0, $a0, $a1
+; LA32D-NEXT:    movgr2fr.w $fa0, $a0
+; LA32D-NEXT:    ret
+;
+; LA64S-LABEL: to_half:
+; LA64S:       # %bb.0:
+; LA64S-NEXT:    ret
+;
+; LA64F-LABEL: to_half:
+; LA64F:       # %bb.0:
+; LA64F-NEXT:    lu12i.w $a1, -16
+; LA64F-NEXT:    or $a0, $a0, $a1
+; LA64F-NEXT:    movgr2fr.w $fa0, $a0
+; LA64F-NEXT:    ret
+;
+; LA64D-LABEL: to_half:
+; LA64D:       # %bb.0:
+; LA64D-NEXT:    lu12i.w $a1, -16
+; LA64D-NEXT:    or $a0, $a0, $a1
+; LA64D-NEXT:    movgr2fr.w $fa0, $a0
+; LA64D-NEXT:    ret
+    %f = bitcast i16 %bits to half
+    ret half %f
+}
+
+define i16 @from_half(half %f) {
+; LA32S-LABEL: from_half:
+; LA32S:       # %bb.0:
+; LA32S-NEXT:    ret
+;
+; LA32F-LABEL: from_half:
+; LA32F:       # %bb.0:
+; LA32F-NEXT:    movfr2gr.s $a0, $fa0
+; LA32F-NEXT:    ret
+;
+; LA32D-LABEL: from_half:
+; LA32D:       # %bb.0:
+; LA32D-NEXT:    movfr2gr.s $a0, $fa0
+; LA32D-NEXT:    ret
+;
+; LA64S-LABEL: from_half:
+; LA64S:       # %bb.0:
+; LA64S-NEXT:    ret
+;
+; LA64F-LABEL: from_half:
+; LA64F:       # %bb.0:
+; LA64F-NEXT:    movfr2gr.s $a0, $fa0
+; LA64F-NEXT:    ret
+;
+; LA64D-LABEL: from_half:
+; LA64D:       # %bb.0:
+; LA64D-NEXT:    movfr2gr.s $a0, $fa0
+; LA64D-NEXT:    ret
+    %bits = bitcast half %f to i16
+    ret i16 %bits
+}