llvm
diff --git a/‎llvm/lib/Target/LoongArch/LoongArchISelDAGToDAG.cpp‎
Lines changed: 5 additions & 8 deletions b/‎llvm/lib/Target/LoongArch/LoongArchISelDAGToDAG.cpp‎
Lines changed: 5 additions & 8 deletions
diff --git a/‎llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp‎
Lines changed: 77 additions & 51 deletions b/‎llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp‎
Lines changed: 77 additions & 51 deletions
diff --git a/‎llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td‎
Lines changed: 1 addition & 1 deletion b/‎llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎llvm/test/CodeGen/LoongArch/lasx/broadcast-load.ll‎
Lines changed: 79 additions & 22 deletions b/‎llvm/test/CodeGen/LoongArch/lasx/broadcast-load.ll‎
Lines changed: 79 additions & 22 deletions
diff --git a/‎llvm/test/CodeGen/LoongArch/lasx/bswap.ll‎
Lines changed: 1 addition & 0 deletions b/‎llvm/test/CodeGen/LoongArch/lasx/bswap.ll‎
Lines changed: 1 addition & 0 deletions
@@ -114,7 +114,7 @@ void LoongArchDAGToDAGISel::Select(SDNode *Node) {
     unsigned SplatBitSize;
     bool HasAnyUndefs;
     unsigned Op;
-    EVT ViaVecTy;
+    EVT ResTy = BVN->getValueType(0);
     bool Is128Vec = BVN->getValueType(0).is128BitVector();
     bool Is256Vec = BVN->getValueType(0).is256BitVector();
 
@@ -129,28 +129,25 @@ void LoongArchDAGToDAGISel::Select(SDNode *Node) {
       break;
     case 8:
       Op = Is256Vec ? LoongArch::PseudoXVREPLI_B : LoongArch::PseudoVREPLI_B;
-      ViaVecTy = Is256Vec ? MVT::v32i8 : MVT::v16i8;
       break;
     case 16:
       Op = Is256Vec ? LoongArch::PseudoXVREPLI_H : LoongArch::PseudoVREPLI_H;
-      ViaVecTy = Is256Vec ? MVT::v16i16 : MVT::v8i16;
       break;
     case 32:
       Op = Is256Vec ? LoongArch::PseudoXVREPLI_W : LoongArch::PseudoVREPLI_W;
-      ViaVecTy = Is256Vec ? MVT::v8i32 : MVT::v4i32;
       break;
     case 64:
       Op = Is256Vec ? LoongArch::PseudoXVREPLI_D : LoongArch::PseudoVREPLI_D;
-      ViaVecTy = Is256Vec ? MVT::v4i64 : MVT::v2i64;
       break;
     }
 
     SDNode *Res;
     // If we have a signed 10 bit integer, we can splat it directly.
     if (SplatValue.isSignedIntN(10)) {
-      SDValue Imm = CurDAG->getTargetConstant(SplatValue, DL,
-                                              ViaVecTy.getVectorElementType());
-      Res = CurDAG->getMachineNode(Op, DL, ViaVecTy, Imm);
+      EVT EleType = ResTy.getVectorElementType();
+      APInt Val = SplatValue.sextOrTrunc(EleType.getSizeInBits());
+      SDValue Imm = CurDAG->getTargetConstant(Val, DL, EleType);
+      Res = CurDAG->getMachineNode(Op, DL, ResTy, Imm);
       ReplaceNode(Node, Res);
       return;
     }
 
@@ -22,7 +22,7 @@ def SDT_LoongArchVShuf : SDTypeProfile<1, 3, [SDTCisVec<0>,
 def SDT_LoongArchV2R : SDTypeProfile<1, 2, [SDTCisVec<0>,
                                      SDTCisSameAs<0, 1>, SDTCisSameAs<1, 2>]>;
 def SDT_LoongArchV1RUimm: SDTypeProfile<1, 2, [SDTCisVec<0>,
-                                        SDTCisSameAs<0,1>, SDTCisVT<2, i64>]>;
+                                        SDTCisSameAs<0,1>, SDTCisVT<2, GRLenVT>]>;
 def SDT_LoongArchV2RUimm
     : SDTypeProfile<1, 3,
                     [SDTCisVec<0>, SDTCisSameAs<0, 1>, SDTCisSameAs<1, 2>,
 
@@ -1,16 +1,31 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
-; RUN: llc --mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA32
+; RUN: llc --mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA64
 
-; TODO: Load a element and splat it to a vector could be lowerd to xvldrepl
 
-; A load has more than one user shouldn't be lowered to xvldrepl
 define <4 x i64> @should_not_be_optimized(ptr %ptr, ptr %dst) {
-; CHECK-LABEL: should_not_be_optimized:
-; CHECK:       # %bb.0:
-; CHECK-NEXT:    ld.d $a0, $a0, 0
-; CHECK-NEXT:    xvreplgr2vr.d $xr0, $a0
-; CHECK-NEXT:    st.d $a0, $a1, 0
-; CHECK-NEXT:    ret
+; LA32-LABEL: should_not_be_optimized:
+; LA32:       # %bb.0:
+; LA32-NEXT:    ld.w $a2, $a0, 0
+; LA32-NEXT:    ld.w $a0, $a0, 4
+; LA32-NEXT:    st.w $a2, $a1, 0
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a2, 0
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 1
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a2, 2
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 3
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a2, 4
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 5
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a2, 6
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 7
+; LA32-NEXT:    st.w $a0, $a1, 4
+; LA32-NEXT:    ret
+;
+; LA64-LABEL: should_not_be_optimized:
+; LA64:       # %bb.0:
+; LA64-NEXT:    ld.d $a0, $a0, 0
+; LA64-NEXT:    xvreplgr2vr.d $xr0, $a0
+; LA64-NEXT:    st.d $a0, $a1, 0
+; LA64-NEXT:    ret
   %tmp = load i64, ptr %ptr
   store i64 %tmp, ptr %dst
   %tmp1 = insertelement <4 x i64> zeroinitializer, i64 %tmp, i32 0
@@ -19,11 +34,25 @@ define <4 x i64> @should_not_be_optimized(ptr %ptr, ptr %dst) {
 }
 
 define <4 x i64> @xvldrepl_d_unaligned_offset(ptr %ptr) {
-; CHECK-LABEL: xvldrepl_d_unaligned_offset:
-; CHECK:       # %bb.0:
-; CHECK-NEXT:    addi.d $a0, $a0, 4
-; CHECK-NEXT:    xvldrepl.d $xr0, $a0, 0
-; CHECK-NEXT:    ret
+; LA32-LABEL: xvldrepl_d_unaligned_offset:
+; LA32:       # %bb.0:
+; LA32-NEXT:    ld.w $a1, $a0, 4
+; LA32-NEXT:    ld.w $a0, $a0, 8
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 0
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 1
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 2
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 3
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 4
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 5
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 6
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 7
+; LA32-NEXT:    ret
+;
+; LA64-LABEL: xvldrepl_d_unaligned_offset:
+; LA64:       # %bb.0:
+; LA64-NEXT:    addi.d $a0, $a0, 4
+; LA64-NEXT:    xvldrepl.d $xr0, $a0, 0
+; LA64-NEXT:    ret
   %p = getelementptr i32, ptr %ptr, i32 1
   %tmp = load i64, ptr %p
   %tmp1 = insertelement <4 x i64> zeroinitializer, i64 %tmp, i32 0
@@ -103,21 +132,49 @@ define <8 x i32> @xvldrepl_w_offset(ptr %ptr) {
 
 
 define <4 x i64> @xvldrepl_d(ptr %ptr) {
-; CHECK-LABEL: xvldrepl_d:
-; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvldrepl.d $xr0, $a0, 0
-; CHECK-NEXT:    ret
+; LA32-LABEL: xvldrepl_d:
+; LA32:       # %bb.0:
+; LA32-NEXT:    ld.w $a1, $a0, 0
+; LA32-NEXT:    ld.w $a0, $a0, 4
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 0
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 1
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 2
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 3
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 4
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 5
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 6
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 7
+; LA32-NEXT:    ret
+;
+; LA64-LABEL: xvldrepl_d:
+; LA64:       # %bb.0:
+; LA64-NEXT:    xvldrepl.d $xr0, $a0, 0
+; LA64-NEXT:    ret
   %tmp = load i64, ptr %ptr
   %tmp1 = insertelement <4 x i64> zeroinitializer, i64 %tmp, i32 0
   %tmp2 = shufflevector <4 x i64> %tmp1, <4 x i64> poison, <4 x i32> zeroinitializer
   ret <4 x i64> %tmp2
 }
 
 define <4 x i64> @xvldrepl_d_offset(ptr %ptr) {
-; CHECK-LABEL: xvldrepl_d_offset:
-; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvldrepl.d $xr0, $a0, 264
-; CHECK-NEXT:    ret
+; LA32-LABEL: xvldrepl_d_offset:
+; LA32:       # %bb.0:
+; LA32-NEXT:    ld.w $a1, $a0, 264
+; LA32-NEXT:    ld.w $a0, $a0, 268
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 0
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 1
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 2
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 3
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 4
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 5
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a1, 6
+; LA32-NEXT:    xvinsgr2vr.w $xr0, $a0, 7
+; LA32-NEXT:    ret
+;
+; LA64-LABEL: xvldrepl_d_offset:
+; LA64:       # %bb.0:
+; LA64-NEXT:    xvldrepl.d $xr0, $a0, 264
+; LA64-NEXT:    ret
   %p = getelementptr i64, ptr %ptr, i64 33
   %tmp = load i64, ptr %p
   %tmp1 = insertelement <4 x i64> zeroinitializer, i64 %tmp, i32 0
 
@@ -1,4 +1,5 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s
 ; RUN: llc --mtriple=loongarch64 --mattr=+lasx < %s | FileCheck %s
 
 define void @bswap_v16i16(ptr %src, ptr %dst) nounwind {
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,5 @@`
`1`	`1`	`; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5`
	`2`	`+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s \| FileCheck %s`
`2`	`3`	`; RUN: llc --mtriple=loongarch64 --mattr=+lasx < %s \| FileCheck %s`
`3`	`4`
`4`	`5`	`define void @bswap_v16i16(ptr %src, ptr %dst) nounwind {`