[LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx #158209

ylzsx · 2025-09-12T06:28:44Z

No description provided.

llvmbot · 2025-09-12T06:29:14Z

@llvm/pr-subscribers-backend-loongarch

Author: Zhaoxin Yang (ylzsx)

Changes

Patch is 26.20 KiB, truncated to 20.00 KiB below, full version: https://github.com/llvm/llvm-project/pull/158209.diff

11 Files Affected:

(modified) llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp (+8)
(modified) llvm/lib/Target/LoongArch/LoongArchLASXInstrInfo.td (+6)
(modified) llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td (+6)
(modified) llvm/test/CodeGen/LoongArch/lasx/ir-instruction/sadd-sat.ll (+9-46)
(modified) llvm/test/CodeGen/LoongArch/lasx/ir-instruction/ssub-sat.ll (+9-51)
(modified) llvm/test/CodeGen/LoongArch/lasx/ir-instruction/uadd-sat.ll (+4-15)
(modified) llvm/test/CodeGen/LoongArch/lasx/ir-instruction/usub-sat.ll (+4-8)
(modified) llvm/test/CodeGen/LoongArch/lsx/ir-instruction/sadd-sat.ll (+9-46)
(modified) llvm/test/CodeGen/LoongArch/lsx/ir-instruction/ssub-sat.ll (+9-51)
(modified) llvm/test/CodeGen/LoongArch/lsx/ir-instruction/uadd-sat.ll (+4-15)
(modified) llvm/test/CodeGen/LoongArch/lsx/ir-instruction/usub-sat.ll (+4-8)

diff --git a/llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp b/llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp
index 634914d3b3fd0..55238a2819363 100644
--- a/llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp
+++ b/llvm/lib/Target/LoongArch/LoongArchISelLowering.cpp
@@ -311,6 +311,10 @@ LoongArchTargetLowering::LoongArchTargetLowering(const TargetMachine &TM,
       setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);
       setOperationAction(ISD::ABDS, VT, Legal);
       setOperationAction(ISD::ABDU, VT, Legal);
+      setOperationAction(ISD::SADDSAT, VT, Legal);
+      setOperationAction(ISD::SSUBSAT, VT, Legal);
+      setOperationAction(ISD::UADDSAT, VT, Legal);
+      setOperationAction(ISD::USUBSAT, VT, Legal);
     }
     for (MVT VT : {MVT::v16i8, MVT::v8i16, MVT::v4i32})
       setOperationAction(ISD::BITREVERSE, VT, Custom);
@@ -386,6 +390,10 @@ LoongArchTargetLowering::LoongArchTargetLowering(const TargetMachine &TM,
       setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);
       setOperationAction(ISD::ABDS, VT, Legal);
       setOperationAction(ISD::ABDU, VT, Legal);
+      setOperationAction(ISD::SADDSAT, VT, Legal);
+      setOperationAction(ISD::SSUBSAT, VT, Legal);
+      setOperationAction(ISD::UADDSAT, VT, Legal);
+      setOperationAction(ISD::USUBSAT, VT, Legal);
       setOperationAction(ISD::VECREDUCE_ADD, VT, Custom);
     }
     for (MVT VT : {MVT::v32i8, MVT::v16i16, MVT::v8i32})
diff --git a/llvm/lib/Target/LoongArch/LoongArchLASXInstrInfo.td b/llvm/lib/Target/LoongArch/LoongArchLASXInstrInfo.td
index a79c01cbe577a..326a3f05fbde3 100644
--- a/llvm/lib/Target/LoongArch/LoongArchLASXInstrInfo.td
+++ b/llvm/lib/Target/LoongArch/LoongArchLASXInstrInfo.td
@@ -1990,6 +1990,12 @@ def : Pat<(v4i32(fp_to_uint v4f64:$vj)),
 defm : PatXrXr<abds, "XVABSD">;
 defm : PatXrXrU<abdu, "XVABSD">;
 
+// XVSADD_{B/H/W/D}[U], XVSSUB_{B/H/W/D}[U]
+defm : PatXrXr<saddsat, "XVSADD">;
+defm : PatXrXr<ssubsat, "XVSSUB">;
+defm : PatXrXrU<uaddsat, "XVSADD">;
+defm : PatXrXrU<usubsat, "XVSSUB">;
+
 // Vector mask set by condition
 def : Pat<(loongarch_xvmskltz (v32i8 LASX256:$vj)), (PseudoXVMSKLTZ_B LASX256:$vj)>;
 def : Pat<(loongarch_xvmskltz (v16i16 LASX256:$vj)), (PseudoXVMSKLTZ_H LASX256:$vj)>;
diff --git a/llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td b/llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td
index eb7120ffb41a6..9c28118fb0f92 100644
--- a/llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td
+++ b/llvm/lib/Target/LoongArch/LoongArchLSXInstrInfo.td
@@ -2147,6 +2147,12 @@ def : Pat<(f64 f64imm_vldi:$in),
 defm : PatVrVr<abds, "VABSD">;
 defm : PatVrVrU<abdu, "VABSD">;
 
+// VSADD_{B/H/W/D}[U], VSSUB_{B/H/W/D}[U]
+defm : PatVrVr<saddsat, "VSADD">;
+defm : PatVrVr<ssubsat, "VSSUB">;
+defm : PatVrVrU<uaddsat, "VSADD">;
+defm : PatVrVrU<usubsat, "VSSUB">;
+
 // Vector mask set by condition
 def : Pat<(loongarch_vmskltz (v16i8 LSX128:$vj)), (PseudoVMSKLTZ_B LSX128:$vj)>;
 def : Pat<(loongarch_vmskltz (v8i16 LSX128:$vj)), (PseudoVMSKLTZ_H LSX128:$vj)>;
diff --git a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/sadd-sat.ll b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/sadd-sat.ll
index ecd4ee7a62016..1802838305ed5 100644
--- a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/sadd-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/sadd-sat.ll
@@ -1,17 +1,11 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
-; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA32
-; RUN: llc -mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA64
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s
+; RUN: llc -mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s
 
 define <32 x i8> @xvsadd_b(<32 x i8> %a, <32 x i8> %b) {
 ; CHECK-LABEL: xvsadd_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvadd.b $xr2, $xr0, $xr1
-; CHECK-NEXT:    xvslt.b $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvslti.b $xr1, $xr1, 0
-; CHECK-NEXT:    xvxor.v $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvsrai.b $xr1, $xr2, 7
-; CHECK-NEXT:    xvbitrevi.b $xr1, $xr1, 7
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr2, $xr1, $xr0
+; CHECK-NEXT:    xvsadd.b $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <32 x i8> @llvm.sadd.sat.v32i8(<32 x i8> %a, <32 x i8> %b)
   ret <32 x i8> %ret
@@ -20,13 +14,7 @@ define <32 x i8> @xvsadd_b(<32 x i8> %a, <32 x i8> %b) {
 define <16 x i16> @xvsadd_h(<16 x i16> %a, <16 x i16> %b) {
 ; CHECK-LABEL: xvsadd_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvadd.h $xr2, $xr0, $xr1
-; CHECK-NEXT:    xvslt.h $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvslti.h $xr1, $xr1, 0
-; CHECK-NEXT:    xvxor.v $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvsrai.h $xr1, $xr2, 15
-; CHECK-NEXT:    xvbitrevi.h $xr1, $xr1, 15
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr2, $xr1, $xr0
+; CHECK-NEXT:    xvsadd.h $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i16> @llvm.sadd.sat.v16i16(<16 x i16> %a, <16 x i16> %b)
   ret <16 x i16> %ret
@@ -35,42 +23,17 @@ define <16 x i16> @xvsadd_h(<16 x i16> %a, <16 x i16> %b) {
 define <8 x i32> @xvsadd_w(<8 x i32> %a, <8 x i32> %b) {
 ; CHECK-LABEL: xvsadd_w:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvadd.w $xr2, $xr0, $xr1
-; CHECK-NEXT:    xvslt.w $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvslti.w $xr1, $xr1, 0
-; CHECK-NEXT:    xvxor.v $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvsrai.w $xr1, $xr2, 31
-; CHECK-NEXT:    xvbitrevi.w $xr1, $xr1, 31
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr2, $xr1, $xr0
+; CHECK-NEXT:    xvsadd.w $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <8 x i32> @llvm.sadd.sat.v8i32(<8 x i32> %a, <8 x i32> %b)
   ret <8 x i32> %ret
 }
 
 define <4 x i64> @xvsadd_d(<4 x i64> %a, <4 x i64> %b) {
-; LA32-LABEL: xvsadd_d:
-; LA32:       # %bb.0:
-; LA32-NEXT:    xvadd.d $xr2, $xr0, $xr1
-; LA32-NEXT:    xvslt.d $xr0, $xr2, $xr0
-; LA32-NEXT:    pcalau12i $a0, %pc_hi20(.LCPI3_0)
-; LA32-NEXT:    xvld $xr3, $a0, %pc_lo12(.LCPI3_0)
-; LA32-NEXT:    xvslti.d $xr1, $xr1, 0
-; LA32-NEXT:    xvxor.v $xr0, $xr1, $xr0
-; LA32-NEXT:    xvsrai.d $xr1, $xr2, 63
-; LA32-NEXT:    xvxor.v $xr1, $xr1, $xr3
-; LA32-NEXT:    xvbitsel.v $xr0, $xr2, $xr1, $xr0
-; LA32-NEXT:    ret
-;
-; LA64-LABEL: xvsadd_d:
-; LA64:       # %bb.0:
-; LA64-NEXT:    xvadd.d $xr2, $xr0, $xr1
-; LA64-NEXT:    xvslt.d $xr0, $xr2, $xr0
-; LA64-NEXT:    xvslti.d $xr1, $xr1, 0
-; LA64-NEXT:    xvxor.v $xr0, $xr1, $xr0
-; LA64-NEXT:    xvsrai.d $xr1, $xr2, 63
-; LA64-NEXT:    xvbitrevi.d $xr1, $xr1, 63
-; LA64-NEXT:    xvbitsel.v $xr0, $xr2, $xr1, $xr0
-; LA64-NEXT:    ret
+; CHECK-LABEL: xvsadd_d:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvsadd.d $xr0, $xr0, $xr1
+; CHECK-NEXT:    ret
   %ret = call <4 x i64> @llvm.sadd.sat.v4i64(<4 x i64> %a, <4 x i64> %b)
   ret <4 x i64> %ret
 }
diff --git a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/ssub-sat.ll b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/ssub-sat.ll
index 765fdb71f0642..5497c4cb913bc 100644
--- a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/ssub-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/ssub-sat.ll
@@ -1,18 +1,11 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
-; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA32
-; RUN: llc -mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s --check-prefixes=CHECK,LA64
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lasx < %s | FileCheck %s
+; RUN: llc -mtriple=loongarch64 -mattr=+lasx < %s | FileCheck %s
 
 define <32 x i8> @xvssub_b(<32 x i8> %a, <32 x i8> %b) {
 ; CHECK-LABEL: xvssub_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, 0
-; CHECK-NEXT:    xvslt.b $xr2, $xr2, $xr1
-; CHECK-NEXT:    xvsub.b $xr1, $xr0, $xr1
-; CHECK-NEXT:    xvslt.b $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvxor.v $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvsrai.b $xr2, $xr1, 7
-; CHECK-NEXT:    xvbitrevi.b $xr2, $xr2, 7
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr1, $xr2, $xr0
+; CHECK-NEXT:    xvssub.b $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <32 x i8> @llvm.ssub.sat.v32i8(<32 x i8> %a, <32 x i8> %b)
   ret <32 x i8> %ret
@@ -21,14 +14,7 @@ define <32 x i8> @xvssub_b(<32 x i8> %a, <32 x i8> %b) {
 define <16 x i16> @xvssub_h(<16 x i16> %a, <16 x i16> %b) {
 ; CHECK-LABEL: xvssub_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, 0
-; CHECK-NEXT:    xvslt.h $xr2, $xr2, $xr1
-; CHECK-NEXT:    xvsub.h $xr1, $xr0, $xr1
-; CHECK-NEXT:    xvslt.h $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvxor.v $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvsrai.h $xr2, $xr1, 15
-; CHECK-NEXT:    xvbitrevi.h $xr2, $xr2, 15
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr1, $xr2, $xr0
+; CHECK-NEXT:    xvssub.h $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i16> @llvm.ssub.sat.v16i16(<16 x i16> %a, <16 x i16> %b)
   ret <16 x i16> %ret
@@ -37,45 +23,17 @@ define <16 x i16> @xvssub_h(<16 x i16> %a, <16 x i16> %b) {
 define <8 x i32> @xvssub_w(<8 x i32> %a, <8 x i32> %b) {
 ; CHECK-LABEL: xvssub_w:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, 0
-; CHECK-NEXT:    xvslt.w $xr2, $xr2, $xr1
-; CHECK-NEXT:    xvsub.w $xr1, $xr0, $xr1
-; CHECK-NEXT:    xvslt.w $xr0, $xr1, $xr0
-; CHECK-NEXT:    xvxor.v $xr0, $xr2, $xr0
-; CHECK-NEXT:    xvsrai.w $xr2, $xr1, 31
-; CHECK-NEXT:    xvbitrevi.w $xr2, $xr2, 31
-; CHECK-NEXT:    xvbitsel.v $xr0, $xr1, $xr2, $xr0
+; CHECK-NEXT:    xvssub.w $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <8 x i32> @llvm.ssub.sat.v8i32(<8 x i32> %a, <8 x i32> %b)
   ret <8 x i32> %ret
 }
 
 define <4 x i64> @xvssub_d(<4 x i64> %a, <4 x i64> %b) {
-; LA32-LABEL: xvssub_d:
-; LA32:       # %bb.0:
-; LA32-NEXT:    xvrepli.b $xr2, 0
-; LA32-NEXT:    xvslt.d $xr2, $xr2, $xr1
-; LA32-NEXT:    xvsub.d $xr1, $xr0, $xr1
-; LA32-NEXT:    pcalau12i $a0, %pc_hi20(.LCPI3_0)
-; LA32-NEXT:    xvld $xr3, $a0, %pc_lo12(.LCPI3_0)
-; LA32-NEXT:    xvslt.d $xr0, $xr1, $xr0
-; LA32-NEXT:    xvxor.v $xr0, $xr2, $xr0
-; LA32-NEXT:    xvsrai.d $xr2, $xr1, 63
-; LA32-NEXT:    xvxor.v $xr2, $xr2, $xr3
-; LA32-NEXT:    xvbitsel.v $xr0, $xr1, $xr2, $xr0
-; LA32-NEXT:    ret
-;
-; LA64-LABEL: xvssub_d:
-; LA64:       # %bb.0:
-; LA64-NEXT:    xvrepli.b $xr2, 0
-; LA64-NEXT:    xvslt.d $xr2, $xr2, $xr1
-; LA64-NEXT:    xvsub.d $xr1, $xr0, $xr1
-; LA64-NEXT:    xvslt.d $xr0, $xr1, $xr0
-; LA64-NEXT:    xvxor.v $xr0, $xr2, $xr0
-; LA64-NEXT:    xvsrai.d $xr2, $xr1, 63
-; LA64-NEXT:    xvbitrevi.d $xr2, $xr2, 63
-; LA64-NEXT:    xvbitsel.v $xr0, $xr1, $xr2, $xr0
-; LA64-NEXT:    ret
+; CHECK-LABEL: xvssub_d:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    xvssub.d $xr0, $xr0, $xr1
+; CHECK-NEXT:    ret
   %ret = call <4 x i64> @llvm.ssub.sat.v4i64(<4 x i64> %a, <4 x i64> %b)
   ret <4 x i64> %ret
 }
diff --git a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/uadd-sat.ll b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/uadd-sat.ll
index f0317218d3b1d..6943c9188ada9 100644
--- a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/uadd-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/uadd-sat.ll
@@ -5,9 +5,7 @@
 define <32 x i8> @xvuadd_b(<32 x i8> %a, <32 x i8> %b) {
 ; CHECK-LABEL: xvuadd_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvxori.b $xr2, $xr1, 255
-; CHECK-NEXT:    xvmin.bu $xr0, $xr0, $xr2
-; CHECK-NEXT:    xvadd.b $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvsadd.bu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <32 x i8> @llvm.uadd.sat.v32i8(<32 x i8> %a, <32 x i8> %b)
   ret <32 x i8> %ret
@@ -16,10 +14,7 @@ define <32 x i8> @xvuadd_b(<32 x i8> %a, <32 x i8> %b) {
 define <16 x i16> @xvuadd_h(<16 x i16> %a, <16 x i16> %b) {
 ; CHECK-LABEL: xvuadd_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, -1
-; CHECK-NEXT:    xvxor.v $xr2, $xr1, $xr2
-; CHECK-NEXT:    xvmin.hu $xr0, $xr0, $xr2
-; CHECK-NEXT:    xvadd.h $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvsadd.hu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i16> @llvm.uadd.sat.v16i16(<16 x i16> %a, <16 x i16> %b)
   ret <16 x i16> %ret
@@ -28,10 +23,7 @@ define <16 x i16> @xvuadd_h(<16 x i16> %a, <16 x i16> %b) {
 define <8 x i32> @xvuadd_w(<8 x i32> %a, <8 x i32> %b) {
 ; CHECK-LABEL: xvuadd_w:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, -1
-; CHECK-NEXT:    xvxor.v $xr2, $xr1, $xr2
-; CHECK-NEXT:    xvmin.wu $xr0, $xr0, $xr2
-; CHECK-NEXT:    xvadd.w $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvsadd.wu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <8 x i32> @llvm.uadd.sat.v8i32(<8 x i32> %a, <8 x i32> %b)
   ret <8 x i32> %ret
@@ -40,10 +32,7 @@ define <8 x i32> @xvuadd_w(<8 x i32> %a, <8 x i32> %b) {
 define <4 x i64> @xvuadd_d(<4 x i64> %a, <4 x i64> %b) {
 ; CHECK-LABEL: xvuadd_d:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvrepli.b $xr2, -1
-; CHECK-NEXT:    xvxor.v $xr2, $xr1, $xr2
-; CHECK-NEXT:    xvmin.du $xr0, $xr0, $xr2
-; CHECK-NEXT:    xvadd.d $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvsadd.du $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <4 x i64> @llvm.uadd.sat.v4i64(<4 x i64> %a, <4 x i64> %b)
   ret <4 x i64> %ret
diff --git a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/usub-sat.ll b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/usub-sat.ll
index fe7d477204be7..9c0ff46179e5a 100644
--- a/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/usub-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lasx/ir-instruction/usub-sat.ll
@@ -5,8 +5,7 @@
 define <32 x i8> @xvusub_b(<32 x i8> %a, <32 x i8> %b) {
 ; CHECK-LABEL: xvusub_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvmax.bu $xr0, $xr0, $xr1
-; CHECK-NEXT:    xvsub.b $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvssub.bu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <32 x i8> @llvm.usub.sat.v32i8(<32 x i8> %a, <32 x i8> %b)
   ret <32 x i8> %ret
@@ -15,8 +14,7 @@ define <32 x i8> @xvusub_b(<32 x i8> %a, <32 x i8> %b) {
 define <16 x i16> @xvusub_h(<16 x i16> %a, <16 x i16> %b) {
 ; CHECK-LABEL: xvusub_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvmax.hu $xr0, $xr0, $xr1
-; CHECK-NEXT:    xvsub.h $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvssub.hu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i16> @llvm.usub.sat.v16i16(<16 x i16> %a, <16 x i16> %b)
   ret <16 x i16> %ret
@@ -25,8 +23,7 @@ define <16 x i16> @xvusub_h(<16 x i16> %a, <16 x i16> %b) {
 define <8 x i32> @xvusub_w(<8 x i32> %a, <8 x i32> %b) {
 ; CHECK-LABEL: xvusub_w:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvmax.wu $xr0, $xr0, $xr1
-; CHECK-NEXT:    xvsub.w $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvssub.wu $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <8 x i32> @llvm.usub.sat.v8i32(<8 x i32> %a, <8 x i32> %b)
   ret <8 x i32> %ret
@@ -35,8 +32,7 @@ define <8 x i32> @xvusub_w(<8 x i32> %a, <8 x i32> %b) {
 define <4 x i64> @xvusub_d(<4 x i64> %a, <4 x i64> %b) {
 ; CHECK-LABEL: xvusub_d:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    xvmax.du $xr0, $xr0, $xr1
-; CHECK-NEXT:    xvsub.d $xr0, $xr0, $xr1
+; CHECK-NEXT:    xvssub.du $xr0, $xr0, $xr1
 ; CHECK-NEXT:    ret
   %ret = call <4 x i64> @llvm.usub.sat.v4i64(<4 x i64> %a, <4 x i64> %b)
   ret <4 x i64> %ret
diff --git a/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/sadd-sat.ll b/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/sadd-sat.ll
index dd5842fcbec65..5871b4c497e50 100644
--- a/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/sadd-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/sadd-sat.ll
@@ -1,17 +1,11 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
-; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lsx < %s | FileCheck %s --check-prefixes=CHECK,LA32
-; RUN: llc -mtriple=loongarch64 -mattr=+lsx < %s | FileCheck %s --check-prefixes=CHECK,LA64
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lsx < %s | FileCheck %s
+; RUN: llc -mtriple=loongarch64 -mattr=+lsx < %s | FileCheck %s
 
 define <16 x i8> @vsadd_b(<16 x i8> %a, <16 x i8> %b) {
 ; CHECK-LABEL: vsadd_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    vadd.b $vr2, $vr0, $vr1
-; CHECK-NEXT:    vslt.b $vr0, $vr2, $vr0
-; CHECK-NEXT:    vslti.b $vr1, $vr1, 0
-; CHECK-NEXT:    vxor.v $vr0, $vr1, $vr0
-; CHECK-NEXT:    vsrai.b $vr1, $vr2, 7
-; CHECK-NEXT:    vbitrevi.b $vr1, $vr1, 7
-; CHECK-NEXT:    vbitsel.v $vr0, $vr2, $vr1, $vr0
+; CHECK-NEXT:    vsadd.b $vr0, $vr0, $vr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i8> @llvm.sadd.sat.v16i8(<16 x i8> %a, <16 x i8> %b)
   ret <16 x i8> %ret
@@ -20,13 +14,7 @@ define <16 x i8> @vsadd_b(<16 x i8> %a, <16 x i8> %b) {
 define <8 x i16> @vsadd_h(<8 x i16> %a, <8 x i16> %b) {
 ; CHECK-LABEL: vsadd_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    vadd.h $vr2, $vr0, $vr1
-; CHECK-NEXT:    vslt.h $vr0, $vr2, $vr0
-; CHECK-NEXT:    vslti.h $vr1, $vr1, 0
-; CHECK-NEXT:    vxor.v $vr0, $vr1, $vr0
-; CHECK-NEXT:    vsrai.h $vr1, $vr2, 15
-; CHECK-NEXT:    vbitrevi.h $vr1, $vr1, 15
-; CHECK-NEXT:    vbitsel.v $vr0, $vr2, $vr1, $vr0
+; CHECK-NEXT:    vsadd.h $vr0, $vr0, $vr1
 ; CHECK-NEXT:    ret
   %ret = call <8 x i16> @llvm.sadd.sat.v8i16(<8 x i16> %a, <8 x i16> %b)
   ret <8 x i16> %ret
@@ -35,42 +23,17 @@ define <8 x i16> @vsadd_h(<8 x i16> %a, <8 x i16> %b) {
 define <4 x i32> @vsadd_w(<4 x i32> %a, <4 x i32> %b) {
 ; CHECK-LABEL: vsadd_w:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    vadd.w $vr2, $vr0, $vr1
-; CHECK-NEXT:    vslt.w $vr0, $vr2, $vr0
-; CHECK-NEXT:    vslti.w $vr1, $vr1, 0
-; CHECK-NEXT:    vxor.v $vr0, $vr1, $vr0
-; CHECK-NEXT:    vsrai.w $vr1, $vr2, 31
-; CHECK-NEXT:    vbitrevi.w $vr1, $vr1, 31
-; CHECK-NEXT:    vbitsel.v $vr0, $vr2, $vr1, $vr0
+; CHECK-NEXT:    vsadd.w $vr0, $vr0, $vr1
 ; CHECK-NEXT:    ret
   %ret = call <4 x i32> @llvm.sadd.sat.v4i32(<4 x i32> %a, <4 x i32> %b)
   ret <4 x i32> %ret
 }
 
 define <2 x i64> @vsadd_d(<2 x i64> %a, <2 x i64> %b) {
-; LA32-LABEL: vsadd_d:
-; LA32:       # %bb.0:
-; LA32-NEXT:    vadd.d $vr2, $vr0, $vr1
-; LA32-NEXT:    vslt.d $vr0, $vr2, $vr0
-; LA32-NEXT:    pcalau12i $a0, %pc_hi20(.LCPI3_0)
-; LA32-NEXT:    vld $vr3, $a0, %pc_lo12(.LCPI3_0)
-; LA32-NEXT:    vslti.d $vr1, $vr1, 0
-; LA32-NEXT:    vxor.v $vr0, $vr1, $vr0
-; LA32-NEXT:    vsrai.d $vr1, $vr2, 63
-; LA32-NEXT:    vxor.v $vr1, $vr1, $vr3
-; LA32-NEXT:    vbitsel.v $vr0, $vr2, $vr1, $vr0
-; LA32-NEXT:    ret
-;
-; LA64-LABEL: vsadd_d:
-; LA64:       # %bb.0:
-; LA64-NEXT:    vadd.d $vr2, $vr0, $vr1
-; LA64-NEXT:    vslt.d $vr0, $vr2, $vr0
-; LA64-NEXT:    vslti.d $vr1, $vr1, 0
-; LA64-NEXT:    vxor.v $vr0, $vr1, $vr0
-; LA64-NEXT:    vsrai.d $vr1, $vr2, 63
-; LA64-NEXT:    vbitrevi.d $vr1, $vr1, 63
-; LA64-NEXT:    vbitsel.v $vr0, $vr2, $vr1, $vr0
-; LA64-NEXT:    ret
+; CHECK-LABEL: vsadd_d:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsadd.d $vr0, $vr0, $vr1
+; CHECK-NEXT:    ret
   %ret = call <2 x i64> @llvm.sadd.sat.v2i64(<2 x i64> %a, <2 x i64> %b)
   ret <2 x i64> %ret
 }
diff --git a/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/ssub-sat.ll b/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/ssub-sat.ll
index e330b7e43b42e..4ae52f30bb7cd 100644
--- a/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/ssub-sat.ll
+++ b/llvm/test/CodeGen/LoongArch/lsx/ir-instruction/ssub-sat.ll
@@ -1,18 +1,11 @@
 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
-; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lsx < %s | FileCheck %s --check-prefixes=CHECK,LA32
-; RUN: llc -mtriple=loongarch64 -mattr=+lsx < %s | FileCheck %s --check-prefixes=CHECK,LA64
+; RUN: llc --mtriple=loongarch32 --mattr=+32s,+lsx < %s | FileCheck %s
+; RUN: llc -mtriple=loongarch64 -mattr=+lsx < %s | FileCheck %s
 
 define <16 x i8> @vssub_b(<16 x i8> %a, <16 x i8> %b) {
 ; CHECK-LABEL: vssub_b:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    vrepli.b $vr2, 0
-; CHECK-NEXT:    vslt.b $vr2, $vr2, $vr1
-; CHECK-NEXT:    vsub.b $vr1, $vr0, $vr1
-; CHECK-NEXT:    vslt.b $vr0, $vr1, $vr0
-; CHECK-NEXT:    vxor.v $vr0, $vr2, $vr0
-; CHECK-NEXT:    vsrai.b $vr2, $vr1, 7
-; CHECK-NEXT:    vbitrevi.b $vr2, $vr2, 7
-; CHECK-NEXT:    vbitsel.v $vr0, $vr1, $vr2, $vr0
+; CHECK-NEXT:    vssub.b $vr0, $vr0, $vr1
 ; CHECK-NEXT:    ret
   %ret = call <16 x i8> @llvm.ssub.sat.v16i8(<16 x i8> %a, <16 x i8> %b)
   ret <16 x i8> %ret
@@ -21,14 +14,7 @@ define <16 x i8> @vssub_b(<16 x i8> %a, <16 x i8> %b) {
 define <8 x i16> @vssub_h(<8 x i16> %a, <8 x i16> %b) {
 ; CHECK-LABEL: vssub_h:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    vrepli.b $vr2, 0
-; CHECK-NEXT:    vslt.h $vr2, $vr2, $vr1
-; CHECK-NEXT:    vsub.h $vr1, $vr0, $vr1
-; CHECK-NEXT:    vslt.h $vr0, $vr1, $vr0
-; CHECK-NEXT:    vxor.v $vr0, $vr2, $vr0
-; CHECK-N...
[truncated]

heiher

LGTM.

llvmbot added the backend:loongarch label Sep 12, 2025

ylzsx requested review from heiher and tangaac September 12, 2025 06:30

tangaac mentioned this pull request Sep 12, 2025

LLVM optimization on PR 158209 [bot] llvm-ci-la/llvm-opt-ci#54

Closed

heiher approved these changes Sep 13, 2025

View reviewed changes

ylzsx requested a review from SixWeining September 15, 2025 02:08

SixWeining changed the title ~~[LoongArch] make sadd/ssub/uadd/usub legal for lsx/lasx~~ [LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx Sep 15, 2025

SixWeining approved these changes Sep 15, 2025

View reviewed changes

Base automatically changed from users/ylzsx/precommit-suadd-susub to main September 16, 2025 02:34

[LoongArch] make sadd/ssub/uadd/usub legal for lsx/lasx

02c8660

ylzsx force-pushed the users/ylzsx/legal-suadd-susub branch from e2c2b5c to 02c8660 Compare September 16, 2025 02:37

ylzsx merged commit bc44ff2 into main Sep 16, 2025
9 checks passed

ylzsx deleted the users/ylzsx/legal-suadd-susub branch September 16, 2025 06:07

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx #158209

[LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx #158209

Uh oh!

ylzsx commented Sep 12, 2025

Uh oh!

llvmbot commented Sep 12, 2025

Uh oh!

heiher left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

[LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx #158209

[LoongArch] Make {sadd,ssub,uadd,usub}sat legal for lsx/lasx #158209

Uh oh!

Conversation

ylzsx commented Sep 12, 2025

Uh oh!

llvmbot commented Sep 12, 2025

Uh oh!

heiher left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants