@@ -200,12 +200,12 @@ define void @test_compresstore_v256i8(ptr %p, <256 x i1> %mask, <256 x i8> %data
200200; RV64-NEXT: vsetivli zero, 1, e64, m1, ta, ma
201201; RV64-NEXT: vmv1r.v v7, v8
202202; RV64-NEXT: li a2, 128
203- ; RV64-NEXT: vslidedown.vi v9 , v0, 1
203+ ; RV64-NEXT: vslidedown.vi v8 , v0, 1
204204; RV64-NEXT: vmv.x.s a3, v0
205205; RV64-NEXT: vsetvli zero, a2, e8, m8, ta, ma
206206; RV64-NEXT: vle8.v v24, (a1)
207207; RV64-NEXT: vsetvli zero, a2, e64, m1, ta, ma
208- ; RV64-NEXT: vmv.x.s a1, v9
208+ ; RV64-NEXT: vmv.x.s a1, v8
209209; RV64-NEXT: vsetvli zero, a2, e8, m8, ta, ma
210210; RV64-NEXT: vcompress.vm v8, v16, v0
211211; RV64-NEXT: vcpop.m a4, v0
@@ -227,14 +227,14 @@ define void @test_compresstore_v256i8(ptr %p, <256 x i1> %mask, <256 x i8> %data
227227; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
228228; RV32-NEXT: vmv1r.v v7, v8
229229; RV32-NEXT: li a2, 128
230- ; RV32-NEXT: vslidedown.vi v9 , v0, 1
230+ ; RV32-NEXT: vslidedown.vi v8 , v0, 1
231231; RV32-NEXT: li a3, 32
232232; RV32-NEXT: vmv.x.s a4, v0
233233; RV32-NEXT: vsetvli zero, a2, e8, m8, ta, ma
234234; RV32-NEXT: vle8.v v24, (a1)
235235; RV32-NEXT: vsetivli zero, 1, e64, m1, ta, ma
236- ; RV32-NEXT: vsrl.vx v6, v9 , a3
237- ; RV32-NEXT: vmv.x.s a1, v9
236+ ; RV32-NEXT: vsrl.vx v6, v8 , a3
237+ ; RV32-NEXT: vmv.x.s a1, v8
238238; RV32-NEXT: vsrl.vx v5, v0, a3
239239; RV32-NEXT: vsetvli zero, a2, e8, m8, ta, ma
240240; RV32-NEXT: vcompress.vm v8, v16, v0
@@ -438,16 +438,16 @@ define void @test_compresstore_v128i16(ptr %p, <128 x i1> %mask, <128 x i16> %da
438438; RV64-NEXT: vcompress.vm v24, v8, v0
439439; RV64-NEXT: vcpop.m a2, v0
440440; RV64-NEXT: vsetivli zero, 8, e8, m1, ta, ma
441- ; RV64-NEXT: vslidedown.vi v8 , v0, 8
441+ ; RV64-NEXT: vslidedown.vi v7 , v0, 8
442442; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma
443- ; RV64-NEXT: vcompress.vm v0 , v16, v8
444- ; RV64-NEXT: vcpop.m a1, v8
443+ ; RV64-NEXT: vcompress.vm v8 , v16, v7
444+ ; RV64-NEXT: vcpop.m a1, v7
445445; RV64-NEXT: vsetvli zero, a2, e16, m8, ta, ma
446446; RV64-NEXT: vse16.v v24, (a0)
447447; RV64-NEXT: slli a2, a2, 1
448448; RV64-NEXT: add a0, a0, a2
449449; RV64-NEXT: vsetvli zero, a1, e16, m8, ta, ma
450- ; RV64-NEXT: vse16.v v0 , (a0)
450+ ; RV64-NEXT: vse16.v v8 , (a0)
451451; RV64-NEXT: ret
452452;
453453; RV32-LABEL: test_compresstore_v128i16:
@@ -635,16 +635,16 @@ define void @test_compresstore_v64i32(ptr %p, <64 x i1> %mask, <64 x i32> %data)
635635; RV64-NEXT: vsetvli zero, a2, e32, m8, ta, ma
636636; RV64-NEXT: vse32.v v24, (a0)
637637; RV64-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
638- ; RV64-NEXT: vslidedown.vi v8 , v0, 4
638+ ; RV64-NEXT: vslidedown.vi v24 , v0, 4
639639; RV64-NEXT: vsetvli zero, a1, e32, m8, ta, ma
640640; RV64-NEXT: vmv.x.s a1, v0
641- ; RV64-NEXT: vcompress.vm v24 , v16, v8
642- ; RV64-NEXT: vcpop.m a2, v8
641+ ; RV64-NEXT: vcompress.vm v8 , v16, v24
642+ ; RV64-NEXT: vcpop.m a2, v24
643643; RV64-NEXT: cpopw a1, a1
644644; RV64-NEXT: slli a1, a1, 2
645645; RV64-NEXT: add a0, a0, a1
646646; RV64-NEXT: vsetvli zero, a2, e32, m8, ta, ma
647- ; RV64-NEXT: vse32.v v24 , (a0)
647+ ; RV64-NEXT: vse32.v v8 , (a0)
648648; RV64-NEXT: ret
649649;
650650; RV32-LABEL: test_compresstore_v64i32:
@@ -654,16 +654,16 @@ define void @test_compresstore_v64i32(ptr %p, <64 x i1> %mask, <64 x i32> %data)
654654; RV32-NEXT: vcompress.vm v24, v8, v0
655655; RV32-NEXT: vcpop.m a2, v0
656656; RV32-NEXT: vsetivli zero, 4, e8, mf2, ta, ma
657- ; RV32-NEXT: vslidedown.vi v8 , v0, 4
657+ ; RV32-NEXT: vslidedown.vi v7 , v0, 4
658658; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
659- ; RV32-NEXT: vcompress.vm v0 , v16, v8
660- ; RV32-NEXT: vcpop.m a1, v8
659+ ; RV32-NEXT: vcompress.vm v8 , v16, v7
660+ ; RV32-NEXT: vcpop.m a1, v7
661661; RV32-NEXT: vsetvli zero, a2, e32, m8, ta, ma
662662; RV32-NEXT: vse32.v v24, (a0)
663663; RV32-NEXT: slli a2, a2, 2
664664; RV32-NEXT: add a0, a0, a2
665665; RV32-NEXT: vsetvli zero, a1, e32, m8, ta, ma
666- ; RV32-NEXT: vse32.v v0 , (a0)
666+ ; RV32-NEXT: vse32.v v8 , (a0)
667667; RV32-NEXT: ret
668668entry:
669669 tail call void @llvm.masked.compressstore.v64i32 (<64 x i32 > %data , ptr align 4 %p , <64 x i1 > %mask )
@@ -796,18 +796,18 @@ define void @test_compresstore_v32i64(ptr %p, <32 x i1> %mask, <32 x i64> %data)
796796; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
797797; RV64-NEXT: vse64.v v24, (a0)
798798; RV64-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
799- ; RV64-NEXT: vslidedown.vi v8 , v0, 2
799+ ; RV64-NEXT: vslidedown.vi v24 , v0, 2
800800; RV64-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
801801; RV64-NEXT: vmv.x.s a1, v0
802802; RV64-NEXT: vsetivli zero, 16, e64, m8, ta, ma
803- ; RV64-NEXT: vcompress.vm v24 , v16, v8
803+ ; RV64-NEXT: vcompress.vm v8 , v16, v24
804804; RV64-NEXT: zext.h a1, a1
805805; RV64-NEXT: cpopw a1, a1
806806; RV64-NEXT: slli a1, a1, 3
807807; RV64-NEXT: add a0, a0, a1
808- ; RV64-NEXT: vcpop.m a1, v8
808+ ; RV64-NEXT: vcpop.m a1, v24
809809; RV64-NEXT: vsetvli zero, a1, e64, m8, ta, ma
810- ; RV64-NEXT: vse64.v v24 , (a0)
810+ ; RV64-NEXT: vse64.v v8 , (a0)
811811; RV64-NEXT: ret
812812;
813813; RV32-LABEL: test_compresstore_v32i64:
@@ -818,18 +818,18 @@ define void @test_compresstore_v32i64(ptr %p, <32 x i1> %mask, <32 x i64> %data)
818818; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
819819; RV32-NEXT: vse64.v v24, (a0)
820820; RV32-NEXT: vsetivli zero, 2, e8, mf4, ta, ma
821- ; RV32-NEXT: vslidedown.vi v8 , v0, 2
821+ ; RV32-NEXT: vslidedown.vi v24 , v0, 2
822822; RV32-NEXT: vsetvli zero, zero, e16, mf2, ta, ma
823823; RV32-NEXT: vmv.x.s a1, v0
824824; RV32-NEXT: vsetivli zero, 16, e64, m8, ta, ma
825- ; RV32-NEXT: vcompress.vm v24 , v16, v8
825+ ; RV32-NEXT: vcompress.vm v8 , v16, v24
826826; RV32-NEXT: zext.h a1, a1
827827; RV32-NEXT: cpop a1, a1
828828; RV32-NEXT: slli a1, a1, 3
829829; RV32-NEXT: add a0, a0, a1
830- ; RV32-NEXT: vcpop.m a1, v8
830+ ; RV32-NEXT: vcpop.m a1, v24
831831; RV32-NEXT: vsetvli zero, a1, e64, m8, ta, ma
832- ; RV32-NEXT: vse64.v v24 , (a0)
832+ ; RV32-NEXT: vse64.v v8 , (a0)
833833; RV32-NEXT: ret
834834entry:
835835 tail call void @llvm.masked.compressstore.v32i64 (<32 x i64 > %data , ptr align 8 %p , <32 x i1 > %mask )
0 commit comments