@@ -357,14 +357,14 @@ define i64 @test_v8i64(<8 x i64> %a0) {
357357; AVX512BW-LABEL: test_v8i64:
358358; AVX512BW: # %bb.0:
359359; AVX512BW-NEXT: vextracti64x4 $1, %zmm0, %ymm1
360- ; AVX512BW-NEXT: vpsrlq $32, %zmm0 , %zmm2
361- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
362- ; AVX512BW-NEXT: vpsrlq $32, %zmm1 , %zmm3
363- ; AVX512BW-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
364- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
365- ; AVX512BW-NEXT: vpsllq $32, %zmm2 , %zmm2
366- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
367- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
360+ ; AVX512BW-NEXT: vpsrlq $32, %ymm0 , %ymm2
361+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
362+ ; AVX512BW-NEXT: vpsrlq $32, %ymm1 , %ymm3
363+ ; AVX512BW-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
364+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
365+ ; AVX512BW-NEXT: vpsllq $32, %ymm2 , %ymm2
366+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
367+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
368368; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
369369; AVX512BW-NEXT: vpsrlq $32, %xmm0, %xmm2
370370; AVX512BW-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -390,14 +390,14 @@ define i64 @test_v8i64(<8 x i64> %a0) {
390390; AVX512BWVL-LABEL: test_v8i64:
391391; AVX512BWVL: # %bb.0:
392392; AVX512BWVL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
393- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm0 , %zmm2
394- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
395- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm1 , %zmm3
396- ; AVX512BWVL-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
397- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
398- ; AVX512BWVL-NEXT: vpsllq $32, %zmm2 , %zmm2
399- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
400- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
393+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm0 , %ymm2
394+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
395+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm1 , %ymm3
396+ ; AVX512BWVL-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
397+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
398+ ; AVX512BWVL-NEXT: vpsllq $32, %ymm2 , %ymm2
399+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
400+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
401401; AVX512BWVL-NEXT: vextracti128 $1, %ymm0, %xmm1
402402; AVX512BWVL-NEXT: vpsrlq $32, %xmm0, %xmm2
403403; AVX512BWVL-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -667,14 +667,14 @@ define i64 @test_v16i64(<16 x i64> %a0) {
667667; AVX512BW-NEXT: vpmuludq %zmm1, %zmm0, %zmm0
668668; AVX512BW-NEXT: vpaddq %zmm2, %zmm0, %zmm0
669669; AVX512BW-NEXT: vextracti64x4 $1, %zmm0, %ymm1
670- ; AVX512BW-NEXT: vpsrlq $32, %zmm0 , %zmm2
671- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
672- ; AVX512BW-NEXT: vpsrlq $32, %zmm1 , %zmm3
673- ; AVX512BW-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
674- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
675- ; AVX512BW-NEXT: vpsllq $32, %zmm2 , %zmm2
676- ; AVX512BW-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
677- ; AVX512BW-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
670+ ; AVX512BW-NEXT: vpsrlq $32, %ymm0 , %ymm2
671+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
672+ ; AVX512BW-NEXT: vpsrlq $32, %ymm1 , %ymm3
673+ ; AVX512BW-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
674+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
675+ ; AVX512BW-NEXT: vpsllq $32, %ymm2 , %ymm2
676+ ; AVX512BW-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
677+ ; AVX512BW-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
678678; AVX512BW-NEXT: vextracti128 $1, %ymm0, %xmm1
679679; AVX512BW-NEXT: vpsrlq $32, %xmm0, %xmm2
680680; AVX512BW-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
@@ -708,14 +708,14 @@ define i64 @test_v16i64(<16 x i64> %a0) {
708708; AVX512BWVL-NEXT: vpmuludq %zmm1, %zmm0, %zmm0
709709; AVX512BWVL-NEXT: vpaddq %zmm2, %zmm0, %zmm0
710710; AVX512BWVL-NEXT: vextracti64x4 $1, %zmm0, %ymm1
711- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm0 , %zmm2
712- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm2 , %zmm2
713- ; AVX512BWVL-NEXT: vpsrlq $32, %zmm1 , %zmm3
714- ; AVX512BWVL-NEXT: vpmuludq %zmm3 , %zmm0 , %zmm3
715- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm3 , %zmm2
716- ; AVX512BWVL-NEXT: vpsllq $32, %zmm2 , %zmm2
717- ; AVX512BWVL-NEXT: vpmuludq %zmm1 , %zmm0 , %zmm0
718- ; AVX512BWVL-NEXT: vpaddq %zmm2 , %zmm0 , %zmm0
711+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm0 , %ymm2
712+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm2 , %ymm2
713+ ; AVX512BWVL-NEXT: vpsrlq $32, %ymm1 , %ymm3
714+ ; AVX512BWVL-NEXT: vpmuludq %ymm3 , %ymm0 , %ymm3
715+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm3 , %ymm2
716+ ; AVX512BWVL-NEXT: vpsllq $32, %ymm2 , %ymm2
717+ ; AVX512BWVL-NEXT: vpmuludq %ymm1 , %ymm0 , %ymm0
718+ ; AVX512BWVL-NEXT: vpaddq %ymm2 , %ymm0 , %ymm0
719719; AVX512BWVL-NEXT: vextracti128 $1, %ymm0, %xmm1
720720; AVX512BWVL-NEXT: vpsrlq $32, %xmm0, %xmm2
721721; AVX512BWVL-NEXT: vpmuludq %xmm1, %xmm2, %xmm2
0 commit comments