@@ -2149,11 +2149,11 @@ define amdgpu_kernel void @frem_v2f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2149
2149
; CI-NEXT: s_cbranch_vccz .LBB11_2
2150
2150
; CI-NEXT: ; %bb.1: ; %frem.else
2151
2151
; CI-NEXT: s_and_b32 s6, s2, 0x80000000
2152
- ; CI-NEXT: v_mov_b32_e32 v1 , s4
2153
- ; CI-NEXT: v_mov_b32_e32 v0, s2
2154
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s2|, |v1|
2155
- ; CI-NEXT: v_mov_b32_e32 v1, s6
2156
- ; CI-NEXT: v_cndmask_b32_e32 v0, v0, v1 , vcc
2152
+ ; CI-NEXT: v_mov_b32_e32 v0 , s4
2153
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s2|, |v0|
2154
+ ; CI-NEXT: v_mov_b32_e32 v0, s6
2155
+ ; CI-NEXT: v_mov_b32_e32 v1, s2
2156
+ ; CI-NEXT: v_cndmask_b32_e32 v0, v1, v0 , vcc
2157
2157
; CI-NEXT: s_mov_b32 s6, 0
2158
2158
; CI-NEXT: .LBB11_2: ; %Flow53
2159
2159
; CI-NEXT: s_xor_b32 s6, s6, 1
@@ -2224,11 +2224,11 @@ define amdgpu_kernel void @frem_v2f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2224
2224
; CI-NEXT: s_cbranch_vccz .LBB11_10
2225
2225
; CI-NEXT: ; %bb.9: ; %frem.else16
2226
2226
; CI-NEXT: s_and_b32 s6, s3, 0x80000000
2227
- ; CI-NEXT: v_mov_b32_e32 v2 , s5
2228
- ; CI-NEXT: v_mov_b32_e32 v1, s3
2229
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s3|, |v2|
2230
- ; CI-NEXT: v_mov_b32_e32 v2, s6
2231
- ; CI-NEXT: v_cndmask_b32_e32 v1, v1, v2 , vcc
2227
+ ; CI-NEXT: v_mov_b32_e32 v1 , s5
2228
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s3|, |v1|
2229
+ ; CI-NEXT: v_mov_b32_e32 v1, s6
2230
+ ; CI-NEXT: v_mov_b32_e32 v2, s3
2231
+ ; CI-NEXT: v_cndmask_b32_e32 v1, v2, v1 , vcc
2232
2232
; CI-NEXT: s_mov_b32 s6, 0
2233
2233
; CI-NEXT: .LBB11_10: ; %Flow49
2234
2234
; CI-NEXT: s_xor_b32 s6, s6, 1
@@ -2322,11 +2322,11 @@ define amdgpu_kernel void @frem_v2f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2322
2322
; VI-NEXT: s_cbranch_vccz .LBB11_2
2323
2323
; VI-NEXT: ; %bb.1: ; %frem.else
2324
2324
; VI-NEXT: s_and_b32 s6, s2, 0x80000000
2325
- ; VI-NEXT: v_mov_b32_e32 v1 , s4
2326
- ; VI-NEXT: v_mov_b32_e32 v0, s2
2327
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s2|, |v1|
2328
- ; VI-NEXT: v_mov_b32_e32 v1, s6
2329
- ; VI-NEXT: v_cndmask_b32_e32 v0, v0, v1 , vcc
2325
+ ; VI-NEXT: v_mov_b32_e32 v0 , s4
2326
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s2|, |v0|
2327
+ ; VI-NEXT: v_mov_b32_e32 v0, s6
2328
+ ; VI-NEXT: v_mov_b32_e32 v1, s2
2329
+ ; VI-NEXT: v_cndmask_b32_e32 v0, v1, v0 , vcc
2330
2330
; VI-NEXT: s_mov_b32 s6, 0
2331
2331
; VI-NEXT: .LBB11_2: ; %Flow53
2332
2332
; VI-NEXT: s_xor_b32 s6, s6, 1
@@ -2397,11 +2397,11 @@ define amdgpu_kernel void @frem_v2f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2397
2397
; VI-NEXT: s_cbranch_vccz .LBB11_10
2398
2398
; VI-NEXT: ; %bb.9: ; %frem.else16
2399
2399
; VI-NEXT: s_and_b32 s6, s3, 0x80000000
2400
- ; VI-NEXT: v_mov_b32_e32 v2 , s5
2401
- ; VI-NEXT: v_mov_b32_e32 v1, s3
2402
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s3|, |v2|
2403
- ; VI-NEXT: v_mov_b32_e32 v2, s6
2404
- ; VI-NEXT: v_cndmask_b32_e32 v1, v1, v2 , vcc
2400
+ ; VI-NEXT: v_mov_b32_e32 v1 , s5
2401
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s3|, |v1|
2402
+ ; VI-NEXT: v_mov_b32_e32 v1, s6
2403
+ ; VI-NEXT: v_mov_b32_e32 v2, s3
2404
+ ; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1 , vcc
2405
2405
; VI-NEXT: s_mov_b32 s6, 0
2406
2406
; VI-NEXT: .LBB11_10: ; %Flow49
2407
2407
; VI-NEXT: s_xor_b32 s6, s6, 1
@@ -2503,11 +2503,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2503
2503
; CI-NEXT: s_cbranch_vccz .LBB12_2
2504
2504
; CI-NEXT: ; %bb.1: ; %frem.else
2505
2505
; CI-NEXT: s_and_b32 s2, s4, 0x80000000
2506
- ; CI-NEXT: v_mov_b32_e32 v1 , s8
2507
- ; CI-NEXT: v_mov_b32_e32 v0, s4
2508
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s4|, |v1|
2509
- ; CI-NEXT: v_mov_b32_e32 v1, s2
2510
- ; CI-NEXT: v_cndmask_b32_e32 v0, v0, v1 , vcc
2506
+ ; CI-NEXT: v_mov_b32_e32 v0 , s8
2507
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s4|, |v0|
2508
+ ; CI-NEXT: v_mov_b32_e32 v0, s2
2509
+ ; CI-NEXT: v_mov_b32_e32 v1, s4
2510
+ ; CI-NEXT: v_cndmask_b32_e32 v0, v1, v0 , vcc
2511
2511
; CI-NEXT: s_mov_b32 s2, 0
2512
2512
; CI-NEXT: .LBB12_2: ; %Flow127
2513
2513
; CI-NEXT: s_xor_b32 s2, s2, 1
@@ -2578,11 +2578,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2578
2578
; CI-NEXT: s_cbranch_vccz .LBB12_10
2579
2579
; CI-NEXT: ; %bb.9: ; %frem.else16
2580
2580
; CI-NEXT: s_and_b32 s2, s5, 0x80000000
2581
- ; CI-NEXT: v_mov_b32_e32 v2 , s9
2582
- ; CI-NEXT: v_mov_b32_e32 v1, s5
2583
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s5|, |v2|
2584
- ; CI-NEXT: v_mov_b32_e32 v2, s2
2585
- ; CI-NEXT: v_cndmask_b32_e32 v1, v1, v2 , vcc
2581
+ ; CI-NEXT: v_mov_b32_e32 v1 , s9
2582
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s5|, |v1|
2583
+ ; CI-NEXT: v_mov_b32_e32 v1, s2
2584
+ ; CI-NEXT: v_mov_b32_e32 v2, s5
2585
+ ; CI-NEXT: v_cndmask_b32_e32 v1, v2, v1 , vcc
2586
2586
; CI-NEXT: s_mov_b32 s2, 0
2587
2587
; CI-NEXT: .LBB12_10: ; %Flow123
2588
2588
; CI-NEXT: s_xor_b32 s2, s2, 1
@@ -2653,11 +2653,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2653
2653
; CI-NEXT: s_cbranch_vccz .LBB12_18
2654
2654
; CI-NEXT: ; %bb.17: ; %frem.else47
2655
2655
; CI-NEXT: s_and_b32 s2, s6, 0x80000000
2656
- ; CI-NEXT: v_mov_b32_e32 v3 , s10
2657
- ; CI-NEXT: v_mov_b32_e32 v2, s6
2658
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s6|, |v3|
2659
- ; CI-NEXT: v_mov_b32_e32 v3, s2
2660
- ; CI-NEXT: v_cndmask_b32_e32 v2, v2, v3 , vcc
2656
+ ; CI-NEXT: v_mov_b32_e32 v2 , s10
2657
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s6|, |v2|
2658
+ ; CI-NEXT: v_mov_b32_e32 v2, s2
2659
+ ; CI-NEXT: v_mov_b32_e32 v3, s6
2660
+ ; CI-NEXT: v_cndmask_b32_e32 v2, v3, v2 , vcc
2661
2661
; CI-NEXT: s_mov_b32 s2, 0
2662
2662
; CI-NEXT: .LBB12_18: ; %Flow119
2663
2663
; CI-NEXT: s_xor_b32 s2, s2, 1
@@ -2728,11 +2728,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2728
2728
; CI-NEXT: s_cbranch_vccz .LBB12_26
2729
2729
; CI-NEXT: ; %bb.25: ; %frem.else78
2730
2730
; CI-NEXT: s_and_b32 s2, s7, 0x80000000
2731
- ; CI-NEXT: v_mov_b32_e32 v4 , s11
2732
- ; CI-NEXT: v_mov_b32_e32 v3, s7
2733
- ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s7|, |v4|
2734
- ; CI-NEXT: v_mov_b32_e32 v4, s2
2735
- ; CI-NEXT: v_cndmask_b32_e32 v3, v3, v4 , vcc
2731
+ ; CI-NEXT: v_mov_b32_e32 v3 , s11
2732
+ ; CI-NEXT: v_cmp_eq_f32_e64 vcc, |s7|, |v3|
2733
+ ; CI-NEXT: v_mov_b32_e32 v3, s2
2734
+ ; CI-NEXT: v_mov_b32_e32 v4, s7
2735
+ ; CI-NEXT: v_cndmask_b32_e32 v3, v4, v3 , vcc
2736
2736
; CI-NEXT: s_mov_b32 s2, 0
2737
2737
; CI-NEXT: .LBB12_26: ; %Flow115
2738
2738
; CI-NEXT: s_xor_b32 s2, s2, 1
@@ -2834,11 +2834,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2834
2834
; VI-NEXT: s_cbranch_vccz .LBB12_2
2835
2835
; VI-NEXT: ; %bb.1: ; %frem.else
2836
2836
; VI-NEXT: s_and_b32 s2, s4, 0x80000000
2837
- ; VI-NEXT: v_mov_b32_e32 v1 , s8
2838
- ; VI-NEXT: v_mov_b32_e32 v0, s4
2839
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s4|, |v1|
2840
- ; VI-NEXT: v_mov_b32_e32 v1, s2
2841
- ; VI-NEXT: v_cndmask_b32_e32 v0, v0, v1 , vcc
2837
+ ; VI-NEXT: v_mov_b32_e32 v0 , s8
2838
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s4|, |v0|
2839
+ ; VI-NEXT: v_mov_b32_e32 v0, s2
2840
+ ; VI-NEXT: v_mov_b32_e32 v1, s4
2841
+ ; VI-NEXT: v_cndmask_b32_e32 v0, v1, v0 , vcc
2842
2842
; VI-NEXT: s_mov_b32 s2, 0
2843
2843
; VI-NEXT: .LBB12_2: ; %Flow127
2844
2844
; VI-NEXT: s_xor_b32 s2, s2, 1
@@ -2909,11 +2909,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2909
2909
; VI-NEXT: s_cbranch_vccz .LBB12_10
2910
2910
; VI-NEXT: ; %bb.9: ; %frem.else16
2911
2911
; VI-NEXT: s_and_b32 s2, s5, 0x80000000
2912
- ; VI-NEXT: v_mov_b32_e32 v2 , s9
2913
- ; VI-NEXT: v_mov_b32_e32 v1, s5
2914
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s5|, |v2|
2915
- ; VI-NEXT: v_mov_b32_e32 v2, s2
2916
- ; VI-NEXT: v_cndmask_b32_e32 v1, v1, v2 , vcc
2912
+ ; VI-NEXT: v_mov_b32_e32 v1 , s9
2913
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s5|, |v1|
2914
+ ; VI-NEXT: v_mov_b32_e32 v1, s2
2915
+ ; VI-NEXT: v_mov_b32_e32 v2, s5
2916
+ ; VI-NEXT: v_cndmask_b32_e32 v1, v2, v1 , vcc
2917
2917
; VI-NEXT: s_mov_b32 s2, 0
2918
2918
; VI-NEXT: .LBB12_10: ; %Flow123
2919
2919
; VI-NEXT: s_xor_b32 s2, s2, 1
@@ -2984,11 +2984,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
2984
2984
; VI-NEXT: s_cbranch_vccz .LBB12_18
2985
2985
; VI-NEXT: ; %bb.17: ; %frem.else47
2986
2986
; VI-NEXT: s_and_b32 s2, s6, 0x80000000
2987
- ; VI-NEXT: v_mov_b32_e32 v3 , s10
2988
- ; VI-NEXT: v_mov_b32_e32 v2, s6
2989
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s6|, |v3|
2990
- ; VI-NEXT: v_mov_b32_e32 v3, s2
2991
- ; VI-NEXT: v_cndmask_b32_e32 v2, v2, v3 , vcc
2987
+ ; VI-NEXT: v_mov_b32_e32 v2 , s10
2988
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s6|, |v2|
2989
+ ; VI-NEXT: v_mov_b32_e32 v2, s2
2990
+ ; VI-NEXT: v_mov_b32_e32 v3, s6
2991
+ ; VI-NEXT: v_cndmask_b32_e32 v2, v3, v2 , vcc
2992
2992
; VI-NEXT: s_mov_b32 s2, 0
2993
2993
; VI-NEXT: .LBB12_18: ; %Flow119
2994
2994
; VI-NEXT: s_xor_b32 s2, s2, 1
@@ -3059,11 +3059,11 @@ define amdgpu_kernel void @frem_v4f32(ptr addrspace(1) %out, ptr addrspace(1) %i
3059
3059
; VI-NEXT: s_cbranch_vccz .LBB12_26
3060
3060
; VI-NEXT: ; %bb.25: ; %frem.else78
3061
3061
; VI-NEXT: s_and_b32 s2, s7, 0x80000000
3062
- ; VI-NEXT: v_mov_b32_e32 v4 , s11
3063
- ; VI-NEXT: v_mov_b32_e32 v3, s7
3064
- ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s7|, |v4|
3065
- ; VI-NEXT: v_mov_b32_e32 v4, s2
3066
- ; VI-NEXT: v_cndmask_b32_e32 v3, v3, v4 , vcc
3062
+ ; VI-NEXT: v_mov_b32_e32 v3 , s11
3063
+ ; VI-NEXT: v_cmp_eq_f32_e64 vcc, |s7|, |v3|
3064
+ ; VI-NEXT: v_mov_b32_e32 v3, s2
3065
+ ; VI-NEXT: v_mov_b32_e32 v4, s7
3066
+ ; VI-NEXT: v_cndmask_b32_e32 v3, v4, v3 , vcc
3067
3067
; VI-NEXT: s_mov_b32 s2, 0
3068
3068
; VI-NEXT: .LBB12_26: ; %Flow115
3069
3069
; VI-NEXT: s_xor_b32 s2, s2, 1
0 commit comments