@@ -46,7 +46,7 @@ define void @test(ptr %dp0, ptr addrspace(1) %dp1, ptr addrspace(3) %dp3, bfloat
4646; CHECKPTX71-LABEL: test(
4747; CHECKPTX71: {
4848; CHECKPTX71-NEXT: .reg .pred %p<5>;
49- ; CHECKPTX71-NEXT: .reg .b16 %rs<34 >;
49+ ; CHECKPTX71-NEXT: .reg .b16 %rs<22 >;
5050; CHECKPTX71-NEXT: .reg .b32 %r<4>;
5151; CHECKPTX71-NEXT: .reg .f32 %f<12>;
5252; CHECKPTX71-EMPTY:
@@ -55,49 +55,49 @@ define void @test(ptr %dp0, ptr addrspace(1) %dp1, ptr addrspace(3) %dp3, bfloat
5555; CHECKPTX71-NEXT: ld.param.u32 %r3, [test_param_2];
5656; CHECKPTX71-NEXT: ld.param.u32 %r2, [test_param_1];
5757; CHECKPTX71-NEXT: ld.param.u32 %r1, [test_param_0];
58- ; CHECKPTX71-NEXT: ld.b16 %rs30 , [%r1];
58+ ; CHECKPTX71-NEXT: ld.b16 %rs18 , [%r1];
5959; CHECKPTX71-NEXT: cvt.f32.bf16 %f1, %rs13;
6060; CHECKPTX71-NEXT: $L__BB0_1: // %atomicrmw.start14
6161; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
62- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f2, %rs30 ;
62+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f2, %rs18 ;
6363; CHECKPTX71-NEXT: add.rn.f32 %f3, %f2, %f1;
6464; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs14, %f3;
65- ; CHECKPTX71-NEXT: atom.cas.b16 %rs17 , [%r1], %rs30 , %rs14;
66- ; CHECKPTX71-NEXT: setp.ne.s16 %p1, %rs17 , %rs30 ;
67- ; CHECKPTX71-NEXT: mov.u16 %rs30 , %rs17 ;
65+ ; CHECKPTX71-NEXT: atom.cas.b16 %rs3 , [%r1], %rs18 , %rs14;
66+ ; CHECKPTX71-NEXT: setp.ne.s16 %p1, %rs3 , %rs18 ;
67+ ; CHECKPTX71-NEXT: mov.u16 %rs18 , %rs3 ;
6868; CHECKPTX71-NEXT: @%p1 bra $L__BB0_1;
6969; CHECKPTX71-NEXT: // %bb.2: // %atomicrmw.end13
70- ; CHECKPTX71-NEXT: ld.b16 %rs31 , [%r1];
70+ ; CHECKPTX71-NEXT: ld.b16 %rs19 , [%r1];
7171; CHECKPTX71-NEXT: $L__BB0_3: // %atomicrmw.start8
7272; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
73- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f4, %rs31 ;
73+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f4, %rs19 ;
7474; CHECKPTX71-NEXT: add.rn.f32 %f5, %f4, 0f3F800000;
75- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs18 , %f5;
76- ; CHECKPTX71-NEXT: atom.cas.b16 %rs21 , [%r1], %rs31 , %rs18 ;
77- ; CHECKPTX71-NEXT: setp.ne.s16 %p2, %rs21 , %rs31 ;
78- ; CHECKPTX71-NEXT: mov.u16 %rs31 , %rs21 ;
75+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs15 , %f5;
76+ ; CHECKPTX71-NEXT: atom.cas.b16 %rs6 , [%r1], %rs19 , %rs15 ;
77+ ; CHECKPTX71-NEXT: setp.ne.s16 %p2, %rs6 , %rs19 ;
78+ ; CHECKPTX71-NEXT: mov.u16 %rs19 , %rs6 ;
7979; CHECKPTX71-NEXT: @%p2 bra $L__BB0_3;
8080; CHECKPTX71-NEXT: // %bb.4: // %atomicrmw.end7
81- ; CHECKPTX71-NEXT: ld.global.b16 %rs32 , [%r2];
81+ ; CHECKPTX71-NEXT: ld.global.b16 %rs20 , [%r2];
8282; CHECKPTX71-NEXT: $L__BB0_5: // %atomicrmw.start2
8383; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
84- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f7, %rs32 ;
84+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f7, %rs20 ;
8585; CHECKPTX71-NEXT: add.rn.f32 %f8, %f7, %f1;
86- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs22 , %f8;
87- ; CHECKPTX71-NEXT: atom.global.cas.b16 %rs25 , [%r2], %rs32 , %rs22 ;
88- ; CHECKPTX71-NEXT: setp.ne.s16 %p3, %rs25 , %rs32 ;
89- ; CHECKPTX71-NEXT: mov.u16 %rs32 , %rs25 ;
86+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs16 , %f8;
87+ ; CHECKPTX71-NEXT: atom.global.cas.b16 %rs9 , [%r2], %rs20 , %rs16 ;
88+ ; CHECKPTX71-NEXT: setp.ne.s16 %p3, %rs9 , %rs20 ;
89+ ; CHECKPTX71-NEXT: mov.u16 %rs20 , %rs9 ;
9090; CHECKPTX71-NEXT: @%p3 bra $L__BB0_5;
9191; CHECKPTX71-NEXT: // %bb.6: // %atomicrmw.end1
92- ; CHECKPTX71-NEXT: ld.shared.b16 %rs33 , [%r3];
92+ ; CHECKPTX71-NEXT: ld.shared.b16 %rs21 , [%r3];
9393; CHECKPTX71-NEXT: $L__BB0_7: // %atomicrmw.start
9494; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
95- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f10, %rs33 ;
95+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f10, %rs21 ;
9696; CHECKPTX71-NEXT: add.rn.f32 %f11, %f10, %f1;
97- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs26 , %f11;
98- ; CHECKPTX71-NEXT: atom.shared.cas.b16 %rs29 , [%r3], %rs33 , %rs26 ;
99- ; CHECKPTX71-NEXT: setp.ne.s16 %p4, %rs29 , %rs33 ;
100- ; CHECKPTX71-NEXT: mov.u16 %rs33 , %rs29 ;
97+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs17 , %f11;
98+ ; CHECKPTX71-NEXT: atom.shared.cas.b16 %rs12 , [%r3], %rs21 , %rs17 ;
99+ ; CHECKPTX71-NEXT: setp.ne.s16 %p4, %rs12 , %rs21 ;
100+ ; CHECKPTX71-NEXT: mov.u16 %rs21 , %rs12 ;
101101; CHECKPTX71-NEXT: @%p4 bra $L__BB0_7;
102102; CHECKPTX71-NEXT: // %bb.8: // %atomicrmw.end
103103; CHECKPTX71-NEXT: ret;
0 commit comments