@@ -6,7 +6,7 @@ func.func @test_permlane16_i32(%arg0 : i32) -> i32 {
66// CHECK: %[[PERM:.*]] = rocdl.permlane16.swap %[[ARG0]], %[[ARG0]], false, false : (i32, i32) -> <(i32, i32)>
77// CHECK: %[[RES:.*]] = llvm.extractvalue %[[PERM]][0] : !llvm.struct<(i32, i32)>
88// CHECK: return %[[RES]] : i32
9- %0 = amdgpu.permlane %arg0 swap_16 : i32
9+ %0 = amdgpu.permlane_swap %arg0 16 : i32
1010 return %0 : i32
1111}
1212
@@ -16,7 +16,7 @@ func.func @test_permlane16_i32_optional_attr(%arg0 : i32) -> i32 {
1616// CHECK: %[[PERM:.*]] = rocdl.permlane16.swap %[[ARG0]], %[[ARG0]], true, true : (i32, i32) -> <(i32, i32)>
1717// CHECK: %[[RES:.*]] = llvm.extractvalue %[[PERM]][0] : !llvm.struct<(i32, i32)>
1818// CHECK: return %[[RES]] : i32
19- %0 = amdgpu.permlane %arg0 swap_16 { fetch_inactive = true , bound_ctrl = true } : i32
19+ %0 = amdgpu.permlane_swap %arg0 16 { fetch_inactive = true , bound_ctrl = true } : i32
2020 return %0 : i32
2121}
2222
@@ -26,7 +26,7 @@ func.func @test_permlane32_i32(%arg0 : i32) -> i32 {
2626// CHECK: %[[PERM:.*]] = rocdl.permlane32.swap %[[ARG0]], %[[ARG0]], false, false : (i32, i32) -> <(i32, i32)>
2727// CHECK: %[[RES:.*]] = llvm.extractvalue %[[PERM]][0] : !llvm.struct<(i32, i32)>
2828// CHECK: return %[[RES]] : i32
29- %0 = amdgpu.permlane %arg0 swap_32 : i32
29+ %0 = amdgpu.permlane_swap %arg0 32 : i32
3030 return %0 : i32
3131}
3232
@@ -38,7 +38,7 @@ func.func @test_permlane16_f32(%arg0 : f32) -> f32 {
3838// CHECK: %[[RES:.*]] = llvm.extractvalue %[[PERM]][0] : !llvm.struct<(i32, i32)>
3939// CHECK: %[[RES_CAST:.*]] = llvm.bitcast %[[RES]] : i32 to f32
4040// CHECK: return %[[RES_CAST]] : f32
41- %0 = amdgpu.permlane %arg0 swap_16 : f32
41+ %0 = amdgpu.permlane_swap %arg0 16 : f32
4242 return %0 : f32
4343}
4444
@@ -50,7 +50,7 @@ func.func @test_permlane32_f32(%arg0 : f32) -> f32 {
5050// CHECK: %[[RES:.*]] = llvm.extractvalue %[[PERM]][0] : !llvm.struct<(i32, i32)>
5151// CHECK: %[[RES_CAST:.*]] = llvm.bitcast %[[RES]] : i32 to f32
5252// CHECK: return %[[RES_CAST]] : f32
53- %0 = amdgpu.permlane %arg0 swap_32 : f32
53+ %0 = amdgpu.permlane_swap %arg0 32 : f32
5454 return %0 : f32
5555}
5656
@@ -64,7 +64,7 @@ func.func @test_permlane16_f16(%arg0 : f16) -> f16 {
6464// CHECK: %[[TRUNC:.*]] = llvm.trunc %[[RES]] : i32 to i16
6565// CHECK: %[[RES_CAST:.*]] = llvm.bitcast %[[TRUNC]] : i16 to f16
6666// CHECK: return %[[RES_CAST]] : f16
67- %0 = amdgpu.permlane %arg0 swap_16 : f16
67+ %0 = amdgpu.permlane_swap %arg0 16 : f16
6868 return %0 : f16
6969}
7070
@@ -78,7 +78,7 @@ func.func @test_permlane32_f16(%arg0 : f16) -> f16 {
7878// CHECK: %[[TRUNC:.*]] = llvm.trunc %[[RES]] : i32 to i16
7979// CHECK: %[[RES_CAST:.*]] = llvm.bitcast %[[TRUNC]] : i16 to f16
8080// CHECK: return %[[RES_CAST]] : f16
81- %0 = amdgpu.permlane %arg0 swap_32 : f16
81+ %0 = amdgpu.permlane_swap %arg0 32 : f16
8282 return %0 : f16
8383}
8484
@@ -97,7 +97,7 @@ func.func @test_permlane16_2xi32(%arg0 : vector<2xi32>) -> vector<2xi32> {
9797// CHECK: %[[VEC_INSERT0:.*]] = llvm.insertelement %[[PERM0]], %[[POISON]][%[[C0]] : i32] : vector<2xi32>
9898// CHECK: %[[VEC_INSERT1:.*]] = llvm.insertelement %[[PERM1]], %[[VEC_INSERT0]][%[[C1]] : i32] : vector<2xi32>
9999// CHECK: return %[[VEC_INSERT1]] : vector<2xi32>
100- %0 = amdgpu.permlane %arg0 swap_16 : vector <2 xi32 >
100+ %0 = amdgpu.permlane_swap %arg0 16 : vector <2 xi32 >
101101 return %0 : vector <2 xi32 >
102102}
103103
@@ -116,7 +116,7 @@ func.func @test_permlane32_2xi32(%arg0 : vector<2xi32>) -> vector<2xi32> {
116116// CHECK: %[[VEC_INSERT0:.*]] = llvm.insertelement %[[PERM0]], %[[POISON]][%[[C0]] : i32] : vector<2xi32>
117117// CHECK: %[[VEC_INSERT1:.*]] = llvm.insertelement %[[PERM1]], %[[VEC_INSERT0]][%[[C1]] : i32] : vector<2xi32>
118118// CHECK: return %[[VEC_INSERT1]] : vector<2xi32>
119- %0 = amdgpu.permlane %arg0 swap_32 : vector <2 xi32 >
119+ %0 = amdgpu.permlane_swap %arg0 32 : vector <2 xi32 >
120120 return %0 : vector <2 xi32 >
121121}
122122
@@ -137,7 +137,7 @@ func.func @test_permlane16_4xf16(%arg0 : vector<4xf16>) -> vector<4xf16> {
137137// CHECK: %[[VEC_INSERT1:.*]] = llvm.insertelement %[[PERM1]], %[[VEC_INSERT0]][%[[C1]] : i32] : vector<2xi32>
138138// CHECK: %[[CAST2:.*]] = llvm.bitcast %[[VEC_INSERT1]] : vector<2xi32> to vector<4xf16>
139139// CHECK: return %[[CAST2]] : vector<4xf16>
140- %0 = amdgpu.permlane %arg0 swap_16 : vector <4 xf16 >
140+ %0 = amdgpu.permlane_swap %arg0 16 : vector <4 xf16 >
141141 return %0 : vector <4 xf16 >
142142}
143143
@@ -158,6 +158,6 @@ func.func @test_permlane32_4xf16(%arg0 : vector<4xf16>) -> vector<4xf16> {
158158// CHECK: %[[VEC_INSERT1:.*]] = llvm.insertelement %[[PERM1]], %[[VEC_INSERT0]][%[[C1]] : i32] : vector<2xi32>
159159// CHECK: %[[CAST2:.*]] = llvm.bitcast %[[VEC_INSERT1]] : vector<2xi32> to vector<4xf16>
160160// CHECK: return %[[CAST2]] : vector<4xf16>
161- %0 = amdgpu.permlane %arg0 swap_32 : vector <4 xf16 >
161+ %0 = amdgpu.permlane_swap %arg0 32 : vector <4 xf16 >
162162 return %0 : vector <4 xf16 >
163163}
0 commit comments