@@ -255,51 +255,6 @@ gpu.module @test {
255255 gpu.return
256256 }
257257
258- //-----
259-
260- // CHECK-LABEL: test_prefetch_load_store_update
261- // CHECK-SAME: [[arg0:%.+]]: ui64
262- // CHECK-COUNT-2: xegpu.create_tdesc [[arg0]], {{.*}} : ui64, vector<16xindex> -> !xegpu.tensor_desc<16xf32, #xegpu.scatter_tdesc_attr<>>
263- // CHECK-COUNT-2: xegpu.prefetch {{.*}} : !xegpu.tensor_desc<16xf32, #xegpu.scatter_tdesc_attr<>>
264- // CHECK-COUNT-2: xegpu.update_offset {{.*}} : !xegpu.tensor_desc<16xf32, #xegpu.scatter_tdesc_attr<>>, vector<16xindex>
265- // CHECK-COUNT-2: xegpu.load {{.*}} : !xegpu.tensor_desc<16xf32, #xegpu.scatter_tdesc_attr<>>, vector<16xi1> -> vector<16xf32>
266- // CHECK-COUNT-2: xegpu.store {{.*}} : vector<16xf32>, !xegpu.tensor_desc<16xf32, #xegpu.scatter_tdesc_attr<>>, vector<16xi1>
267-
268- gpu.func @test_prefetch_load_store_update (%src: ui64 ) {
269-
270- %cst = arith.constant dense <[
271- 0 , 8 , 16 , 24 , 32 , 40 , 48 , 56 ,
272- 64 , 72 , 80 , 88 , 96 , 104 , 112 , 120 ,
273- 128 , 136 , 144 , 152 , 160 , 168 , 176 , 184 ,
274- 192 , 200 , 208 , 216 , 224 , 232 , 240 , 248
275- ]> : vector <32 xindex >
276-
277- %tdesc = xegpu.create_tdesc %src , %cst : ui64 , vector <32 xindex > -> !xegpu.tensor_desc <32 xf32 , #xegpu.scatter_tdesc_attr <>, #xegpu.layout <inst_data = [16 ]>>
278- xegpu.prefetch %tdesc: !xegpu.tensor_desc <32 xf32 , #xegpu.scatter_tdesc_attr <>, #xegpu.layout <inst_data = [16 ]>>
279-
280- %delta = arith.constant dense <[
281- 32 , 32 , 32 , 32 , 32 , 32 , 32 , 32 ,
282- 32 , 32 , 32 , 32 , 32 , 32 , 32 , 64 ,
283- 128 , 128 , 128 , 128 , 128 , 128 , 128 , 128 ,
284- 128 , 128 , 128 , 128 , 128 , 128 , 128 , 256
285- ]> : vector <32 xindex >
286- %new_tdesc = xegpu.update_offset %tdesc , %delta
287- : !xegpu.tensor_desc <32 xf32 , #xegpu.scatter_tdesc_attr <>, #xegpu.layout <inst_data = [16 ]>>, vector <32 xindex >
288-
289- %c17 = arith.constant 17 : index
290- %mask = vector.create_mask %c17: vector <32 xi1 >
291-
292- %ld_vec = xegpu.load %new_tdesc , %mask: !xegpu.tensor_desc <32 xf32 , #xegpu.scatter_tdesc_attr <>, #xegpu.layout <inst_data = [16 ]>>, vector <32 xi1 > -> vector <32 xf32 >
293-
294- %st_vec = arith.addf %ld_vec , %ld_vec : vector <32 xf32 >
295- xegpu.store %st_vec , %tdesc , %mask:
296- vector <32 xf32 >,
297- !xegpu.tensor_desc <32 xf32 , #xegpu.scatter_tdesc_attr <>, #xegpu.layout <inst_data = [16 ]>>,
298- vector <32 xi1 >
299-
300- gpu.return
301- }
302-
303258//-----
304259 // CHECK-LABEL: test_create_tdesc_step_chunk
305260 // CHECK-SAME: [[arg0:%.+]]: ui64
0 commit comments