@@ -227,28 +227,28 @@ def get_shapes(B, M, N, K, transpose_a, transpose_b):
227227@benchmark_suit .perf_report (
228228 benchmark_suit .Benchmark (
229229 # argument names to use as an x-axis for the plot
230- x_names = ['B' , 'M' , 'K ' , 'N ' ],
230+ x_names = ['B' , 'M' , 'N ' , 'K ' ],
231231 # different possible values for `x_name`
232232 x_vals = [[1 , 1024 * i , 1024 * i , 1024 * i ] for i in [1 , 2 , 4 , 8 ]] + #
233233 [ #
234- [1 , 1 , 5120 , 13824 ], #
235- [1 , 4 , 4096 , 12288 ], #
234+ [1 , 1 , 13824 , 5120 ], #
235+ [1 , 4 , 12288 , 4096 ], #
236236 [1 , 512 , 8192 , 8192 ], #
237237 [1 , 512 , 8192 , 32768 ], #
238238 [1 , 512 , 32768 , 8192 ], #
239- [1 , 1024 , 16384 , 8192 ], #
240- [1 , 1024 , 28672 , 8192 ], #
241- [1 , 3072 , 4096 , 3072 ], # FIXME: Remove this case when gemm_streamk_benchmark can get better performance
242- [1 , 4096 , 16384 , 8192 ], #
243- [1 , 8192 , 16384 , 1024 ], #
244- [1 , 8192 , 16384 , 4096 ], #
239+ [1 , 1024 , 8192 , 16384 ], #
240+ [1 , 1024 , 8192 , 28672 ], #
241+ [1 , 3072 , 3072 , 4096 ], # FIXME: Remove this case when gemm_streamk_benchmark can get better performance
242+ [1 , 4096 , 8192 , 16384 ], #
243+ [1 , 8192 , 1024 , 16384 ], #
244+ [1 , 8192 , 4096 , 16384 ], #
245245 [1 , 16384 , 1024 , 8192 ], #
246246 [1 , 16384 , 4096 , 8192 ], #
247247 [1 , 16384 , 8192 , 1024 ], #
248248 [1 , 16384 , 8192 , 4096 ], #
249249 [4 , 32768 , 128 , 4096 ], #
250250 [4 , 32768 , 4096 , 128 ], #
251- [32 , 4096 , 4096 , 128 ], #
251+ [32 , 4096 , 128 , 4096 ], #
252252 [4096 , 8 , 128 , 16384 ], #
253253 [4096 , 8 , 16384 , 128 ]
254254 ],
0 commit comments