Skip to content

Commit 9f4f9ac

Browse files
committed
ocl: added tuned parameters and code cleanup
- Added tuned params for Battlemage client GPU. - BMG has DP-HW (although SP:DP rate is >2).
1 parent 8d2701a commit 9f4f9ac

File tree

2 files changed

+105
-6
lines changed

2 files changed

+105
-6
lines changed

src/acc/opencl/acc_opencl_mem.c

Lines changed: 5 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -488,12 +488,11 @@ int c_dbcsr_acc_dev_mem_allocate(void** dev_mem, size_t nbytes) {
488488
# endif
489489
{
490490
# if defined(ACC_OPENCL_XHINTS)
491-
const int devuid = devinfo->uid;
492-
const int try_flag =
493-
((0 != (8 & c_dbcsr_acc_opencl_config.xhints) && 0 != devinfo->intel && 0 == devinfo->unified &&
494-
((0x4905 == devuid || 0x020a == devuid || (0x0bd0 <= devuid && 0x0bdb >= devuid)) || NULL != (ACC_OPENCL_XHINTS)))
495-
? (1u << 22)
496-
: 0);
491+
const int devuid = devinfo->uid, devuids = (0x4905 == devuid || 0x020a == devuid || (0x0bd0 <= devuid && 0x0bdb >= devuid));
492+
const int try_flag = ((0 != (8 & c_dbcsr_acc_opencl_config.xhints) && 0 != devinfo->intel && 0 == devinfo->unified &&
493+
(devuids || NULL != (ACC_OPENCL_XHINTS)))
494+
? (1u << 22)
495+
: 0);
497496
memory = clCreateBuffer(devinfo->context, (cl_mem_flags)(CL_MEM_READ_WRITE | try_flag), nbytes, NULL /*host_ptr*/, &result);
498497
if (0 != try_flag && EXIT_SUCCESS != result) /* retry without try_flag */
499498
# endif
Lines changed: 100 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,100 @@
1+
DEVICE;TYPEID;M;N;K;S;GFLOPS;BS;BM;BN;BK;WS;WG;LU;NZ;AL;TB;TC;AP;AA;AB;AC
2+
Intel(R) Graphics [0xe223];3;5;5;5;30000;0;24;5;1;1;5;1;0;0;0;0;1;0;0;0;0;0
3+
Intel(R) Graphics [0xe223];3;5;5;13;30000;0;30;5;1;1;1;1;-1;0;0;0;1;0;0;0;0;0
4+
Intel(R) Graphics [0xe223];3;5;5;16;30000;0;15;5;1;1;5;1;-2;0;0;0;1;0;2;2;0;0
5+
Intel(R) Graphics [0xe223];3;5;5;24;30000;0;17;5;1;1;1;0;1;0;0;0;1;0;2;2;0;0
6+
Intel(R) Graphics [0xe223];3;5;5;26;30000;0;15;5;1;1;1;0;-1;0;0;0;1;0;2;0;0;0
7+
Intel(R) Graphics [0xe223];3;5;13;5;30000;0;30;5;1;1;1;-1;0;0;0;0;1;0;0;2;0;0
8+
Intel(R) Graphics [0xe223];3;5;13;13;30000;0;40;5;1;1;13;-1;-2;0;0;0;1;0;0;0;0;1
9+
Intel(R) Graphics [0xe223];3;5;13;16;30000;0;30;5;1;1;13;-2;-2;0;0;0;1;0;0;0;0;0
10+
Intel(R) Graphics [0xe223];3;5;13;24;30000;0;31;5;1;1;13;0;1;0;0;0;1;0;2;2;0;1
11+
Intel(R) Graphics [0xe223];3;5;13;26;30000;0;24;5;1;4;1;-1;-1;0;0;0;1;0;1;0;0;0
12+
Intel(R) Graphics [0xe223];3;5;16;5;30000;0;41;5;1;1;1;0;-1;0;0;0;1;0;0;2;0;0
13+
Intel(R) Graphics [0xe223];3;5;16;13;30000;0;31;5;1;1;16;0;0;0;0;0;1;0;0;2;0;1
14+
Intel(R) Graphics [0xe223];3;5;16;16;30000;0;30;5;1;1;16;0;-1;0;0;0;1;0;0;0;0;0
15+
Intel(R) Graphics [0xe223];3;5;16;24;30000;0;24;5;1;1;16;0;0;0;0;0;1;0;0;0;0;0
16+
Intel(R) Graphics [0xe223];3;5;16;26;30000;0;46;5;1;1;16;-2;-1;0;0;0;1;0;2;2;0;1
17+
Intel(R) Graphics [0xe223];3;5;24;5;30000;0;30;5;1;1;1;-1;-2;0;0;0;1;0;2;2;0;0
18+
Intel(R) Graphics [0xe223];3;5;24;13;30000;0;30;5;1;1;1;-2;-1;0;0;0;1;0;2;0;0;0
19+
Intel(R) Graphics [0xe223];3;5;24;16;30000;0;30;5;1;1;24;-1;1;0;0;0;1;0;0;0;0;0
20+
Intel(R) Graphics [0xe223];3;5;24;24;30000;0;40;5;1;1;24;0;1;0;0;0;1;0;0;2;0;1
21+
Intel(R) Graphics [0xe223];3;5;24;26;30000;0;42;5;1;1;24;-1;1;0;0;0;1;0;0;0;0;0
22+
Intel(R) Graphics [0xe223];3;5;26;5;30000;0;30;5;1;1;1;-1;-2;0;0;0;1;0;0;0;0;0
23+
Intel(R) Graphics [0xe223];3;5;26;13;30000;0;30;5;1;1;26;1;-2;0;0;0;1;0;0;2;0;1
24+
Intel(R) Graphics [0xe223];3;5;26;16;30000;0;24;5;1;1;26;-2;-2;0;0;0;1;0;0;0;0;0
25+
Intel(R) Graphics [0xe223];3;5;26;24;30000;0;30;5;1;4;26;1;1;0;0;0;1;0;1;0;0;1
26+
Intel(R) Graphics [0xe223];3;5;26;26;30000;0;30;5;1;1;26;1;-1;0;0;0;1;0;0;0;0;1
27+
Intel(R) Graphics [0xe223];3;6;6;6;30000;0;30;6;1;1;1;-2;0;0;0;0;1;0;0;0;0;0
28+
Intel(R) Graphics [0xe223];3;9;9;9;30000;0;30;9;1;1;1;0;0;0;0;0;1;0;2;0;0;0
29+
Intel(R) Graphics [0xe223];3;9;9;16;30000;0;15;9;1;1;9;-1;1;0;0;0;1;0;0;0;0;1
30+
Intel(R) Graphics [0xe223];3;9;9;22;30000;0;40;9;1;1;9;-2;1;0;0;0;1;0;0;0;0;0
31+
Intel(R) Graphics [0xe223];3;9;16;9;30000;0;59;9;1;1;16;-1;0;0;0;0;1;0;0;0;0;1
32+
Intel(R) Graphics [0xe223];3;9;16;16;30000;0;30;9;1;7;16;-1;-1;0;0;0;1;0;0;1;0;1
33+
Intel(R) Graphics [0xe223];3;9;16;22;30000;0;30;9;1;1;1;-2;-1;0;0;0;1;0;0;0;0;0
34+
Intel(R) Graphics [0xe223];3;9;22;9;30000;0;30;9;1;1;22;-1;-2;0;0;0;1;0;0;2;0;1
35+
Intel(R) Graphics [0xe223];3;9;22;16;30000;0;30;9;1;1;22;-1;-1;0;0;0;1;0;2;0;0;1
36+
Intel(R) Graphics [0xe223];3;9;22;22;30000;0;30;9;1;1;22;0;1;0;0;0;1;0;2;0;0;1
37+
Intel(R) Graphics [0xe223];3;13;5;5;30000;0;30;13;1;12;13;1;2;0;0;0;1;0;1;1;0;1
38+
Intel(R) Graphics [0xe223];3;13;5;13;30000;0;20;13;1;11;1;-1;2;0;0;0;1;0;1;0;0;0
39+
Intel(R) Graphics [0xe223];3;13;5;16;30000;0;30;13;1;3;13;-1;2;0;0;0;1;0;1;1;0;1
40+
Intel(R) Graphics [0xe223];3;13;5;24;30000;0;24;13;1;2;13;0;2;0;0;0;1;0;1;1;0;0
41+
Intel(R) Graphics [0xe223];3;13;5;26;30000;0;24;13;1;13;13;0;2;0;0;0;1;0;0;0;0;0
42+
Intel(R) Graphics [0xe223];3;13;13;5;30000;0;30;13;1;1;13;-2;1;0;0;0;1;0;0;2;0;0
43+
Intel(R) Graphics [0xe223];3;13;13;13;30000;0;24;13;1;1;1;1;-1;0;0;0;1;0;0;0;0;0
44+
Intel(R) Graphics [0xe223];3;13;13;16;30000;0;24;13;1;10;13;1;-1;0;0;0;1;0;1;0;0;0
45+
Intel(R) Graphics [0xe223];3;13;13;24;30000;0;30;13;1;1;13;-2;1;0;0;0;1;0;0;0;0;1
46+
Intel(R) Graphics [0xe223];3;13;13;26;30000;0;41;13;1;1;13;-1;1;0;0;0;1;0;0;0;0;0
47+
Intel(R) Graphics [0xe223];3;13;16;5;30000;0;40;13;1;3;16;0;1;0;0;0;1;0;0;0;0;0
48+
Intel(R) Graphics [0xe223];3;13;16;13;30000;0;30;13;1;12;16;1;1;0;0;0;1;0;2;1;0;0
49+
Intel(R) Graphics [0xe223];3;13;16;16;30000;0;31;13;1;11;16;-2;-2;0;0;0;1;0;1;0;0;0
50+
Intel(R) Graphics [0xe223];3;13;16;24;30000;0;31;13;1;7;16;0;0;0;0;0;1;0;1;0;0;0
51+
Intel(R) Graphics [0xe223];3;13;16;26;30000;0;25;13;1;7;16;-1;-1;0;0;0;1;0;1;2;0;0
52+
Intel(R) Graphics [0xe223];3;13;24;5;30000;0;40;13;1;1;24;-2;1;0;0;0;1;0;0;2;0;1
53+
Intel(R) Graphics [0xe223];3;13;24;13;30000;0;30;13;1;7;24;1;0;0;0;0;1;0;1;0;0;1
54+
Intel(R) Graphics [0xe223];3;13;24;16;30000;0;47;13;1;1;24;0;-2;0;0;0;1;0;0;1;0;0
55+
Intel(R) Graphics [0xe223];3;13;24;24;30000;0;30;13;1;1;24;-1;0;0;0;0;1;0;2;0;0;1
56+
Intel(R) Graphics [0xe223];3;13;24;26;30000;0;15;13;1;1;24;0;0;0;0;0;1;0;0;0;0;1
57+
Intel(R) Graphics [0xe223];3;13;26;5;30000;0;30;13;1;1;26;0;0;0;0;0;1;0;0;2;0;1
58+
Intel(R) Graphics [0xe223];3;13;26;13;30000;0;30;13;1;1;26;0;-1;0;0;0;1;0;2;2;0;1
59+
Intel(R) Graphics [0xe223];3;13;26;16;30000;0;49;13;1;10;26;0;-2;0;0;0;1;0;2;1;0;0
60+
Intel(R) Graphics [0xe223];3;13;26;24;30000;0;30;13;1;10;26;-2;0;0;0;0;1;0;1;0;0;1
61+
Intel(R) Graphics [0xe223];3;13;26;26;30000;0;40;13;1;1;26;-1;1;0;0;0;1;0;2;0;0;1
62+
Intel(R) Graphics [0xe223];3;14;14;14;30000;0;40;14;1;1;14;-1;-2;0;0;0;1;0;0;2;0;0
63+
Intel(R) Graphics [0xe223];3;14;14;16;30000;0;40;14;1;1;14;-1;0;0;0;0;1;0;0;0;0;0
64+
Intel(R) Graphics [0xe223];3;14;14;29;30000;0;30;14;1;1;14;-2;-1;0;0;0;1;0;0;0;0;0
65+
Intel(R) Graphics [0xe223];3;14;16;14;30000;0;42;14;1;2;16;-1;0;0;0;0;1;0;1;0;0;1
66+
Intel(R) Graphics [0xe223];3;14;16;16;30000;0;40;14;1;12;16;1;0;0;0;0;1;0;1;0;0;1
67+
Intel(R) Graphics [0xe223];3;14;16;29;30000;0;15;14;1;1;16;-1;-2;0;0;0;1;0;0;0;0;0
68+
Intel(R) Graphics [0xe223];3;14;29;14;30000;0;30;14;1;6;29;-1;1;0;0;0;1;0;1;2;0;1
69+
Intel(R) Graphics [0xe223];3;14;29;16;30000;0;30;14;1;4;29;-2;0;0;0;0;1;0;1;2;0;1
70+
Intel(R) Graphics [0xe223];3;14;29;29;30000;0;15;14;1;1;29;-1;1;0;0;0;1;0;0;0;0;1
71+
Intel(R) Graphics [0xe223];3;16;5;5;30000;0;30;16;1;14;16;-1;2;0;0;0;1;0;0;2;0;0
72+
Intel(R) Graphics [0xe223];3;16;5;13;30000;0;30;16;1;16;16;-2;2;0;0;0;1;0;1;0;0;1
73+
Intel(R) Graphics [0xe223];3;16;5;16;30000;0;40;16;1;15;16;-1;2;0;0;0;1;0;1;2;0;1
74+
Intel(R) Graphics [0xe223];3;16;5;24;30000;0;15;16;1;9;1;-2;2;0;0;0;1;0;0;1;0;0
75+
Intel(R) Graphics [0xe223];3;16;5;26;30000;0;25;16;1;4;16;0;2;0;0;0;1;0;0;2;0;0
76+
Intel(R) Graphics [0xe223];3;16;9;9;30000;0;30;16;1;10;16;0;-2;0;0;0;1;0;2;2;0;1
77+
Intel(R) Graphics [0xe223];3;16;9;16;30000;0;30;16;1;10;16;-2;-2;0;0;0;1;0;1;0;0;1
78+
Intel(R) Graphics [0xe223];3;16;9;22;30000;0;15;16;1;1;16;-1;-1;0;0;0;1;0;0;0;0;1
79+
Intel(R) Graphics [0xe223];3;16;13;5;30000;0;24;16;1;15;1;1;0;0;0;0;1;0;2;0;0;0
80+
Intel(R) Graphics [0xe223];3;16;13;13;30000;0;24;16;1;8;16;-1;0;0;0;0;1;0;1;2;0;0
81+
Intel(R) Graphics [0xe223];3;16;13;16;30000;0;17;16;1;5;16;0;1;0;0;0;1;0;0;1;0;0
82+
Intel(R) Graphics [0xe223];3;16;13;24;30000;0;24;16;1;1;16;1;1;0;0;0;1;0;2;0;0;0
83+
Intel(R) Graphics [0xe223];3;16;13;26;30000;0;60;16;1;12;16;-2;1;0;0;0;1;0;1;0;0;0
84+
Intel(R) Graphics [0xe223];3;16;14;14;30000;0;31;16;1;1;16;-2;-2;0;0;0;1;0;0;2;0;1
85+
Intel(R) Graphics [0xe223];3;16;14;16;30000;0;40;16;1;14;16;-1;0;0;0;0;1;0;1;0;0;1
86+
Intel(R) Graphics [0xe223];3;16;14;29;30000;0;15;16;1;1;16;-2;0;0;0;0;1;0;0;0;0;0
87+
Intel(R) Graphics [0xe223];3;16;16;5;30000;0;30;16;1;1;1;1;0;0;0;0;1;0;0;2;0;0
88+
Intel(R) Graphics [0xe223];3;16;16;9;30000;0;30;16;1;1;16;1;-1;0;0;0;1;0;0;0;0;1
89+
Intel(R) Graphics [0xe223];3;16;16;13;30000;0;30;16;1;12;16;-2;1;0;0;0;1;0;1;2;0;0
90+
Intel(R) Graphics [0xe223];3;16;16;14;30000;0;40;16;1;1;16;1;1;0;0;0;1;0;0;0;0;1
91+
Intel(R) Graphics [0xe223];3;16;16;16;30000;0;15;16;1;1;16;-2;0;0;0;0;1;0;0;2;0;1
92+
Intel(R) Graphics [0xe223];3;16;16;22;30000;0;15;16;1;1;1;-2;-2;0;0;0;1;0;0;2;0;1
93+
Intel(R) Graphics [0xe223];3;16;16;24;30000;0;24;16;1;9;16;-2;0;0;0;0;1;0;1;2;0;0
94+
Intel(R) Graphics [0xe223];3;16;16;26;30000;0;60;16;1;5;16;0;-1;0;0;0;1;0;1;0;0;0
95+
Intel(R) Graphics [0xe223];3;16;16;29;30000;0;60;16;1;1;16;-2;0;0;0;0;1;0;0;2;0;0
96+
Intel(R) Graphics [0xe223];3;16;16;55;30000;0;30;16;1;1;16;1;-1;0;0;0;1;0;0;0;0;0
97+
Intel(R) Graphics [0xe223];3;16;22;9;30000;0;59;16;1;5;22;-1;0;0;0;0;1;0;0;0;0;1
98+
Intel(R) Graphics [0xe223];3;16;22;16;30000;0;40;16;1;14;22;1;-2;0;0;0;1;0;1;0;0;1
99+
Intel(R) Graphics [0xe223];3;16;22;22;30000;0;15;16;1;1;22;0;1;0;0;0;1;0;0;0;0;1
100+
Intel(R) Graphics [0xe223];3;23;23;23;30000;0;15;23;1;1;1;1;1;0;0;0;1;0;0;0;0;0

0 commit comments

Comments
 (0)