Skip to content

Commit 72bd732

Browse files
authored
sycl : unify unary kernels with a generic implementation and enable wide operator support (#17213)
* SYCL: add generic unary op implementation for multiple ops (ABS/SGN/…); unify non-contiguous access * SYCL: update documentation and sycl.csv to reflect new unary op support * update ops.md after syncing SYCL.csv changes * Fix SYCL.csv merge conflict * Update ops.md after fixing SYCL.csv conflicts * Fix SYCL.csv tail after merge conflict and regenerate ops.md * Fix line endings and final newline in SYCL.csv * Remove TOPK_MOE entries from SYCL.csv as requested * Update ops.md after removing TOPK_MOE from SYCL.csv * Regenerated SYCL.csv and synced ops.md with upstream * Update ops.md using create_ops_docs.py
1 parent 22e1ce2 commit 72bd732

File tree

4 files changed

+2491
-430
lines changed

4 files changed

+2491
-430
lines changed

docs/ops.md

Lines changed: 25 additions & 26 deletions
Original file line numberDiff line numberDiff line change
@@ -14,7 +14,7 @@ Legend:
1414

1515
| Operation | BLAS | CANN | CPU | CUDA | Metal | OpenCL | SYCL | Vulkan | zDNN |
1616
|-----------|------|------|------|------|------|------|------|------|------|
17-
| ABS |||| 🟡 | 🟡 || 🟡 | 🟡 ||
17+
| ABS |||| 🟡 | 🟡 || | 🟡 ||
1818
| ACC ||||||||||
1919
| ADD ||||| 🟡 | 🟡 ||||
2020
| ADD1 ||||||||||
@@ -23,15 +23,15 @@ Legend:
2323
| ARGMAX ||||||||||
2424
| ARGSORT |||||||| 🟡 ||
2525
| CEIL |||| 🟡 ||| 🟡 |||
26-
| CLAMP ||||| 🟡 | 🟡 | | 🟡 ||
26+
| CLAMP ||||| 🟡 | 🟡 | 🟡 | 🟡 ||
2727
| CONCAT |||| 🟡 || 🟡 ||||
2828
| CONT || 🟡 |||| 🟡 | 🟡 | 🟡 ||
2929
| CONV_2D ||||||||||
3030
| CONV_2D_DW ||||||||||
3131
| CONV_3D ||||||||||
3232
| CONV_TRANSPOSE_1D ||||||||||
3333
| CONV_TRANSPOSE_2D ||||||||||
34-
| COS ||||| 🟡 || | 🟡 ||
34+
| COS ||||| 🟡 || 🟡 | 🟡 ||
3535
| COUNT_EQUAL ||||||||||
3636
| CPY || 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
3737
| CROSS_ENTROPY_LOSS ||||||||||
@@ -40,8 +40,8 @@ Legend:
4040
| DIAG_MASK_INF ||||| 🟡 | 🟡 ||||
4141
| DIV ||||| 🟡 | 🟡 ||||
4242
| DUP |||| 🟡 | 🟡 | 🟡 || 🟡 ||
43-
| ELU |||| 🟡 | 🟡 || 🟡 |||
44-
| EXP |||| 🟡 | 🟡 || 🟡 | 🟡 ||
43+
| ELU |||| 🟡 | 🟡 || |||
44+
| EXP |||| 🟡 | 🟡 || | 🟡 ||
4545
| EXPM1 |||| 🟡 ||||||
4646
| FILL ||||||||||
4747
| FLASH_ATTN_EXT || 🟡 || 🟡 | 🟡 ||| 🟡 ||
@@ -50,40 +50,40 @@ Legend:
5050
| GEGLU ||||| 🟡 ||| 🟡 ||
5151
| GEGLU_ERF ||||| 🟡 ||| 🟡 ||
5252
| GEGLU_QUICK ||||| 🟡 ||| 🟡 ||
53-
| GELU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
54-
| GELU_ERF |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
55-
| GELU_QUICK |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
53+
| GELU |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
54+
| GELU_ERF |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
55+
| GELU_QUICK |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
5656
| GET_ROWS || 🟡 || 🟡 || 🟡 | 🟡 | 🟡 ||
5757
| GET_ROWS_BACK ||| 🟡 | 🟡 ||||||
5858
| GROUP_NORM ||||||||||
59-
| GROUP_NORM_MUL_ADD ||||||| |||
60-
| HARDSIGMOID |||| 🟡 | 🟡 || 🟡 | 🟡 ||
61-
| HARDSWISH |||| 🟡 | 🟡 || 🟡 | 🟡 ||
59+
| GROUP_NORM_MUL_ADD ||||||| |||
60+
| HARDSIGMOID |||| 🟡 | 🟡 || | 🟡 ||
61+
| HARDSWISH |||| 🟡 | 🟡 || | 🟡 ||
6262
| IM2COL ||||| 🟡 |||||
6363
| IM2COL_3D ||||||||||
6464
| L2_NORM ||||||||||
6565
| LEAKY_RELU |||||||| 🟡 ||
66-
| LOG ||||||| |||
66+
| LOG ||||||| 🟡 |||
6767
| MEAN ||||||||||
6868
| MUL ||||| 🟡 | 🟡 ||||
6969
| MUL_MAT | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 |
7070
| MUL_MAT_ID || 🟡 |||| 🟡 | 🟡 |||
71-
| NEG |||| 🟡 | 🟡 || 🟡 | 🟡 ||
71+
| NEG |||| 🟡 | 🟡 || | 🟡 ||
7272
| NORM ||||| 🟡 ||| 🟡 ||
73-
| NORM_MUL_ADD ||||||| |||
73+
| NORM_MUL_ADD ||||||| |||
7474
| OPT_STEP_ADAMW ||||||||||
7575
| OPT_STEP_SGD ||||||||||
7676
| OUT_PROD | 🟡 || 🟡 | 🟡 ||| 🟡 |||
7777
| PAD |||| 🟡 ||| 🟡 |||
7878
| PAD_REFLECT_1D ||||||||||
7979
| POOL_2D || 🟡 ||||||||
8080
| REGLU ||||| 🟡 ||| 🟡 ||
81-
| RELU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
81+
| RELU |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
8282
| REPEAT |||| 🟡 || 🟡 || 🟡 ||
8383
| REPEAT_BACK ||||||||||
8484
| RMS_NORM ||||| 🟡 |||||
8585
| RMS_NORM_BACK ||||||||||
86-
| RMS_NORM_MUL_ADD ||||||| |||
86+
| RMS_NORM_MUL_ADD ||||||| |||
8787
| ROLL ||||||||||
8888
| ROPE || 🟡 ||||||||
8989
| ROPE_BACK ||||||||||
@@ -93,29 +93,28 @@ Legend:
9393
| SCALE || 🟡 ||||||||
9494
| SET ||||||| 🟡 |||
9595
| SET_ROWS ||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
96-
| SGN |||| 🟡 | 🟡 || 🟡 |||
97-
| SIGMOID |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
98-
| SILU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
96+
| SGN |||| 🟡 | 🟡 || |||
97+
| SIGMOID |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
98+
| SILU |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
9999
| SILU_BACK ||||||||||
100-
| SIN ||||| 🟡 || | 🟡 ||
101-
| SOFTCAP ||||||| |||
100+
| SIN ||||| 🟡 || 🟡 | 🟡 ||
101+
| SOFTCAP ||||||| |||
102102
| SOFTPLUS |||| 🟡 ||||||
103103
| SOFT_MAX || 🟡 ||||||||
104104
| SOFT_MAX_BACK ||| 🟡 | 🟡 ||| 🟡 |||
105105
| SOLVE_TRI ||||||||||
106-
| SQR ||||| 🟡 || | 🟡 ||
107-
| SQRT ||||| 🟡 || | 🟡 ||
106+
| SQR ||||| 🟡 || 🟡 | 🟡 ||
107+
| SQRT ||||| 🟡 || 🟡 | 🟡 ||
108108
| SSM_CONV ||||||||||
109109
| SSM_SCAN |||||||| 🟡 ||
110-
| STEP |||| 🟡 | 🟡 || 🟡 |||
110+
| STEP |||| 🟡 | 🟡 || |||
111111
| SUB ||||| 🟡 | 🟡 ||||
112112
| SUM |||| 🟡 ||| 🟡 | 🟡 ||
113113
| SUM_ROWS |||| 🟡 ||| 🟡 |||
114114
| SWIGLU ||||| 🟡 ||| 🟡 ||
115115
| SWIGLU_OAI |||||||| 🟡 ||
116-
| TANH |||| 🟡 | 🟡 || 🟡 | 🟡 ||
116+
| TANH |||| 🟡 | 🟡 || | 🟡 ||
117117
| TIMESTEP_EMBEDDING ||||||||||
118-
| TOPK_MOE ||||||||||
119118
| TRI ||||||||||
120119
| TRUNC |||| 🟡 ||| 🟡 |||
121120
| UPSCALE || 🟡 ||| 🟡 || 🟡 |||

0 commit comments

Comments
 (0)