Skip to content

Commit 994d708

Browse files
committed
Merge yael/tmp-backup into yael/dev (prefer backup versions)
2 parents a972fae + bf95c66 commit 994d708

29 files changed

+14304
-6485
lines changed

.github/CODEOWNERS

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1 @@
1+
* @KamaTechOrg @ShiraZalo1

README.md

Lines changed: 1 addition & 608 deletions
Large diffs are not rendered by default.

docs/ops.md

Lines changed: 59 additions & 52 deletions
Original file line numberDiff line numberDiff line change
@@ -14,90 +14,97 @@ Legend:
1414

1515
| Operation | BLAS | CANN | CPU | CUDA | Metal | OpenCL | SYCL | Vulkan | zDNN |
1616
|-----------|------|------|------|------|------|------|------|------|------|
17-
| ABS |||| 🟡 | 🟡 || 🟡 |||
18-
| ACC ||||||| |||
17+
| ABS |||| 🟡 | 🟡 || |||
18+
| ACC ||||||| |||
1919
| ADD ||||| 🟡 | 🟡 ||||
20-
| ADD1 ||||||||||
20+
| ADD1 ||||||||||
21+
| ADD_ID ||||||||||
2122
| ARANGE ||||||||||
22-
| ARGMAX ||||||| |||
23-
| ARGSORT ||||||| |||
24-
| CLAMP ||||| 🟡 | 🟡 | | 🟡 ||
25-
| CONCAT |||| 🟡 || 🟡 | 🟡 |||
23+
| ARGMAX ||||||| |||
24+
| ARGSORT ||||||| |||
25+
| CLAMP ||||| 🟡 | 🟡 | | 🟡 ||
26+
| CONCAT |||| 🟡 || 🟡 | |||
2627
| CONT || 🟡 |||| 🟡 | 🟡 | 🟡 ||
2728
| CONV_2D ||||||||||
2829
| CONV_2D_DW ||||||||||
29-
| CONV_TRANSPOSE_1D ||||||||||
30+
| CONV_3D ||||||||||
31+
| CONV_TRANSPOSE_1D ||||||||||
3032
| CONV_TRANSPOSE_2D ||||||||||
31-
| COS ||||| 🟡 || | 🟡 ||
32-
| COUNT_EQUAL ||||||| |||
33+
| COS ||||| 🟡 || | 🟡 ||
34+
| COUNT_EQUAL ||||||| |||
3335
| CPY || 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
3436
| CROSS_ENTROPY_LOSS ||||||||||
3537
| CROSS_ENTROPY_LOSS_BACK ||||||||||
3638
| DIAG_MASK_INF ||||| 🟡 | 🟡 ||||
37-
| DIV ||||| 🟡 | 🟡 | |||
38-
| DUP |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
39-
| ELU |||| 🟡 | 🟡 || 🟡 |||
40-
| EXP |||| 🟡 | 🟡 || 🟡 |||
39+
| DIV ||||| 🟡 | 🟡 | |||
40+
| DUP |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
41+
| ELU |||| 🟡 | 🟡 || |||
42+
| EXP |||| 🟡 | 🟡 || |||
4143
| FLASH_ATTN_EXT || 🟡 || 🟡 | 🟡 ||| 🟡 ||
42-
| GATED_LINEAR_ATTN ||||||| |||
43-
| GEGLU ||||| 🟡 || | 🟡 ||
44-
| GEGLU_ERF ||||| 🟡 || | 🟡 ||
45-
| GEGLU_QUICK ||||| 🟡 || | 🟡 ||
44+
| GATED_LINEAR_ATTN ||||||| |||
45+
| GEGLU ||||| 🟡 || | 🟡 ||
46+
| GEGLU_ERF ||||| 🟡 || | 🟡 ||
47+
| GEGLU_QUICK ||||| 🟡 || | 🟡 ||
4648
| GELU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
47-
| GELU_ERF |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
48-
| GELU_QUICK |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
49-
| GET_ROWS || 🟡 || 🟡 || 🟡 | 🟡 | 🟡 ||
49+
| GELU_ERF |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
50+
| GELU_QUICK |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
51+
| GET_ROWS || 🟡 || 🟡 || 🟡 | | 🟡 ||
5052
| GET_ROWS_BACK ||| 🟡 | 🟡 ||||||
5153
| GROUP_NORM ||||||||||
52-
| HARDSIGMOID |||| 🟡 | 🟡 || 🟡 |||
53-
| HARDSWISH |||| 🟡 | 🟡 || 🟡 |||
54-
| IM2COL ||||| 🟡 |||||
55-
| L2_NORM ||||||||||
56-
| LEAKY_RELU ||||||||||
57-
| LOG ||||||||||
54+
| GROUP_NORM_MUL_ADD ||||||||||
55+
| HARDSIGMOID |||| 🟡 | 🟡 |||||
56+
| HARDSWISH |||| 🟡 | 🟡 |||||
57+
| IM2COL ||||| 🟡 |||||
58+
| IM2COL_3D ||||||||||
59+
| L2_NORM ||||||||||
60+
| LEAKY_RELU ||||||||||
61+
| LOG ||||||||||
5862
| MEAN ||||||||||
5963
| MUL ||||| 🟡 | 🟡 ||||
6064
| MUL_MAT | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 |
61-
| MUL_MAT_ID || 🟡 |||| 🟡 | 🟡 |||
62-
| NEG |||| 🟡 | 🟡 || 🟡 |||
63-
| NORM ||||| 🟡 ||| 🟡 ||
65+
| MUL_MAT_ID || 🟡 |||| 🟡 ||||
66+
| NEG |||| 🟡 | 🟡 |||||
67+
| NORM ||||| 🟡 ||| 🟡 ||
68+
| NORM_MUL_ADD ||||||||||
6469
| OPT_STEP_ADAMW ||||||||||
65-
| OUT_PROD | 🟡 || 🟡 | 🟡 ||| 🟡 |||
66-
| PAD ||||||||||
70+
| OPT_STEP_SGD ||||||||||
71+
| OUT_PROD | 🟡 || 🟡 | 🟡 ||||||
72+
| PAD ||||||||||
6773
| PAD_REFLECT_1D ||||||||||
68-
| POOL_2D || 🟡 ||||| |||
69-
| REGLU ||||| 🟡 || | 🟡 ||
74+
| POOL_2D || 🟡 ||||| |||
75+
| REGLU ||||| 🟡 || | 🟡 ||
7076
| RELU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
7177
| REPEAT |||| 🟡 || 🟡 || 🟡 ||
7278
| REPEAT_BACK ||||||||||
7379
| RMS_NORM ||||| 🟡 |||||
7480
| RMS_NORM_BACK ||||||||||
75-
| RMS_NORM_MUL_ADD ||||||| |||
81+
| RMS_NORM_MUL_ADD ||||||| |||
7682
| ROLL ||||||||||
7783
| ROPE || 🟡 ||||||||
7884
| ROPE_BACK ||||||||||
79-
| RWKV_WKV6 ||||||| |||
80-
| RWKV_WKV7 ||||||| |||
81-
| SCALE || 🟡 ||||| |||
85+
| RWKV_WKV6 ||||||| |||
86+
| RWKV_WKV7 ||||||| |||
87+
| SCALE || 🟡 ||||| |||
8288
| SET ||||||||||
83-
| SET_ROWS ||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
84-
| SGN |||| 🟡 | 🟡 || 🟡 |||
85-
| SIGMOID |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
89+
| SET_ROWS ||| 🟡 | 🟡 | 🟡 | 🟡 | | 🟡 ||
90+
| SGN |||| 🟡 | 🟡 || |||
91+
| SIGMOID |||| 🟡 | 🟡 | 🟡 | | 🟡 ||
8692
| SILU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
8793
| SILU_BACK ||||||||||
88-
| SIN ||||| 🟡 || | 🟡 ||
89-
| SOFTCAP ||| |||||||
94+
| SIN ||||| 🟡 || | 🟡 ||
95+
| SOFTCAP ||| |||||||
9096
| SOFT_MAX || 🟡 ||||| 🟡 |||
9197
| SOFT_MAX_BACK ||| 🟡 | 🟡 ||||||
92-
| SQR ||||| 🟡 || | 🟡 ||
93-
| SQRT ||||| 🟡 || |||
98+
| SQR ||||| 🟡 || | 🟡 ||
99+
| SQRT ||||| 🟡 || |||
94100
| SSM_CONV ||||||||||
95101
| SSM_SCAN ||||||||||
96-
| STEP |||| 🟡 | 🟡 || 🟡 |||
97-
| SUB ||||| 🟡 | 🟡 | |||
102+
| STEP |||| 🟡 | 🟡 || |||
103+
| SUB ||||| 🟡 | 🟡 | |||
98104
| SUM ||||||||||
99-
| SUM_ROWS ||||||||||
100-
| SWIGLU ||||| 🟡 ||| 🟡 ||
101-
| TANH |||| 🟡 | 🟡 || 🟡 | 🟡 ||
102-
| TIMESTEP_EMBEDDING ||||||||||
103-
| UPSCALE || 🟡 ||| 🟡 || 🟡 |||
105+
| SUM_ROWS ||||||||||
106+
| SWIGLU ||||| 🟡 ||| 🟡 ||
107+
| SWIGLU_OAI ||||||||||
108+
| TANH |||| 🟡 | 🟡 ||| 🟡 ||
109+
| TIMESTEP_EMBEDDING ||||||||||
110+
| UPSCALE || 🟡 ||| 🟡 |||||

0 commit comments

Comments
 (0)