Skip to content

Commit 48c4ace

Browse files
committed
update cuda ops
1 parent d4d1c05 commit 48c4ace

File tree

2 files changed

+11461
-4338
lines changed

2 files changed

+11461
-4338
lines changed

docs/ops.md

Lines changed: 12 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -18,15 +18,15 @@ Legend:
1818
| ACC ||||||||||
1919
| ADD ||||| 🟡 | 🟡 ||||
2020
| ADD1 ||||||||||
21-
| ADD_ID |||| ||||||
21+
| ADD_ID |||| ||||||
2222
| ARANGE ||||||||||
2323
| ARGMAX ||||||||||
2424
| ARGSORT ||||||||||
2525
| CEIL ||||||||||
2626
| CLAMP ||||| 🟡 | 🟡 || 🟡 ||
2727
| CONCAT |||| 🟡 || 🟡 | 🟡 |||
2828
| CONT || 🟡 |||| 🟡 | 🟡 | 🟡 ||
29-
| CONV_2D |||| ||||||
29+
| CONV_2D |||| ||||||
3030
| CONV_2D_DW ||||||||||
3131
| CONV_3D ||||||||||
3232
| CONV_TRANSPOSE_1D ||||||||||
@@ -53,11 +53,11 @@ Legend:
5353
| GET_ROWS || 🟡 || 🟡 || 🟡 | 🟡 | 🟡 ||
5454
| GET_ROWS_BACK ||| 🟡 | 🟡 ||||||
5555
| GROUP_NORM ||||||||||
56-
| GROUP_NORM_MUL_ADD |||| ||||||
56+
| GROUP_NORM_MUL_ADD |||| ||||||
5757
| HARDSIGMOID |||| 🟡 | 🟡 || 🟡 |||
5858
| HARDSWISH |||| 🟡 | 🟡 || 🟡 |||
5959
| IM2COL ||||| 🟡 |||||
60-
| IM2COL_3D |||| ||||||
60+
| IM2COL_3D |||| ||||||
6161
| L2_NORM ||||||||||
6262
| LEAKY_RELU ||||||||||
6363
| LOG ||||||||||
@@ -67,12 +67,12 @@ Legend:
6767
| MUL_MAT_ID || 🟡 |||| 🟡 | 🟡 |||
6868
| NEG |||| 🟡 | 🟡 || 🟡 |||
6969
| NORM ||||| 🟡 ||| 🟡 ||
70-
| NORM_MUL_ADD |||| ||||||
70+
| NORM_MUL_ADD |||| ||||||
7171
| OPT_STEP_ADAMW ||||||||||
72-
| OPT_STEP_SGD |||| ||||||
72+
| OPT_STEP_SGD |||| ||||||
7373
| OUT_PROD | 🟡 || 🟡 | 🟡 ||| 🟡 |||
74-
| PAD |||| ||| 🟡 |||
75-
| PAD_REFLECT_1D |||| ||||||
74+
| PAD |||| 🟡 ||| 🟡 |||
75+
| PAD_REFLECT_1D |||| ||||||
7676
| POOL_2D || 🟡 ||||||||
7777
| REGLU ||||| 🟡 ||| 🟡 ||
7878
| RELU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
@@ -81,7 +81,7 @@ Legend:
8181
| RMS_NORM ||||| 🟡 |||||
8282
| RMS_NORM_BACK ||||||||||
8383
| RMS_NORM_MUL_ADD ||||||||||
84-
| ROLL |||| ||||||
84+
| ROLL |||| ||||||
8585
| ROPE || 🟡 ||||||||
8686
| ROPE_BACK ||||||||||
8787
| ROUND ||||||||||
@@ -95,7 +95,7 @@ Legend:
9595
| SILU |||| 🟡 | 🟡 | 🟡 | 🟡 | 🟡 ||
9696
| SILU_BACK ||||||||||
9797
| SIN ||||| 🟡 ||| 🟡 ||
98-
| SOFTCAP |||| ||||||
98+
| SOFTCAP |||| ||||||
9999
| SOFT_MAX || 🟡 ||||||||
100100
| SOFT_MAX_BACK ||| 🟡 | 🟡 ||| 🟡 |||
101101
| SQR ||||| 🟡 ||| 🟡 ||
@@ -105,9 +105,9 @@ Legend:
105105
| STEP |||| 🟡 | 🟡 || 🟡 |||
106106
| SUB ||||| 🟡 | 🟡 ||||
107107
| SUM ||||||||||
108-
| SUM_ROWS |||| ||| 🟡 |||
108+
| SUM_ROWS |||| 🟡 ||| 🟡 |||
109109
| SWIGLU ||||| 🟡 ||| 🟡 ||
110-
| SWIGLU_OAI |||| ||||||
110+
| SWIGLU_OAI |||| ||||||
111111
| TANH |||| 🟡 | 🟡 || 🟡 | 🟡 ||
112112
| TIMESTEP_EMBEDDING ||||||||||
113113
| TOPK_MOE ||||||||||

0 commit comments

Comments
 (0)