@@ -3665,138 +3665,138 @@ bool ggml_sycl_compute_forward(ggml_backend_sycl_context & ctx, struct ggml_tens
36653665
36663666 switch (dst->op ) {
36673667 case GGML_OP_ARGMAX:
3668- ggml_sycl_op_argmax (ctx, dst); // done
3668+ ggml_sycl_argmax (ctx, dst);
36693669 break ;
36703670 case GGML_OP_CONV_TRANSPOSE_1D:
3671- ggml_sycl_op_conv_transpose_1d (ctx, dst); // already good
3671+ ggml_sycl_op_conv_transpose_1d (ctx, dst);
36723672 break ;
36733673 case GGML_OP_REPEAT:
3674- ggml_sycl_repeat (ctx, dst); // partially done
3674+ ggml_sycl_repeat (ctx, dst);
36753675 break ;
36763676 case GGML_OP_GET_ROWS:
3677- ggml_sycl_op_get_rows (ctx, dst); // done
3677+ ggml_sycl_op_get_rows (ctx, dst);
36783678 break ;
36793679 case GGML_OP_DUP:
3680- ggml_sycl_dup (ctx, dst); // done
3680+ ggml_sycl_dup (ctx, dst);
36813681 break ;
36823682 case GGML_OP_ADD:
36833683 case GGML_OP_ADD1: // TODO: more efficient implementation
3684- ggml_sycl_add (ctx, dst); // partially done
3684+ ggml_sycl_add (ctx, dst);
36853685 break ;
36863686 case GGML_OP_SUB:
3687- ggml_sycl_sub (ctx, dst); // partially done
3687+ ggml_sycl_sub (ctx, dst);
36883688 break ;
36893689 case GGML_OP_ACC:
3690- ggml_sycl_acc (ctx, dst); // fully done
3690+ ggml_sycl_acc (ctx, dst);
36913691 break ;
36923692 case GGML_OP_MUL:
3693- ggml_sycl_mul (ctx, dst); // partially done
3693+ ggml_sycl_mul (ctx, dst);
36943694 break ;
36953695 case GGML_OP_LOG:
3696- ggml_sycl_log (ctx, dst); // fully done
3696+ ggml_sycl_log (ctx, dst);
36973697 break ;
36983698 case GGML_OP_DIV:
3699- ggml_sycl_div (ctx, dst); // partially done
3699+ ggml_sycl_div (ctx, dst);
37003700 break ;
37013701 case GGML_OP_UNARY:
37023702 switch (ggml_get_unary_op (dst)) {
37033703 case GGML_UNARY_OP_NEG:
3704- ggml_sycl_neg (ctx, dst); // done
3704+ ggml_sycl_neg (ctx, dst);
37053705 break ;
37063706 case GGML_UNARY_OP_STEP:
3707- ggml_sycl_step (ctx, dst); // done
3707+ ggml_sycl_step (ctx, dst);
37083708 break ;
37093709 case GGML_UNARY_OP_GELU:
3710- ggml_sycl_gelu (ctx, dst); // done
3710+ ggml_sycl_gelu (ctx, dst);
37113711 break ;
37123712 case GGML_UNARY_OP_SILU:
3713- ggml_sycl_silu (ctx, dst); // done
3713+ ggml_sycl_silu (ctx, dst);
37143714 break ;
37153715 case GGML_UNARY_OP_GELU_QUICK:
3716- ggml_sycl_gelu_quick (ctx, dst); // done
3716+ ggml_sycl_gelu_quick (ctx, dst);
37173717 break ;
37183718 case GGML_UNARY_OP_TANH:
3719- ggml_sycl_tanh (ctx, dst); // done
3719+ ggml_sycl_tanh (ctx, dst);
37203720 break ;
37213721 case GGML_UNARY_OP_RELU:
3722- ggml_sycl_relu (ctx, dst); // done
3722+ ggml_sycl_relu (ctx, dst);
37233723 break ;
37243724 case GGML_UNARY_OP_SIGMOID:
3725- ggml_sycl_sigmoid (ctx, dst); // done
3725+ ggml_sycl_sigmoid (ctx, dst);
37263726 break ;
37273727 case GGML_UNARY_OP_HARDSIGMOID:
3728- ggml_sycl_hardsigmoid (ctx, dst); // done
3728+ ggml_sycl_hardsigmoid (ctx, dst);
37293729 break ;
37303730 case GGML_UNARY_OP_HARDSWISH:
3731- ggml_sycl_hardswish (ctx, dst); // done
3731+ ggml_sycl_hardswish (ctx, dst);
37323732 break ;
37333733 case GGML_UNARY_OP_EXP:
3734- ggml_sycl_exp (ctx, dst); // done
3734+ ggml_sycl_exp (ctx, dst);
37353735 break ;
37363736 default :
37373737 return false ;
37383738 }
37393739 break ;
37403740 case GGML_OP_NORM:
3741- ggml_sycl_norm (ctx, dst); // done
3741+ ggml_sycl_norm (ctx, dst);
37423742 break ;
37433743 case GGML_OP_GROUP_NORM:
3744- ggml_sycl_group_norm (ctx, dst); // done
3744+ ggml_sycl_group_norm (ctx, dst);
37453745 break ;
37463746 case GGML_OP_CONCAT:
3747- ggml_sycl_op_concat (ctx, dst); // already good
3747+ ggml_sycl_op_concat (ctx, dst);
37483748 break ;
37493749 case GGML_OP_UPSCALE:
3750- ggml_sycl_upscale (ctx, dst); // done
3750+ ggml_sycl_upscale (ctx, dst);
37513751 break ;
37523752 case GGML_OP_PAD:
3753- ggml_sycl_pad (ctx, dst); // done
3753+ ggml_sycl_pad (ctx, dst);
37543754 break ;
37553755 case GGML_OP_LEAKY_RELU:
3756- ggml_sycl_leaky_relu (ctx, dst); // done
3756+ ggml_sycl_leaky_relu (ctx, dst);
37573757 break ;
37583758 case GGML_OP_RMS_NORM:
3759- ggml_sycl_rms_norm (ctx, dst); // done
3759+ ggml_sycl_rms_norm (ctx, dst);
37603760 break ;
37613761 case GGML_OP_MUL_MAT:
37623762 if (dst->src [0 ]->ne [3 ] != dst->src [1 ]->ne [3 ]) {
37633763 return false ;
37643764 }
37653765 /* ggml_sycl_mul_mat_id is dependent on ggml_sycl_mul_mat */
3766- ggml_sycl_mul_mat (ctx, dst->src [0 ], dst->src [1 ], dst); // good
3766+ ggml_sycl_mul_mat (ctx, dst->src [0 ], dst->src [1 ], dst);
37673767 break ;
37683768 case GGML_OP_MUL_MAT_ID:
37693769 if (dst->src [0 ]->ne [3 ] != dst->src [1 ]->ne [3 ]) {
37703770 return false ;
37713771 }
3772- ggml_sycl_mul_mat_id (ctx, dst); // good
3772+ ggml_sycl_mul_mat_id (ctx, dst);
37733773 break ;
37743774 case GGML_OP_OUT_PROD:
3775- ggml_sycl_op_out_prod (ctx, dst); // good
3775+ ggml_sycl_op_out_prod (ctx, dst);
37763776 break ;
37773777 case GGML_OP_SCALE:
3778- ggml_sycl_scale (ctx, dst); // done
3778+ ggml_sycl_scale (ctx, dst);
37793779 break ;
37803780 case GGML_OP_SQR:
3781- ggml_sycl_sqr (ctx, dst); // done
3781+ ggml_sycl_sqr (ctx, dst);
37823782 break ;
37833783 case GGML_OP_SQRT:
3784- ggml_sycl_sqrt (ctx, dst); // done
3784+ ggml_sycl_sqrt (ctx, dst);
37853785 break ;
37863786 case GGML_OP_SIN:
3787- ggml_sycl_sin (ctx, dst); // done
3787+ ggml_sycl_sin (ctx, dst);
37883788 break ;
37893789 case GGML_OP_COS:
3790- ggml_sycl_cos (ctx, dst); // done
3790+ ggml_sycl_cos (ctx, dst);
37913791 break ;
37923792 case GGML_OP_CLAMP:
3793- ggml_sycl_clamp (ctx, dst); // done
3793+ ggml_sycl_clamp (ctx, dst);
37943794 break ;
37953795 case GGML_OP_CPY:
3796- ggml_sycl_cpy (ctx, dst->src [0 ], dst->src [1 ]); // okayish, need check
3796+ ggml_sycl_cpy (ctx, dst->src [0 ], dst->src [1 ]);
37973797 break ;
37983798 case GGML_OP_CONT:
3799- ggml_sycl_dup (ctx, dst); // done
3799+ ggml_sycl_dup (ctx, dst);
38003800 break ;
38013801 case GGML_OP_NONE:
38023802 case GGML_OP_RESHAPE:
@@ -3806,34 +3806,34 @@ bool ggml_sycl_compute_forward(ggml_backend_sycl_context & ctx, struct ggml_tens
38063806 GGML_SYCL_DEBUG (" %s: Tensor NO-OP\n " , __func__);
38073807 break ;
38083808 case GGML_OP_DIAG_MASK_INF:
3809- ggml_sycl_diag_mask_inf (ctx, dst); // done
3809+ ggml_sycl_diag_mask_inf (ctx, dst);
38103810 break ;
38113811 case GGML_OP_SOFT_MAX:
3812- ggml_sycl_op_soft_max (ctx, dst); // already good
3812+ ggml_sycl_op_soft_max (ctx, dst);
38133813 break ;
38143814 case GGML_OP_ROPE:
3815- ggml_sycl_rope (ctx, dst); // done
3815+ ggml_sycl_rope (ctx, dst);
38163816 break ;
38173817 case GGML_OP_IM2COL:
3818- ggml_sycl_im2col (ctx, dst); // done
3818+ ggml_sycl_im2col (ctx, dst);
38193819 break ;
38203820 case GGML_OP_POOL_2D:
3821- ggml_sycl_pool2d (ctx, dst); // done
3821+ ggml_sycl_pool2d (ctx, dst);
38223822 break ;
38233823 case GGML_OP_SUM:
3824- ggml_sycl_sum (ctx, dst); // done
3824+ ggml_sycl_sum (ctx, dst);
38253825 break ;
38263826 case GGML_OP_SUM_ROWS:
3827- ggml_sycl_sum_rows (ctx, dst); // done
3827+ ggml_sycl_sum_rows (ctx, dst);
38283828 break ;
38293829 case GGML_OP_ARGSORT:
3830- ggml_sycl_argsort (ctx, dst); // done
3830+ ggml_sycl_argsort (ctx, dst);
38313831 break ;
38323832 case GGML_OP_TIMESTEP_EMBEDDING:
3833- ggml_sycl_op_timestep_embedding (ctx, dst); // already pretty good
3833+ ggml_sycl_op_timestep_embedding (ctx, dst);
38343834 break ;
38353835 case GGML_OP_RWKV_WKV6:
3836- ggml_sycl_op_rwkv_wkv6 (ctx, dst); // good
3836+ ggml_sycl_op_rwkv_wkv6 (ctx, dst);
38373837 break ;
38383838 case GGML_OP_GATED_LINEAR_ATTN:
38393839 ggml_sycl_op_gated_linear_attn (ctx, dst);
0 commit comments