@@ -394,6 +394,7 @@ extern DECL_FATTN_VEC_F16_CASE( 64, GGML_TYPE_F16, GGML_TYPE_Q4_0);
394394extern DECL_FATTN_VEC_F16_CASE ( 64 , GGML_TYPE_F16, GGML_TYPE_Q4_1);
395395extern DECL_FATTN_VEC_F16_CASE ( 64 , GGML_TYPE_F16, GGML_TYPE_Q5_0);
396396extern DECL_FATTN_VEC_F16_CASE ( 64 , GGML_TYPE_F16, GGML_TYPE_Q5_1);
397+ // extern DECL_FATTN_VEC_F16_CASE( 64, GGML_TYPE_F16, GGML_TYPE_Q6_0);
397398extern DECL_FATTN_VEC_F16_CASE ( 64 , GGML_TYPE_F16, GGML_TYPE_Q8_0);
398399extern DECL_FATTN_VEC_F16_CASE ( 64 , GGML_TYPE_F16, GGML_TYPE_F16);
399400// extern DECL_FATTN_VEC_F16_CASE( 64, GGML_TYPE_Q8_0, GGML_TYPE_IQ4_NL);
@@ -403,6 +404,7 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_Q4_0);
403404extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q4_0);
404405extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q4_0);
405406extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q4_0);
407+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q4_0);
406408extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q4_0);
407409extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q4_0);
408410extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q4_0);
@@ -411,6 +413,7 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_IQ4_NL);
411413extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_IQ4_NL);
412414extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_IQ4_NL);
413415extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_IQ4_NL);
416+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_IQ4_NL);
414417extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_IQ4_NL);
415418extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_IQ4_NL);
416419extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_NL);
@@ -419,6 +422,7 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_Q4_1);
419422extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q4_1);
420423extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q4_1);
421424extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q4_1);
425+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q4_1);
422426extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q4_1);
423427extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q4_1);
424428extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q4_1);
@@ -427,6 +431,7 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_Q5_0);
427431extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q5_0);
428432extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q5_0);
429433extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q5_0);
434+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q5_0);
430435extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q5_0);
431436extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q5_0);
432437extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q5_0);
@@ -435,14 +440,25 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_Q5_1);
435440extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q5_1);
436441extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q5_1);
437442extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q5_1);
443+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q5_1);
438444extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q5_1);
439445extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q5_1);
440446extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q5_1);
441447
448+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_0, GGML_TYPE_Q6_0);
449+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q6_0);
450+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q6_0);
451+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q6_0);
452+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q6_0);
453+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q6_0);
454+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q6_0);
455+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q6_0);
456+
442457extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_0, GGML_TYPE_Q8_0);
443458extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_Q8_0);
444459extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_Q8_0);
445460extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_Q8_0);
461+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_Q8_0);
446462extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_Q8_0);
447463extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_Q8_0);
448464extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_Q8_0);
@@ -451,6 +467,7 @@ extern DECL_FATTN_VEC_F16_CASE(128, GGML_TYPE_Q4_0, GGML_TYPE_F16);
451467extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q4_1, GGML_TYPE_F16);
452468extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_0, GGML_TYPE_F16);
453469extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q5_1, GGML_TYPE_F16);
470+ extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q6_0, GGML_TYPE_F16);
454471extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_Q8_0, GGML_TYPE_F16);
455472extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_F16, GGML_TYPE_F16);
456473extern DECL_FATTN_VEC_F16_CASE (128 , GGML_TYPE_IQ4_NL, GGML_TYPE_F16);
0 commit comments