@@ -256,7 +256,7 @@ namespace LLM {
256256 ss << " \" " << token << " \" , " ;
257257 }
258258 ss << " ]" ;
259- // LOG_DEBUG("split prompt \"%s\" to tokens %s", original_text.c_str(), ss.str().c_str());
259+ LOG_DEBUG (" split prompt \" %s\" to tokens %s" , original_text.c_str (), ss.str ().c_str ());
260260 // printf("split prompt \"%s\" to tokens %s \n", original_text.c_str(), ss.str().c_str());
261261 return bpe_tokens;
262262 }
@@ -862,8 +862,8 @@ namespace LLM {
862862 q = ggml_rope_ext (ctx->ggml_ctx , q, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NORMAL, 131072 , 1000000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
863863 k = ggml_rope_ext (ctx->ggml_ctx , k, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NORMAL, 131072 , 1000000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
864864 } else if (arch == LLMArch::QWEN3) {
865- q = ggml_rope_ext (ctx->ggml_ctx , q, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NORMAL , 151936 , 1000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
866- k = ggml_rope_ext (ctx->ggml_ctx , k, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NORMAL , 151936 , 1000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
865+ q = ggml_rope_ext (ctx->ggml_ctx , q, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NEOX , 151936 , 1000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
866+ k = ggml_rope_ext (ctx->ggml_ctx , k, input_pos, nullptr , 128 , GGML_ROPE_TYPE_NEOX , 151936 , 1000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
867867 } else {
868868 int sections[4 ] = {16 , 24 , 24 , 0 };
869869 q = ggml_rope_multi (ctx->ggml_ctx , q, input_pos, nullptr , head_dim, sections, GGML_ROPE_TYPE_MROPE, 128000 , 1000000 .f , 1 .f , 0 .f , 1 .f , 32 .f , 1 .f );
0 commit comments