add debug log

orca-zhang · orca-zhang · commit dafd46a6cd9b · 2025-02-26T10:08:01.000+08:00
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -2958,6 +2958,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                                 float *dst = (float *)layer.wk_b->data;
                                 int src_stride = wkv_b->ne[0]; // 原始张量每行的元素数
 
+                                LLAMA_LOG_DEBUG("222\n", 0);
                                 for (int h = 0; h < n_head_kv; ++h) {
                                     int k_start = h * (n_embd_head_qk_nope + n_embd_head_v);
                                     for (int row = 0; row < kv_lora_rank; ++row) {
@@ -2968,6 +2969,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                                             int dst_row = h * kv_lora_rank + row;
                                             int dst_col = col;
                                             dst[dst_row * n_embd_head_qk_nope + dst_col] = src[src_idx];
+                                            LLAMA_LOG_DEBUG("333 row: %d, col: %d\n", row, col);
                                         }
                                     }
                                 }
@@ -2979,11 +2981,13 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                                 n_head_kv * n_embd_head_v,  // 行数：合并头和特征维度
                                 kv_lora_rank                // 列数：LoRA 秩
                             );
+                            LLAMA_LOG_DEBUG("444\n", 0);
                             {
                                 float *src = (float *)wkv_b->data;
                                 float *dst = (float *)layer.wv_b->data;
                                 int src_stride = wkv_b->ne[0]; // 原始张量每行的元素数
 
+                                LLAMA_LOG_DEBUG("555\n", 0);
                                 for (int h = 0; h < n_head_kv; ++h) {
                                     int v_start = h * (n_embd_head_qk_nope + n_embd_head_v) + n_embd_head_qk_nope;
                                     for (int row = 0; row < kv_lora_rank; ++row) {
@@ -2996,6 +3000,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                                             int dst_row = h * n_embd_head_v + col; // 合并头和特征维度
                                             int dst_col = row;                     // LoRA 秩维度
                                             dst[dst_row * kv_lora_rank + dst_col] = src[src_idx];
+                                            LLAMA_LOG_DEBUG("666 row: %d, col: %d\n", row, col);
                                         }
                                     }
                                 }

Original file line number	Diff line number	Diff line change
`@@ -2958,6 +2958,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`2958`	`2958`	`float dst = (float )layer.wk_b->data;`
`2959`	`2959`	`int src_stride = wkv_b->ne[0]; // 原始张量每行的元素数`
`2960`	`2960`
	`2961`	`+ LLAMA_LOG_DEBUG("222\n", 0);`
`2961`	`2962`	`for (int h = 0; h < n_head_kv; ++h) {`
`2962`	`2963`	`int k_start = h * (n_embd_head_qk_nope + n_embd_head_v);`
`2963`	`2964`	`for (int row = 0; row < kv_lora_rank; ++row) {`
`@@ -2968,6 +2969,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`2968`	`2969`	`int dst_row = h * kv_lora_rank + row;`
`2969`	`2970`	`int dst_col = col;`
`2970`	`2971`	`dst[dst_row * n_embd_head_qk_nope + dst_col] = src[src_idx];`
	`2972`	`+ LLAMA_LOG_DEBUG("333 row: %d, col: %d\n", row, col);`
`2971`	`2973`	`}`
`2972`	`2974`	`}`
`2973`	`2975`	`}`
`@@ -2979,11 +2981,13 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`2979`	`2981`	`n_head_kv * n_embd_head_v, // 行数：合并头和特征维度`
`2980`	`2982`	`kv_lora_rank // 列数：LoRA 秩`
`2981`	`2983`	`);`
	`2984`	`+ LLAMA_LOG_DEBUG("444\n", 0);`
`2982`	`2985`	`{`
`2983`	`2986`	`float src = (float )wkv_b->data;`
`2984`	`2987`	`float dst = (float )layer.wv_b->data;`
`2985`	`2988`	`int src_stride = wkv_b->ne[0]; // 原始张量每行的元素数`
`2986`	`2989`
	`2990`	`+ LLAMA_LOG_DEBUG("555\n", 0);`
`2987`	`2991`	`for (int h = 0; h < n_head_kv; ++h) {`
`2988`	`2992`	`int v_start = h * (n_embd_head_qk_nope + n_embd_head_v) + n_embd_head_qk_nope;`
`2989`	`2993`	`for (int row = 0; row < kv_lora_rank; ++row) {`
`@@ -2996,6 +3000,7 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`2996`	`3000`	`int dst_row = h * n_embd_head_v + col; // 合并头和特征维度`
`2997`	`3001`	`int dst_col = row; // LoRA 秩维度`
`2998`	`3002`	`dst[dst_row * kv_lora_rank + dst_col] = src[src_idx];`
	`3003`	`+ LLAMA_LOG_DEBUG("666 row: %d, col: %d\n", row, col);`
`2999`	`3004`	`}`
`3000`	`3005`	`}`
`3001`	`3006`	`}`