fix

orca-zhang · orca-zhang · commit 70fb2f972cf0 · 2025-02-26T11:43:02.000+08:00
diff --git a/examples/server/atomic_hash_map.hpp b/examples/server/atomic_hash_map.hpp
@@ -295,8 +295,8 @@ namespace atomic {
   friend ConstIterator;
 
   hash_map(size_t maxSize,
-                    float maxLoadFactor = 0.8f,
-                    const Allocator& alloc = Allocator())
+           float maxLoadFactor = 0.8f,
+           const Allocator& alloc = Allocator())
     : allocator_(alloc)
   {
     size_t capacity = size_t(maxSize / (maxLoadFactor > 1.0f ? 1.0f : maxLoadFactor) + 128);
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -2949,7 +2949,8 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
                             ggml_context * ctx = ctx_for_buft(buft);
 
                             auto trans_wkv_b = ggml_transpose(ctx, layer.wkv_b);
-                            auto wkv_b_copied = ggml_dup(ctx, trans_wkv_b);
+                            auto wkv_b_copied = ggml_new_tensor_2d(ctx, trans_wkv_b->type, trans_wkv_b->ne[0], trans_wkv_b->ne[1]);
+                            ggml_cpy(ctx, trans_wkv_b, wkv_b_copied);
                             layer.wk_b = ggml_view_2d(ctx, wkv_b_copied, wkv_b_copied->ne[0], n_embd_head_qk_nope, n_head, 0);
                             layer.wv_b = ggml_view_2d(ctx, wkv_b_copied, wkv_b_copied->ne[0], n_embd_head_v, n_head, n_embd_head_qk_nope * n_head);
                         }

Original file line number	Diff line number	Diff line change
`@@ -2949,7 +2949,8 @@ bool llama_model::load_tensors(llama_model_loader & ml) {`
`2949`	`2949`	`ggml_context * ctx = ctx_for_buft(buft);`
`2950`	`2950`
`2951`	`2951`	`auto trans_wkv_b = ggml_transpose(ctx, layer.wkv_b);`
`2952`		`- auto wkv_b_copied = ggml_dup(ctx, trans_wkv_b);`
	`2952`	`+ auto wkv_b_copied = ggml_new_tensor_2d(ctx, trans_wkv_b->type, trans_wkv_b->ne[0], trans_wkv_b->ne[1]);`
	`2953`	`+ ggml_cpy(ctx, trans_wkv_b, wkv_b_copied);`
`2953`	`2954`	`layer.wk_b = ggml_view_2d(ctx, wkv_b_copied, wkv_b_copied->ne[0], n_embd_head_qk_nope, n_head, 0);`
`2954`	`2955`	`layer.wv_b = ggml_view_2d(ctx, wkv_b_copied, wkv_b_copied->ne[0], n_embd_head_v, n_head, n_embd_head_qk_nope * n_head);`
`2955`	`2956`	`}`