ggml-org · EAddario · Jun 13, 2025 · Jun 13, 2025 · Jun 14, 2025
@@ -650,6 +650,10 @@ bool string_parse_kv_override(const char * data, std::vector<llama_model_kv_over
         sep += 4;
         kvo.tag = LLAMA_KV_OVERRIDE_TYPE_INT;
         kvo.val_i64 = std::atol(sep);
+    } else if (strncmp(sep, "uint:", 5) == 0) {
+        sep += 5;
+        kvo.tag = LLAMA_KV_OVERRIDE_TYPE_UINT;
+        kvo.val_u64 = std::atol(sep);
     } else if (strncmp(sep, "float:", 6) == 0) {
         sep += 6;
         kvo.tag = LLAMA_KV_OVERRIDE_TYPE_FLOAT;

diff --git a/include/llama.h b/include/llama.h
@@ -272,6 +272,7 @@ extern "C" {
         LLAMA_KV_OVERRIDE_TYPE_FLOAT,
         LLAMA_KV_OVERRIDE_TYPE_BOOL,
         LLAMA_KV_OVERRIDE_TYPE_STR,
+        LLAMA_KV_OVERRIDE_TYPE_UINT,
     };
 
     struct llama_model_kv_override {
@@ -280,10 +281,11 @@ extern "C" {
         char key[128];
 
         union {
-            int64_t val_i64;
-            double  val_f64;
-            bool    val_bool;
-            char    val_str[128];
+            int64_t  val_i64;
+            uint64_t val_u64;
+            double   val_f64;
+            bool     val_bool;
+            char     val_str[128];
         };
     };
 

@@ -164,6 +164,7 @@ namespace GGUFMeta {
                 case LLAMA_KV_OVERRIDE_TYPE_INT:   return "int";
                 case LLAMA_KV_OVERRIDE_TYPE_FLOAT: return "float";
                 case LLAMA_KV_OVERRIDE_TYPE_STR:   return "str";
+                case LLAMA_KV_OVERRIDE_TYPE_UINT: return "uint";
             }
             return "unknown";
         }
@@ -180,6 +181,9 @@ namespace GGUFMeta {
                     case LLAMA_KV_OVERRIDE_TYPE_INT:   {
                         LLAMA_LOG_INFO("%" PRId64 "\n", ovrd->val_i64);
                     } break;
+                    case LLAMA_KV_OVERRIDE_TYPE_UINT:   {
+                        LLAMA_LOG_INFO("%" PRIu64 "\n", ovrd->val_u64);
+                    } break;
                     case LLAMA_KV_OVERRIDE_TYPE_FLOAT: {
                         LLAMA_LOG_INFO("%.6f\n", ovrd->val_f64);
                     } break;
@@ -216,6 +220,10 @@ namespace GGUFMeta {
                 target = ovrd->val_i64;
                 return true;
             }
+            if (validate_override(LLAMA_KV_OVERRIDE_TYPE_UINT, ovrd)) {
+                target = ovrd->val_u64;
+                return true;
+            }
             return false;
         }
 

@@ -586,6 +586,8 @@ static void llama_model_quantize_impl(const std::string & fname_inp, const std::
                 gguf_set_val_f32(ctx_out.get(), o.key, o.val_f64);
             } else if (o.tag == LLAMA_KV_OVERRIDE_TYPE_INT) {
                 gguf_set_val_i32(ctx_out.get(), o.key, o.val_i64);
+            } else if (o.tag == LLAMA_KV_OVERRIDE_TYPE_UINT) {
+                gguf_set_val_u32(ctx_out.get(), o.key, o.val_u64);
             } else if (o.tag == LLAMA_KV_OVERRIDE_TYPE_BOOL) {
                 gguf_set_val_bool(ctx_out.get(), o.key, o.val_bool);
             } else if (o.tag == LLAMA_KV_OVERRIDE_TYPE_STR) {