cont : minor [no ci]

ggerganov · ggerganov · commit 06b61844e410 · 2025-05-11T09:59:48.000+03:00
diff --git a/src/llama-kv-cache.h b/src/llama-kv-cache.h
@@ -111,7 +111,7 @@ class llama_kv_cache_unified : public llama_kv_cache {
 
     bool seq_rm  (llama_seq_id seq_id,                              llama_pos p0, llama_pos p1) override;
     void seq_cp  (llama_seq_id seq_id_src, llama_seq_id seq_id_dst, llama_pos p0, llama_pos p1) override;
-    void seq_keep(llama_seq_id seq_id) override;
+    void seq_keep(llama_seq_id seq_id)                                                          override;
     void seq_add (llama_seq_id seq_id,                              llama_pos p0, llama_pos p1, llama_pos delta) override;
     void seq_div (llama_seq_id seq_id,                              llama_pos p0, llama_pos p1, int d) override;
 
@@ -147,6 +147,15 @@ class llama_kv_cache_unified : public llama_kv_cache {
 
     bool get_can_shift() const override;
 
+    // state write/load
+
+    void state_write(llama_io_write_i & io, llama_seq_id seq_id = -1) const override;
+    void state_read (llama_io_read_i  & io, llama_seq_id seq_id = -1)       override;
+
+    //
+    // llama_kv_cache_unified specific API
+    //
+
     uint32_t get_n() const;
 
     ggml_tensor * get_k(ggml_context * ctx, int32_t il) const;
@@ -161,11 +170,6 @@ class llama_kv_cache_unified : public llama_kv_cache {
     void set_input_k_shift    (ggml_tensor * dst) const;
     void set_input_pos_bucket (ggml_tensor * dst, const llama_ubatch * ubatch) const;
 
-    // state write/load
-
-    void state_write(llama_io_write_i & io, llama_seq_id seq_id = -1) const override;
-    void state_read (llama_io_read_i  & io, llama_seq_id seq_id = -1) override;
-
 private:
     const llama_model & model;
     const llama_hparams & hparams;