@@ -3657,6 +3657,40 @@ ggml_tensor * llama_context_kv_self::build_inp_kq_mask_cross(
3657
3657
return inp_kq_mask_cross;
3658
3658
}
3659
3659
3660
+ // state save/load
3661
+
3662
+ size_t llama_context_kv_self::state_get_data (llama_io_write_i & io) {
3663
+ llama_context::state_get_data (io);
3664
+
3665
+ kv_self.state_write (io);
3666
+
3667
+ return io.n_bytes ();
3668
+ }
3669
+
3670
+ size_t llama_context_kv_self::state_set_data (llama_io_read_i & io) {
3671
+ llama_context::state_set_data (io);
3672
+
3673
+ kv_self.state_read (io);
3674
+
3675
+ return io.n_bytes ();
3676
+ }
3677
+
3678
+ size_t llama_context_kv_self::state_seq_get_data (llama_io_write_i & io, llama_seq_id seq_id) {
3679
+ llama_context::state_seq_get_data (io, seq_id);
3680
+
3681
+ kv_self.state_write (io, seq_id);
3682
+
3683
+ return io.n_bytes ();
3684
+ }
3685
+
3686
+ size_t llama_context_kv_self::state_seq_set_data (llama_io_read_i & io, llama_seq_id seq_id) {
3687
+ llama_context::state_seq_set_data (io, seq_id);
3688
+
3689
+ kv_self.state_read (io, seq_id);
3690
+
3691
+ return io.n_bytes ();
3692
+ }
3693
+
3660
3694
//
3661
3695
// llama_context_recurrent
3662
3696
//
@@ -4527,31 +4561,31 @@ ggml_tensor * llama_context_recurrent::build_rwkv6_time_mix(
4527
4561
4528
4562
// state save/load
4529
4563
4530
- size_t llama_context_kv_self ::state_get_data (llama_io_write_i & io) {
4564
+ size_t llama_context_recurrent ::state_get_data (llama_io_write_i & io) {
4531
4565
llama_context::state_get_data (io);
4532
4566
4533
4567
kv_self.state_write (io);
4534
4568
4535
4569
return io.n_bytes ();
4536
4570
}
4537
4571
4538
- size_t llama_context_kv_self ::state_set_data (llama_io_read_i & io) {
4572
+ size_t llama_context_recurrent ::state_set_data (llama_io_read_i & io) {
4539
4573
llama_context::state_set_data (io);
4540
4574
4541
4575
kv_self.state_read (io);
4542
4576
4543
4577
return io.n_bytes ();
4544
4578
}
4545
4579
4546
- size_t llama_context_kv_self ::state_seq_get_data (llama_io_write_i & io, llama_seq_id seq_id) {
4580
+ size_t llama_context_recurrent ::state_seq_get_data (llama_io_write_i & io, llama_seq_id seq_id) {
4547
4581
llama_context::state_seq_get_data (io, seq_id);
4548
4582
4549
4583
kv_self.state_write (io, seq_id);
4550
4584
4551
4585
return io.n_bytes ();
4552
4586
}
4553
4587
4554
- size_t llama_context_kv_self ::state_seq_set_data (llama_io_read_i & io, llama_seq_id seq_id) {
4588
+ size_t llama_context_recurrent ::state_seq_set_data (llama_io_read_i & io, llama_seq_id seq_id) {
4555
4589
llama_context::state_seq_set_data (io, seq_id);
4556
4590
4557
4591
kv_self.state_read (io, seq_id);
0 commit comments