fix page_table_copy

wangzaijun · wangzaijun · commit 99dd9426e4b3 · 2025-10-10T08:41:11.000Z
diff --git a/lightllm/common/basemodel/triton_kernel/fa3_utils.py b/lightllm/common/basemodel/triton_kernel/fa3_utils.py
@@ -33,11 +33,11 @@ def page_table_copy(
     page_table,  # destination tensor [batch, seq]
     req_to_token_indexs,  # source tensor [batch, seq]
     b_req_idx,  # request index to copy from
-    max_seq_len_k,  # sequence length to copy
 ):
     assert page_table.dim() == 2, "page_table should be 2D"
     assert req_to_token_indexs.dim() == 2, "req_to_token_indexs should be 2D"
 
+    max_seq_len_k = page_table.shape[1]
     batch_size = page_table.size(0)
     BLOCK_SIZE = 128
 
@@ -57,10 +57,9 @@ def page_table_copy(
     )
 
 
-import torch
-
-
 def test_page_table_copy():
+    import torch
+
     batch_size, seq_len = 2, 8
 
     req_to_token_indexs = torch.arange(batch_size * seq_len, dtype=torch.int32).reshape(batch_size, seq_len).cuda()
@@ -69,9 +68,8 @@ def test_page_table_copy():
 
     b_req_idx = torch.tensor([0, 2, 1, 3], dtype=torch.int32, device="cuda")[::2]
     print(b_req_idx.stride())
-    max_seq_len_k = seq_len
 
-    page_table_copy(page_table, req_to_token_indexs, b_req_idx, max_seq_len_k)
+    page_table_copy(page_table, req_to_token_indexs, b_req_idx)
 
     print("req_to_token_indexs:")
     print(req_to_token_indexs.cpu().numpy())
diff --git a/lightllm/models/deepseek2/flashattention_infer_struct.py b/lightllm/models/deepseek2/flashattention_infer_struct.py
@@ -57,7 +57,6 @@ def init_some_extra_state(self, model, input_ids: torch.Tensor):
                 page_table=self.page_table[:, :max_seq_len_k],
                 req_to_token_indexs=model.req_manager.req_to_token_indexs,
                 b_req_idx=self.b_req_idx[args_mtp_step :: (args_mtp_step + 1)],
-                max_seq_len_k=max_seq_len_k,
             )
             if args_mtp_step > 0:
                 self.b_att_seq_len = self.b_seq_len[args_mtp_step :: (args_mtp_step + 1)].contiguous()

Original file line number	Diff line number	Diff line change
`@@ -57,7 +57,6 @@ def init_some_extra_state(self, model, input_ids: torch.Tensor):`
`57`	`57`	`page_table=self.page_table[:, :max_seq_len_k],`
`58`	`58`	`req_to_token_indexs=model.req_manager.req_to_token_indexs,`
`59`	`59`	`b_req_idx=self.b_req_idx[args_mtp_step :: (args_mtp_step + 1)],`
`60`		`- max_seq_len_k=max_seq_len_k,`
`61`	`60`	`)`
`62`	`61`	`if args_mtp_step > 0:`
`63`	`62`	`self.b_att_seq_len = self.b_seq_len[args_mtp_step :: (args_mtp_step + 1)].contiguous()`