refactor log

shihaobai · web-flow · commit 0e459eade3cc · 2025-02-13T15:52:59.000+08:00
diff --git a/lightllm/server/core/objs/start_args_type.py b/lightllm/server/core/objs/start_args_type.py
@@ -37,7 +37,7 @@ class StartArgs:
     router_max_new_token_len: int = field(default=1024)
     router_max_wait_tokens: int = field(default=6)
     use_dynamic_prompt_cache: bool = field(default=False)
-    chunked_prefill_size: int = field(default=256)
+    chunked_prefill_size: int = field(default=8192)
     enable_chunked_prefill: bool = field(default=False)
     diverse_mode: bool = field(default=False)
     token_healing_mode: bool = field(default=False)
diff --git a/lightllm/server/router/req_queue/chunked_prefill/impl.py b/lightllm/server/router/req_queue/chunked_prefill/impl.py
@@ -42,10 +42,9 @@ def _can_add_new_req(self, req: Req, is_busy, new_batch_first_router_need_tokens
             ok_req_num = len(self.cache_len_list) + len(self.pause_req_dict) - 1 <= self.running_max_req_size
 
         new_batch_first_router_need_tokens += req.get_first_router_need_tokens()
-        # splitfuse decode ok
-        ok_splitfuse_decode = new_batch_first_router_need_tokens <= self.batch_max_tokens
+        ok_prefill = new_batch_first_router_need_tokens <= self.batch_max_tokens
 
-        if ok_token_num and ok_req_num and ok_splitfuse_decode:
+        if ok_token_num and ok_req_num and ok_prefill:
             self.router.shared_token_load.set_estimated_peak_token_count(need_max_token_num, self.dp_index)
             self.router.shared_token_load.set_dynamic_max_load(
                 (need_max_token_num + self.router.shared_token_load.get_frozened_token_count(self.dp_index))
@@ -67,8 +66,6 @@ def generate_new_batch(self, current_batch: Batch):
 
         is_busy = self.is_busy()
 
-        # 得到当前batch 往前 decode 一次，需要的token量，在 splitfuse 模式下才有用，因为splitfuse
-        # 模式下 类似prefill 和 deocde 是在一起进行的，所以需要合并考虑历史当前Batch
         new_batch_first_router_need_tokens = (
             0 if current_batch is None else current_batch.get_batch_decode_need_tokens()[self.dp_index]
         )