## 课后思考题 - chunked-prefills 对 TTFT(首 token 延迟)和 TBT(token 间延迟)的影响是怎么样的? - 为什么要限制每轮调度的 chunk size? - stall-free scheduling 的调度逻辑是怎么样的?