Pull Request Labeler

[CUDA backend ONLY] Use just K-cache for MLA + FA: 47% saving on KV-cache size #12317

Sign in to view logs

Summary
Jobs
- labeler
Run details
- Usage
- Workflow file

Triggered via pull request June 12, 2025 11:55

jukofyork

synchronize #13529

Status Success

Total duration 10s

Artifacts –

labeler.yml

on: pull_request_target