[Triton] Shaoclee/355 wip mha rope kv cache #723

k50112113 · 2025-09-29T16:53:51Z

Previously, VLLM_ROCM_USE_AITER_TRITON_FUSED_ROPE_ZEROS_KV_CACHE will be disabled if VLLM_ROCM_USE_AITER_MHA is turned on.

This PR enables VLLM_ROCM_USE_AITER_MHA and VLLM_ROCM_USE_AITER_TRITON_FUSED_ROPE_ZEROS_KV_CACHE both to be turned on

This change would affect Llama and GPT-OSS

…VLLM_ROCM_USE_AITER_MHA

k50112113 added 2 commits September 29, 2025 16:44

add VLLM_ROCM_USE_AITER_TRITON_FUSED_ROPE_ZEROS_KV_CACHE support for …

a6e25d5

…VLLM_ROCM_USE_AITER_MHA

fix fp8 kv_cache bug

3a130ec

k50112113 requested a review from gshtras as a code owner September 29, 2025 16:53

k50112113 requested a review from dllehr-amd September 29, 2025 16:54

Provide feedback