vllm-project · maazmusameta · Feb 21, 2026 · gemini-code-assist · Feb 21, 2026
@@ -188,6 +188,7 @@
 """
 
 import functools
+import os
 from abc import abstractmethod
 from dataclasses import dataclass, field
 from enum import Enum
@@ -1971,6 +1972,7 @@ def __init__(
         # num_heads=128, nope_dim=128, rope_dim=64
         self._use_flashinfer_concat_mla_k = (
             has_flashinfer()
+            and os.environ.get("VLLM_DISABLE_FLASHINFER_CONCAT_MLA_K", "0") != "1"
-            and os.environ.get("VLLM_DISABLE_FLASHINFER_CONCAT_MLA_K", "0") != "1"
+            and not envs.VLLM_DISABLE_FLASHINFER_CONCAT_MLA_K
-            and os.environ.get("VLLM_DISABLE_FLASHINFER_CONCAT_MLA_K", "0") != "1"
+            and not envs.VLLM_DISABLE_FLASHINFER_CONCAT_MLA_K
             and (self.num_heads == 128)
             and (self.qk_nope_head_dim == 128)
             and (self.qk_rope_head_dim == 64)