[Bugfix] Fix MRoPE dispatch on XPU (vllm-project#24724)

yma11 · web-flow · commit 4d7c1d531b89 · 2025-09-12T21:43:56.000+08:00
Signed-off-by: Yan Ma &lt;yan.ma@intel.com&gt;
diff --git a/vllm/model_executor/layers/rotary_embedding/mrope.py b/vllm/model_executor/layers/rotary_embedding/mrope.py
@@ -300,6 +300,15 @@ def forward_cuda(
         key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
+    def forward_xpu(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: Optional[torch.Tensor] = None,
+        offsets: Optional[torch.Tensor] = None,
+    ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        return self.forward_native(positions, query, key, offsets)
+
     def forward_cpu(
         self,
         positions: torch.Tensor,