[Bugfix] Fix MRoPE dispatch on CPU (vllm-project#24712)

bigPYJ1151 · web-flow · commit 7920de0a2af7 · 2025-09-12T04:56:31.000Z
Signed-off-by: jiang1.li &lt;jiang1.li@intel.com&gt;
diff --git a/vllm/model_executor/layers/rotary_embedding/mrope.py b/vllm/model_executor/layers/rotary_embedding/mrope.py
@@ -300,6 +300,15 @@ def forward_cuda(
         key = torch.cat((key_rot, key_pass), dim=-1).reshape(key_shape)
         return query, key
 
+    def forward_cpu(
+        self,
+        positions: torch.Tensor,
+        query: torch.Tensor,
+        key: Optional[torch.Tensor] = None,
+        offsets: Optional[torch.Tensor] = None,
+    ) -> tuple[torch.Tensor, Optional[torch.Tensor]]:
+        return self.forward_native(positions, query, key, offsets)
+
     @classmethod
     def get_input_positions(
         cls,