[Minor] Fix type annotation in Mixtral (#2036)

WoosukKwon · web-flow · commit 81ce2a4b26c7 · 2023-12-11T11:32:39.000-08:00
diff --git a/vllm/model_executor/models/mixtral.py b/vllm/model_executor/models/mixtral.py
@@ -251,7 +251,7 @@ def sparse_transpose(
         return column_indices_t, offsets_t, block_offsets_t
 
     def topology(self, x: torch.Tensor,
-                 padded_bins: torch.Tensor) -> stk.Matrix:
+                 padded_bins: torch.Tensor) -> "stk.Matrix":
         padded_tokens, _ = x.size()
         assert padded_tokens % self.blocking == 0
         assert self.ffn_dim_per_partition % self.blocking == 0