vllm-project · kylesayrs · Feb 25, 2026 · Feb 25, 2026 · Feb 25, 2026
diff --git a/src/llmcompressor/modifiers/quantization/gptq/base.py b/src/llmcompressor/modifiers/quantization/gptq/base.py
@@ -2,7 +2,7 @@
 from typing import Dict, List, Optional, Tuple, Union
 
 import torch
-from compressed_tensors.offload.dist_utils import is_distributed
+from compressed_tensors.offload.dist_utils import as_broadcastable, is_distributed
 from compressed_tensors.quantization import (
     QuantizationConfig,
     QuantizationScheme,
@@ -358,7 +358,9 @@ def _broadcast_quantized_params(self, module_list, module_to_rank):
                 if getattr(module, attr, None) is not None:
                     pending_comms.append(
                         dist.broadcast(
-                            getattr(module, attr), src=src_rank, async_op=True
+                            as_broadcastable(getattr(module, attr)),
+                            src=src_rank,
+                            async_op=True,
                         )
                     )
         wait_for_comms(pending_comms)