update for failing import

sugunav14 · sugunav14 · commit 803bdb8140b2 · 2025-10-14T17:32:47.000Z
Signed-off-by: Suguna Velury &lt;178320438+sugunav14@users.noreply.github.com&gt;
diff --git a/modelopt/torch/quantization/qtensor/base_qtensor.py b/modelopt/torch/quantization/qtensor/base_qtensor.py
@@ -23,8 +23,6 @@
 from torch.distributed.fsdp._fully_shard._fsdp_param import FSDPParam
 from torch.distributed.tensor import DTensor
 
-from modelopt.torch.quantization.utils import enable_fake_quant, fsdp2_aware_weight_update
-
 
 class QTensorType(enum.Enum):
     """Enumeration for defining types of quantization."""
@@ -234,6 +232,8 @@ def _compress_fsdp_module(fsdp_module):
         Returns:
             None
         """
+        from modelopt.torch.quantization.utils import enable_fake_quant, fsdp2_aware_weight_update
+
         # Unshard FSDPmodule by temporarily setting _fake_quant to prevent weight compression from being triggered
         with enable_fake_quant(fsdp_module):
             fsdp_module.unshard()