[Bugfix] Move observer and g_idx until after module in onloaded (#195)

kylesayrs · web-flow · commit 07abbf3b9d9a · 2024-10-23T15:25:05.000-04:00
diff --git a/src/compressed_tensors/quantization/lifecycle/calibration.py b/src/compressed_tensors/quantization/lifecycle/calibration.py
@@ -64,14 +64,12 @@ def set_module_for_calibration(module: Module, quantize_weights_upfront: bool =
                 quantization_args=module.quantization_scheme.weights,
             )
 
-        observer = module.weight_observer
-
-        g_idx = getattr(module, "weight_g_idx", None)
-
         offloaded = is_module_offloaded(module)
         if offloaded:
             module._hf_hook.pre_forward(module)
 
+        observer = module.weight_observer
+        g_idx = getattr(module, "weight_g_idx", None)
         scale, zero_point = observer(module.weight, g_idx=g_idx)
         update_parameter_data(module, scale, "weight_scale")
         update_parameter_data(module, zero_point, "weight_zero_point")