buffer to parameter

MekkCyber · MekkCyber · commit 83163bcd5adf · 2025-06-04T12:00:13.000Z
diff --git a/src/diffusers/quantizers/finegrained_fp8/finegrained_fp8_quantizer.py b/src/diffusers/quantizers/finegrained_fp8/finegrained_fp8_quantizer.py
@@ -131,9 +131,8 @@ def create_quantized_param(
         scale = scale.reshape(scale_orig_shape).squeeze().reciprocal()
 
         # Load into the model
-        module._buffers[tensor_name] = quantized_param.to(target_device)
-        module._buffers["weight_scale_inv"] = scale.to(target_device)
-        # print("_buffers[0]", module._buffers["weight_scale_inv"])
+        module._parameters[tensor_name] = quantized_param.to(target_device)
+        module._parameters["weight_scale_inv"] = scale.to(target_device)
 
     def check_if_quantized_param(
         self,