Add the Quantizations Methods.

codewithdark-git · codewithdark-git · commit 52d38d8e1824 · 2025-05-21T13:12:42.000+05:00
diff --git a/quantllm/utils/benchmark.py b/quantllm/utils/benchmark.py
@@ -64,9 +64,11 @@ def benchmark_quantizer(
                     "percdamp": 0.01,
                     "block_size": 128,
                 })
+              # Create a deep copy of the model using state dict
+            model_clone = type(self.model)(self.model.config)
+            model_clone.load_state_dict(self.model.state_dict())
             
-            # Initialize quantizer with model on CPU
-            model_clone = self.model.clone()
+            # Initialize quantizer with model copy on CPU
             quantizer = quantizer_class(model=model_clone, **mem_efficient_args)
             
             # Move to device for quantization