fix group_size (#2720)

Jintao-Huang · web-flow · commit 9ace086b42ba · 2024-12-20T17:44:45.000+08:00
diff --git a/swift/llm/export/quant.py b/swift/llm/export/quant.py
@@ -208,6 +208,7 @@ def gptq_model_quantize(self):
         with self._patch_gptq():
             gptq_quantizer = GPTQQuantizer(
                 bits=args.quant_bits,
+                group_size=args.group_size,
                 dataset=','.join(args.dataset),
                 batch_size=args.quant_batch_size,
                 block_name_to_quantize=self.get_block_name_to_quantize(self.model, args.model_type))