Fix Sparse2of4 Example (#1182)

dsikka · web-flow · commit 2fe002718085 · 2025-02-25T03:06:00.000Z
Summary
- Should be saving compressed for all cases
diff --git a/examples/sparse_2of4_quantization_fp8/llama3_8b_2of4.py b/examples/sparse_2of4_quantization_fp8/llama3_8b_2of4.py
@@ -116,5 +116,5 @@ def get_recipe(fp8_enabled):
 print("==========================================\n")
 
 # Save compressed model and tokenizer
-model.save_pretrained(save_dir, save_compressed=args.fp8)
+model.save_pretrained(save_dir)
 tokenizer.save_pretrained(save_dir)