Isotr0py
diff --git a/‎run_gguf.py‎
Lines changed: 0 additions & 30 deletions b/‎run_gguf.py‎
Lines changed: 0 additions & 30 deletions
diff --git a/‎src/diffusers/quantizers/gguf/utils.py‎
Lines changed: 1 addition & 1 deletion b/‎src/diffusers/quantizers/gguf/utils.py‎
Lines changed: 1 addition & 1 deletion
@@ -74,7 +74,7 @@
 # Consolidate DEQUANT_TYPES and MMQ_QUANT_TYPES after we add
 # MMQ kernel for I-Matrix quantization.
 DEQUANT_TYPES = STANDARD_QUANT_TYPES | KQUANT_TYPES | IMATRIX_QUANT_TYPES
-MMQ_QUANT_TYPES = STANDARD_QUANT_TYPES | KQUANT_TYPES
+MMQ_QUANT_TYPES = STANDARD_QUANT_TYPES
 
 
 def _fused_mul_mat_gguf(x: torch.Tensor, qweight: torch.Tensor, qweight_type: int) -> torch.Tensor: