[OV] Update default int4 configs (#1393)

nikita-savelyevv · mvafin · commit f870a3e1dd5b · 2025-08-12T16:54:18.000+02:00
* Replace data-aware compression methods with data-free AWQ in default int4 configs for some models
diff --git a/optimum/intel/openvino/configuration.py b/optimum/intel/openvino/configuration.py
@@ -68,7 +68,6 @@ class OVQuantizationMethod(str, Enum):
         "sym": True,
         "group_size": 128,
         "ratio": 0.8,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
     },
     "meta-llama/Llama-2-7b-hf": {"bits": 4, "sym": True, "group_size": 128, "ratio": 0.6},
@@ -77,17 +76,14 @@ class OVQuantizationMethod(str, Enum):
         "sym": True,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "meta-llama/Llama-2-13b-chat-hf": {"bits": 4, "sym": True, "group_size": 64, "ratio": 0.8},
     "stabilityai/stablelm-3b-4e1t": {
         "bits": 4,
         "sym": True,
         "group_size": 64,
         "ratio": 0.8,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
     },
     "stabilityai/stablelm-zephyr-3b": {
@@ -116,9 +112,7 @@ class OVQuantizationMethod(str, Enum):
         "sym": False,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "Qwen/Qwen2.5-Coder-3B-Instruct": {
         "bits": 4,
@@ -142,9 +136,7 @@ class OVQuantizationMethod(str, Enum):
         "sym": True,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "Qwen/Qwen3-8B": {
         "bits": 4,
@@ -202,9 +194,7 @@ class OVQuantizationMethod(str, Enum):
         "sym": False,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "lmsys/longchat-7b-16k": {
         "bits": 4,
@@ -222,9 +212,7 @@ class OVQuantizationMethod(str, Enum):
         "sym": False,
         "group_size": 64,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "microsoft/phi-2": {
         "bits": 4,
@@ -248,25 +236,21 @@ class OVQuantizationMethod(str, Enum):
         "sym": False,
         "group_size": 64,
         "ratio": 0.8,
-        "dataset": "wikitext2",
-        "scale_estimation": True,
+        "quant_method": OVQuantizationMethod.AWQ,
     },
     "meta-llama/Llama-3.2-1B-Instruct": {
         "bits": 4,
         "sym": False,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "meta-llama/Meta-Llama-3.1-8B": {
         "bits": 4,
         "sym": False,
         "group_size": 64,
         "ratio": 0.8,
-        "dataset": "wikitext2",
-        "scale_estimation": True,
+        "quant_method": OVQuantizationMethod.AWQ,
     },
     "microsoft/Phi-3-mini-4k-instruct": {
         "bits": 4,
@@ -281,43 +265,34 @@ class OVQuantizationMethod(str, Enum):
         "sym": False,
         "group_size": 64,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "microsoft/Phi-4-mini-instruct": {
         "bits": 4,
         "sym": False,
         "group_size": 64,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B": {
         "bits": 4,
         "sym": False,
         "group_size": 32,
         "ratio": 0.7,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
         "bits": 4,
         "sym": False,
         "group_size": 128,
         "ratio": 1.0,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
-        "scale_estimation": True,
     },
     "deepseek-ai/DeepSeek-R1-Distill-Llama-8B": {
         "bits": 4,
         "sym": False,
         "group_size": 64,
         "ratio": 0.8,
-        "dataset": "wikitext2",
         "quant_method": OVQuantizationMethod.AWQ,
     },
     "microsoft/Phi-4-multimodal-instruct": {