Address comments

nikita-savelyevv · nikita-savelyevv · commit c259d4f2cbed · 2025-02-18T10:42:41.000+01:00
diff --git a/optimum/intel/openvino/configuration.py b/optimum/intel/openvino/configuration.py
@@ -444,6 +444,12 @@ def __init__(
         self.gptq = gptq
         self.lora_correction = lora_correction
         self.backup_precision = backup_precision
+        if kwargs.get("weight_format") is not None:
+            logger.warning(
+                "The `weight_format` parameter is deprecated and will be removed in optimum-intel v1.24.0. "
+                "Please use `dtype` instead."
+            )
+            dtype = kwargs.get("weight_format")
         self.dtype = dtype
         self.post_init()
 
@@ -484,7 +490,12 @@ def post_init(self):
             )
 
         if self.dtype in ["int4", "int8"]:
-            self.bits = 4 if self.dtype == "int4" else 8
+            bits = 4 if self.dtype == "int4" else 8
+            if self.bits is not None and self.bits != bits:
+                logger.warning(
+                    f"Overriding `bits` parameter to the value `bits`={bits} to match the given {self.dtype} `dtype`."
+                )
+            self.bits = bits
 
         if self.bits not in [4, 8]:
             raise ValueError(f"Only support quantization to [4,8] bits but found {self.bits}")
@@ -690,6 +701,12 @@ def __init__(
         self.fast_bias_correction = fast_bias_correction
         self.overflow_fix = overflow_fix
         self.smooth_quant_alpha = smooth_quant_alpha
+        if kwargs.get("activation_format") is not None:
+            logger.warning(
+                "The `activation_format` parameter is deprecated and will be removed in optimum-intel v1.24.0. "
+                "Please use `dtype` instead."
+            )
+            dtype = kwargs.get("activation_format")
         self.dtype = dtype
 
         f8_dtypes = ["f8e4m3", "f8e5m2"]
@@ -778,9 +795,7 @@ def __init__(
             "compression", None
         )  # A field for backward-compatability of training-time compression parameters
         if self.quantization_config is not None:
-            if isinstance(self.quantization_config, OVWeightQuantizationConfig) or isinstance(
-                self.quantization_config, OVQuantizationConfig
-            ):
+            if isinstance(self.quantization_config, (OVWeightQuantizationConfig, OVQuantizationConfig)):
                 self.dtype = self.quantization_config.dtype
             elif isinstance(self.quantization_config, OVMixedQuantizationConfig):
                 wc_dtype = self.quantization_config.weight_quantization_config.dtype
diff --git a/optimum/intel/openvino/modeling_base.py b/optimum/intel/openvino/modeling_base.py
@@ -250,11 +250,9 @@ def fix_op_names_duplicates(model: openvino.runtime.Model):
 
             from optimum.intel.openvino.quantization import _weight_only_quantization
 
-            if not isinstance(quantization_config, dict) and not isinstance(
-                quantization_config, OVWeightQuantizationConfig
-            ):
-                raise RuntimeError(
-                    "Expected quantization_config to be a dictionary or OVWeightQuantizationConfig object."
+            if not isinstance(quantization_config, (dict, OVWeightQuantizationConfig)):
+                raise TypeError(
+                    f"Expected `quantization_config` to be either a dictionary or OVWeightQuantizationConfig object, got {type(quantization_config)}."
                 )
 
             model = _weight_only_quantization(model, quantization_config)