Bring back quantization_config parameter

nikita-savelyevv · nikita-savelyevv · commit beaf8490780a · 2024-05-31T13:03:19.000+02:00
diff --git a/optimum/intel/openvino/modeling_decoder.py b/optimum/intel/openvino/modeling_decoder.py
@@ -761,6 +761,7 @@ def _from_pretrained(
             config=config,
             model_save_dir=model_cache_path.parent,
             compile=enable_compilation,
+            quantization_config=quantization_config,
             **kwargs,
         )
 
@@ -782,7 +783,9 @@ def _from_pretrained(
             quantizer = OVQuantizer(causal_model)
             quantization_config_copy = copy.deepcopy(quantization_config)
             quantization_config_copy.tokenizer = quantization_config.tokenizer or model_id
-            quantizer.quantize(ov_config=OVConfig(quantization_config=quantization_config_copy))
+            ov_config = OVConfig(quantization_config=quantization_config_copy)
+            quantizer.quantize(ov_config=ov_config)
+
 
         return causal_model