Simplify usage

nikita-savelyevv · nikita-savelyevv · commit 9d9b57449686 · 2024-08-07T10:20:18.000+02:00
diff --git a/optimum/intel/openvino/modeling_diffusion.py b/optimum/intel/openvino/modeling_diffusion.py
@@ -98,8 +98,6 @@ def __init__(
         ov_config: Optional[Dict[str, str]] = None,
         model_save_dir: Optional[Union[str, Path, TemporaryDirectory]] = None,
         quantization_config: Optional[Union[OVWeightQuantizationConfig, Dict]] = None,
-        vae_decoder_ov_config: Optional[Dict[str, str]] = None,
-        vae_encoder_ov_config: Optional[Dict[str, str]] = None,
         **kwargs,
     ):
         self._internal_dict = config
@@ -118,23 +116,15 @@ def __init__(
         else:
             self._model_save_dir = model_save_dir
 
-        default_vae_ov_config = deepcopy(self.ov_config)
-        if "GPU" in self._device:
-            default_vae_ov_config.update({"INFERENCE_PRECISION_HINT": "f32"})
-
-        self.vae_decoder = OVModelVaeDecoder(vae_decoder, self, vae_decoder_ov_config or default_vae_ov_config)
+        self.vae_decoder = OVModelVaeDecoder(vae_decoder, self)
         self.unet = OVModelUnet(unet, self)
         self.text_encoder = OVModelTextEncoder(text_encoder, self) if text_encoder is not None else None
         self.text_encoder_2 = (
             OVModelTextEncoder(text_encoder_2, self, model_name=DIFFUSION_MODEL_TEXT_ENCODER_2_SUBFOLDER)
             if text_encoder_2 is not None
             else None
         )
-        self.vae_encoder = (
-            OVModelVaeEncoder(vae_encoder, self, vae_encoder_ov_config or default_vae_ov_config)
-            if vae_encoder is not None
-            else None
-        )
+        self.vae_encoder = OVModelVaeEncoder(vae_encoder, self) if vae_encoder is not None else None
 
         if "block_out_channels" in self.vae_decoder.config:
             self.vae_scale_factor = 2 ** (len(self.vae_decoder.config["block_out_channels"]) - 1)
@@ -726,6 +716,11 @@ def __call__(self, latent_sample: np.ndarray):
         outputs = self.request(inputs, share_inputs=True)
         return list(outputs.values())
 
+    def _compile(self):
+        if "GPU" in self.device and "INFERENCE_PRECISION_HINT" not in self.ov_config:
+            self.ov_config.update({"INFERENCE_PRECISION_HINT": "f32"})
+        super()._compile()
+
 
 class OVModelVaeEncoder(OVModelPart):
     def __init__(
@@ -742,6 +737,11 @@ def __call__(self, sample: np.ndarray):
         outputs = self.request(inputs, share_inputs=True)
         return list(outputs.values())
 
+    def _compile(self):
+        if "GPU" in self.device and "INFERENCE_PRECISION_HINT" not in self.ov_config:
+            self.ov_config.update({"INFERENCE_PRECISION_HINT": "f32"})
+        super()._compile()
+
 
 class OVStableDiffusionPipeline(OVStableDiffusionPipelineBase, StableDiffusionPipelineMixin):
     def __call__(