fix int8 pipeline init on arm (#2837)

eaidova · web-flow · commit 9ede790a6893 · 2025-03-24T17:58:17.000+04:00
CVS-164848
diff --git a/notebooks/grammar-correction/grammar-correction.ipynb b/notebooks/grammar-correction/grammar-correction.ipynb
@@ -981,6 +981,7 @@
     "        quantized_model_path,\n",
     "        device.value,\n",
     "        calibration_dataset_size=CALIBRATION_DATASET_SIZE,\n",
+    "        additional_args=additional_args\n",
     "    )"
    ]
   },
diff --git a/notebooks/grammar-correction/utils.py b/notebooks/grammar-correction/utils.py
@@ -87,6 +87,7 @@ def get_quantized_pipeline(
     quantized_model_path: Path,
     device: str,
     calibration_dataset_size=CALIBRATION_DATASET_SIZE,
+    additional_args=None,
 ):
     # Get quantized OV model
     quantized_model = quantize(grammar_corrector_pipe, core, quantized_model_path, calibration_dataset_size)
@@ -96,7 +97,8 @@ def get_quantized_pipeline(
     grammar_corrector_model_int8.decoder.model = quantized_model
     grammar_corrector_model_int8.decoder.request = None
     grammar_corrector_model_int8.decoder._compile()
-    grammar_corrector_pipe_int8 = pipeline("text2text-generation", model=grammar_corrector_model_int8, tokenizer=grammar_corrector_tokenizer)
+    additional_args = additional_args or {}
+    grammar_corrector_pipe_int8 = pipeline("text2text-generation", model=grammar_corrector_model_int8, tokenizer=grammar_corrector_tokenizer, **additional_args)
 
     return grammar_corrector_pipe_int8
 

Original file line number	Diff line number	Diff line change
`@@ -981,6 +981,7 @@`
`981`	`981`	`" quantized_model_path,\n",`
`982`	`982`	`" device.value,\n",`
`983`	`983`	`" calibration_dataset_size=CALIBRATION_DATASET_SIZE,\n",`
	`984`	`+ " additional_args=additional_args\n",`
`984`	`985`	`" )"`
`985`	`986`	`]`
`986`	`987`	`},`