huggingface · echarlaix · Jan 27, 2025 · Jan 27, 2025 · Jan 27, 2025 · Jan 27, 2025
diff --git a/optimum/intel/openvino/quantization.py b/optimum/intel/openvino/quantization.py
@@ -1083,7 +1083,7 @@ def _full_quantization(
     quantized_model = nncf.quantize(
         model,
         calibration_dataset,
-        subset_size=quantization_config.num_samples,
+        subset_size=quantization_config.num_samples if quantization_config.num_samples else 128,
-        subset_size=quantization_config.num_samples if quantization_config.num_samples else 128,
+        subset_size=quantization_config.num_samples if quantization_config.num_samples else 300,
-        subset_size=quantization_config.num_samples if quantization_config.num_samples else 128,
+        subset_size=quantization_config.num_samples if quantization_config.num_samples else 300,
         ignored_scope=quantization_config.get_ignored_scope_instance(),
         model_type=nncf.ModelType(quantization_config.model_type),
         preset=nncf.QuantizationPreset.PERFORMANCE if quantization_config.sym else nncf.QuantizationPreset.MIXED,

diff --git a/tests/openvino/test_exporters_cli.py b/tests/openvino/test_exporters_cli.py
@@ -131,6 +131,14 @@ class OVCLIExportTestCase(unittest.TestCase):
             (13,),
             (16,),
         ),
+        (
+            "text-generation",
+            "llama",
+            "int8",
+            "--dataset wikitext2 --trust-remote-code",
+            (13,),
+            (16,),
+        ),
     ]
 
     TEST_4BIT_CONFIGURATIONS = [