Add custom model export test (#677)

echarlaix · web-flow · commit 813d7c0fdbe0 · 2024-05-31T14:39:53.000+02:00
* Add  custom model export test

* format
diff --git a/setup.py b/setup.py
@@ -53,7 +53,7 @@
     "transformers_stream_generator",
     "einops",
     "tiktoken",
-    "sentence_transformers",
+    "sentence-transformers",
 ]
 
 QUALITY_REQUIRE = ["black~=23.1", "ruff>=0.0.241"]
diff --git a/tests/openvino/test_export.py b/tests/openvino/test_export.py
@@ -18,8 +18,10 @@
 from tempfile import TemporaryDirectory
 from typing import Optional
 
+import torch
 from parameterized import parameterized
-from transformers import AutoConfig
+from sentence_transformers import SentenceTransformer, models
+from transformers import AutoConfig, AutoTokenizer
 from utils_tests import MODEL_NAMES
 
 from optimum.exporters.onnx.constants import SDPA_ARCHS_ONNX_EXPORT_NOT_SUPPORTED
@@ -124,7 +126,7 @@ def test_export(self, model_type: str):
 
 
 class CustomExportModelTest(unittest.TestCase):
-    def test_export_custom_model(self):
+    def test_custom_export_config_model(self):
         class BertOnnxConfigWithPooler(BertOnnxConfig):
             @property
             def outputs(self):
@@ -157,3 +159,26 @@ def outputs(self):
 
             self.assertIsInstance(ov_model, OVBaseModel)
             self.assertTrue(ov_model.output_names == {"last_hidden_state": 0, "pooler_output": 1})
+
+    def test_export_custom_model(self):
+        model_id = "hf-internal-testing/tiny-random-BertModel"
+        word_embedding_model = models.Transformer(model_id, max_seq_length=256)
+        pooling_model = models.Pooling(word_embedding_model.get_word_embedding_dimension())
+        dense_model = models.Dense(
+            in_features=pooling_model.get_sentence_embedding_dimension(),
+            out_features=256,
+        )
+        model = SentenceTransformer(modules=[word_embedding_model, pooling_model, dense_model])
+
+        with TemporaryDirectory() as tmpdirname:
+            export_from_model(model, output=tmpdirname, task="feature-extraction")
+            ov_model = OVModelForCustomTasks.from_pretrained(tmpdirname)
+
+        tokenizer = AutoTokenizer.from_pretrained(model_id)
+        tokens = tokenizer("This is a sample input", return_tensors="pt")
+        with torch.no_grad():
+            model_outputs = model(tokens)
+
+        ov_outputs = ov_model(**tokens)
+        self.assertTrue(torch.allclose(ov_outputs.token_embeddings, model_outputs.token_embeddings, atol=1e-4))
+        self.assertTrue(torch.allclose(ov_outputs.sentence_embedding, model_outputs.sentence_embedding, atol=1e-4))

Original file line number	Diff line number	Diff line change
`@@ -53,7 +53,7 @@`
`53`	`53`	`"transformers_stream_generator",`
`54`	`54`	`"einops",`
`55`	`55`	`"tiktoken",`
`56`		`- "sentence_transformers",`
	`56`	`+ "sentence-transformers",`
`57`	`57`	`]`
`58`	`58`
`59`	`59`	`QUALITY_REQUIRE = ["black~=23.1", "ruff>=0.0.241"]`