openvinotoolkit
diff --git a/‎.gitattributes
+1 b/‎.gitattributes
+1
diff --git a/‎nncf/experimental/onnx/algorithms/quantization/default_quantization.py
+24-18 b/‎nncf/experimental/onnx/algorithms/quantization/default_quantization.py
+24-18
diff --git a/‎nncf/experimental/onnx/graph/metatypes/onnx_ops.py
+38-18 b/‎nncf/experimental/onnx/graph/metatypes/onnx_ops.py
+38-18
diff --git a/‎nncf/experimental/onnx/graph/nncf_graph_builder.py
+2-2 b/‎nncf/experimental/onnx/graph/nncf_graph_builder.py
+2-2
diff --git a/‎nncf/experimental/onnx/hardware/fused_patterns.py
+3-3 b/‎nncf/experimental/onnx/hardware/fused_patterns.py
+3-3
diff --git a/‎nncf/experimental/onnx/hardware/pattern_operations.py
+2-1 b/‎nncf/experimental/onnx/hardware/pattern_operations.py
+2-1
diff --git a/‎nncf/experimental/onnx/hardware/patterns.py
+16-7 b/‎nncf/experimental/onnx/hardware/patterns.py
+16-7
diff --git a/‎tests/onnx/data/models/icnet_camvid.onnx
+3 b/‎tests/onnx/data/models/icnet_camvid.onnx
+3
diff --git a/‎tests/onnx/data/models/tiny-yolov2.onnx
+3 b/‎tests/onnx/data/models/tiny-yolov2.onnx
+3
diff --git a/‎tests/onnx/data/models/unet_camvid.onnx
+3 b/‎tests/onnx/data/models/unet_camvid.onnx
+3
diff --git a/‎tests/onnx/data/models/yolov2-coco-9.onnx
+3 b/‎tests/onnx/data/models/yolov2-coco-9.onnx
+3
@@ -1,6 +1,7 @@
 *.png filter=lfs diff=lfs merge=lfs -text
 *.jpg filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
 
 * text=auto eol=lf
 *.{tfrecord,h5} binary
@@ -12,30 +12,36 @@
 """
 
 from nncf.common.quantization.quantizer_propagation.structs import QuantizationTrait
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import ConvolutionMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import LinearMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import SigmoidMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import GlobalAveragePoolMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import AddLayerMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import MulLayerMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import ConcatLayerMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import BatchNormMetatype
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import ResizeMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXConvolutionMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXLinearMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXSigmoidMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXHardSigmoidMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXAveragePoolMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXGlobalAveragePoolMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXAddLayerMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXMulLayerMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXConcatLayerMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXBatchNormMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXResizeMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXSoftmaxMetatype
 
 from nncf.common.graph.operator_metatypes import UnknownMetatype
 
 DEFAULT_ONNX_QUANT_TRAIT_TO_OP_DICT = {
     QuantizationTrait.INPUTS_QUANTIZABLE: [
-        ConvolutionMetatype,
-        LinearMetatype,
-        GlobalAveragePoolMetatype,
-        AddLayerMetatype,
-        MulLayerMetatype,
-        BatchNormMetatype,
-        ResizeMetatype,
+        ONNXConvolutionMetatype,
+        ONNXLinearMetatype,
+        ONNXAveragePoolMetatype,
+        ONNXGlobalAveragePoolMetatype,
+        ONNXAddLayerMetatype,
+        ONNXMulLayerMetatype,
+        ONNXBatchNormMetatype,
+        ONNXHardSigmoidMetatype,
+        ONNXResizeMetatype,
     ],
-    QuantizationTrait.NON_QUANTIZABLE: [SigmoidMetatype,
+    QuantizationTrait.NON_QUANTIZABLE: [ONNXSigmoidMetatype,
+                                        ONNXSoftmaxMetatype,
                                         UnknownMetatype],
-    QuantizationTrait.CONCAT: [ConcatLayerMetatype],
+    QuantizationTrait.CONCAT: [ONNXConcatLayerMetatype],
     QuantizationTrait.OUTPUT_QUANTIZATION_AS_WEIGHTS: []
 }
@@ -30,114 +30,134 @@ def get_all_aliases(cls) -> List[str]:
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ConvolutionMetatype(ONNXOpMetatype):
+class ONNXConvolutionMetatype(ONNXOpMetatype):
     name = 'ConvOp'
     op_names = ['Conv']
     hw_config_names = [HWConfigOpName.CONVOLUTION]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class LinearMetatype(ONNXOpMetatype):
+class ONNXLinearMetatype(ONNXOpMetatype):
     name = 'LinearOp'
     op_names = ['Gemm']
     hw_config_names = [HWConfigOpName.MATMUL]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ReluMetatype(ONNXOpMetatype):
+class ONNXReluMetatype(ONNXOpMetatype):
     name = 'ReluOp'
     op_names = ['Relu', 'Clip']
 
 
 @ONNX_OPERATION_METATYPES.register()
-class SigmoidMetatype(ONNXOpMetatype):
+class ONNXSigmoidMetatype(ONNXOpMetatype):
     name = 'SigmoidOp'
     op_names = ['Sigmoid']
 
 
 @ONNX_OPERATION_METATYPES.register()
-class GlobalAveragePoolMetatype(ONNXOpMetatype):
+class ONNXHardSigmoidMetatype(ONNXOpMetatype):
+    name = 'HardSigmoidOp'
+    op_names = ['HardSigmoid']
+
+
+@ONNX_OPERATION_METATYPES.register()
+class ONNXGlobalAveragePoolMetatype(ONNXOpMetatype):
     name = 'GlobalAveragePoolOp'
     op_names = ['GlobalAveragePool']
     hw_config_names = [HWConfigOpName.AVGPOOL]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class MaxPoolMetatype(ONNXOpMetatype):
+class ONNXAveragePoolMetatype(ONNXOpMetatype):
+    name = 'AveragePoolOp'
+    op_names = ['AveragePool']
+    hw_config_names = [HWConfigOpName.AVGPOOL]
+
+
+@ONNX_OPERATION_METATYPES.register()
+class ONNXMaxPoolMetatype(ONNXOpMetatype):
     name = 'MaxPoolOp'
     op_names = ['MaxPool']
     hw_config_names = [HWConfigOpName.MAXPOOL]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ConstantMetatype(ONNXOpMetatype):
+class ONNXConstantMetatype(ONNXOpMetatype):
     name = 'ConstantOp'
     op_names = ['Constant']
 
 
 @ONNX_OPERATION_METATYPES.register()
-class AddLayerMetatype(ONNXOpMetatype):
+class ONNXAddLayerMetatype(ONNXOpMetatype):
     name = 'AddOp'
     op_names = ['Add']
     hw_config_names = [HWConfigOpName.ADD]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class MulLayerMetatype(ONNXOpMetatype):
+class ONNXMulLayerMetatype(ONNXOpMetatype):
     name = 'MulOp'
     op_names = ['Mul']
     hw_config_names = [HWConfigOpName.MULTIPLY]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class SumMetatype(ONNXOpMetatype):
+class ONNXSumMetatype(ONNXOpMetatype):
     name = 'SumOp'
     op_names = ['Sum']
     hw_config_names = [HWConfigOpName.REDUCESUM]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ConcatLayerMetatype(ONNXOpMetatype):
+class ONNXConcatLayerMetatype(ONNXOpMetatype):
     name = 'ConcatOp'
     op_names = ['Concat']
     hw_config_names = [HWConfigOpName.CONCAT]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class BatchNormMetatype(ONNXOpMetatype):
+class ONNXBatchNormMetatype(ONNXOpMetatype):
     name = 'BatchNormalizationOp'
     op_names = ['BatchNormalization']
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ResizeMetatype(ONNXOpMetatype):
+class ONNXResizeMetatype(ONNXOpMetatype):
     name = 'ResizeOp'
     op_names = ['Resize']
+    hw_config_names = [HWConfigOpName.INTERPOLATE]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class ReshapeMetatype(ONNXOpMetatype):
+class ONNXReshapeMetatype(ONNXOpMetatype):
     name = 'ReshapeOp'
     op_names = ['Reshape']
     hw_config_names = [HWConfigOpName.RESHAPE]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class TransposeMetatype(ONNXOpMetatype):
+class ONNXTransposeMetatype(ONNXOpMetatype):
     name = 'TransposeOp'
     op_names = ['Transpose']
     hw_config_names = [HWConfigOpName.TRANSPOSE]
 
 
 @ONNX_OPERATION_METATYPES.register()
-class FlattenMetatype(ONNXOpMetatype):
+class ONNXFlattenMetatype(ONNXOpMetatype):
     name = 'FlattenOp'
     op_names = ['Flatten']
     hw_config_names = [HWConfigOpName.FLATTEN]
 
 
-GENERAL_WEIGHT_LAYER_METATYPES = [ConvolutionMetatype,
-                                  LinearMetatype]
+@ONNX_OPERATION_METATYPES.register()
+class ONNXSoftmaxMetatype(ONNXOpMetatype):
+    name = 'SoftmaxOp'
+    op_names = ['Softmax']
+
+
+GENERAL_WEIGHT_LAYER_METATYPES = [ONNXConvolutionMetatype,
+                                  ONNXLinearMetatype]
 
 
 def get_operator_metatypes() -> List[Type[OperatorMetatype]]:
 
@@ -26,7 +26,7 @@
 
 from nncf.experimental.onnx.graph.onnx_graph import ONNXGraph
 from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNX_OPERATION_METATYPES
-from nncf.experimental.onnx.graph.metatypes.onnx_ops import ConstantMetatype
+from nncf.experimental.onnx.graph.metatypes.onnx_ops import ONNXConstantMetatype
 
 
 class GraphConverter:
@@ -48,7 +48,7 @@ def create_nncf_graph(onnx_model: ModelProto) -> NNCFGraph:
             node_name = node.name
             node_type = node.op_type
             metatype = ONNX_OPERATION_METATYPES.get_operator_metatype_by_op_name(node_type)
-            if metatype == ConstantMetatype:  # We don't need to quantize Constants
+            if metatype == ONNXConstantMetatype:  # We don't need to quantize Constants
                 continue
             nncf_graph.add_nncf_node(node_name=node_name,
                                      node_type=node_type,
 
@@ -20,7 +20,7 @@
 from nncf.experimental.onnx.hardware.pattern_operations import ARITHMETIC_OPERATIONS
 from nncf.experimental.onnx.hardware.pattern_operations import MATMUL_OPERATIONS
 
-from nncf.experimental.onnx.hardware.patterns import create_h_sigmoid_act
+from nncf.experimental.onnx.hardware.patterns import create_swish_activation
 from nncf.experimental.onnx.hardware.patterns import create_input_preprocessing_pattern
 
 
@@ -41,8 +41,8 @@ def _get_onnx_hw_fused_patterns() -> HWFusedPatterns:
 
     atomic_activations = GraphPattern()
     atomic_activations.add_node(**ATOMIC_ACTIVATIONS_OPERATIONS)
-    h_sigmoid = create_h_sigmoid_act()
-    activations = atomic_activations | h_sigmoid
+    swish = create_swish_activation()
+    activations = atomic_activations | swish
     hw_fused_patterns.register(activations, 'ACTIVATIONS', match=False)
 
     arithmetic_ops = GraphPattern()
 
@@ -14,7 +14,8 @@
 from nncf.common.graph.patterns import merge_two_types_of_operations
 
 LINEAR_OPERATIONS = {'type': ['Conv',
-                              'ConvTranspose'
+                              'ConvTranspose',
+                              'Gemm'
                               ],
                      'label': 'LINEAR'}
 
 
@@ -15,16 +15,25 @@
 from nncf.common.graph.patterns import GraphPattern
 
 
-def create_h_sigmoid_act() -> GraphPattern:
+def create_swish_activation() -> GraphPattern:
     pattern = GraphPattern()
 
-    input_pattern_node = pattern.add_node(label='*INPUT_NODE*', type=GraphPattern.NON_PATTERN_NODE_TYPE)
-    sigmoid_node = pattern.add_node(label='SIGMOID', type='Sigmoid')
-    mul_node = pattern.add_node(label='MUL', type='Mul')
+    input_pattern_node_1 = pattern.add_node(label='*INPUT_NODE*', type=GraphPattern.NON_PATTERN_NODE_TYPE)
+    sigmoid_node_1 = pattern.add_node(label='SIGMOID', type='Sigmoid')
+    mul_node_1 = pattern.add_node(label='MUL', type='Mul')
+
+    pattern.add_edge(input_pattern_node_1, sigmoid_node_1)
+    pattern.add_edge(input_pattern_node_1, mul_node_1)
+    pattern.add_edge(sigmoid_node_1, mul_node_1)
+
+    input_pattern_node_2 = pattern.add_node(label='*INPUT_NODE*', type=GraphPattern.NON_PATTERN_NODE_TYPE)
+    sigmoid_node_2 = pattern.add_node(label='HARDSIGMOID', type='HardSigmoid')
+    mul_node_2 = pattern.add_node(label='MUL', type='Mul')
+
+    pattern.add_edge(input_pattern_node_2, sigmoid_node_2)
+    pattern.add_edge(input_pattern_node_2, mul_node_2)
+    pattern.add_edge(sigmoid_node_2, mul_node_2)
 
-    pattern.add_edge(input_pattern_node, sigmoid_node)
-    pattern.add_edge(input_pattern_node, mul_node)
-    pattern.add_edge(sigmoid_node, mul_node)
     return pattern
 
 
 
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:850a301f8a10fdf8518901771c4046b7338b50f267cbcb08d44f2bbd29634671
+size 26922489
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:87befe217358b6beda0b496536b17216ebddef8f70e8d86fe34ed089bb577289
+size 63480982
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:defa8b5aebf1056dbfed1defbb1f02e9db578ee3d331c3a1a74dc3bda079d742
+size 124241889
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:a2c44ecf4860acdf03193d41b7d2957637d0b14b8a9e339463b892b0acb9a12f
+size 203948401
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:850a301f8a10fdf8518901771c4046b7338b50f267cbcb08d44f2bbd29634671`
	`3`	`+size 26922489`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:87befe217358b6beda0b496536b17216ebddef8f70e8d86fe34ed089bb577289`
	`3`	`+size 63480982`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:defa8b5aebf1056dbfed1defbb1f02e9db578ee3d331c3a1a74dc3bda079d742`
	`3`	`+size 124241889`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+version https://git-lfs.github.com/spec/v1`
	`2`	`+oid sha256:a2c44ecf4860acdf03193d41b7d2957637d0b14b8a9e339463b892b0acb9a12f`
	`3`	`+size 203948401`