Added rewriter for specific pattern in a 1P model (#1380)

TomWildenhain-Microsoft · web-flow · commit b540e3c5ed52 · 2021-03-10T12:32:18.000-05:00
* Added rewriter for specific pattern in a 1P model

Signed-off-by: Tom Wildenhain &lt;tomwi@microsoft.com&gt;

* Improved documentation of rewriter

Signed-off-by: Tom Wildenhain &lt;tomwi@microsoft.com&gt;
diff --git a/tests/test_backend.py b/tests/test_backend.py
@@ -226,6 +226,23 @@ def func(x, y):
             return tf.identity(op, name=_TFOUTPUT)
         self._run_test_case(func, [_OUTPUT], {_INPUT: x_val, _INPUT1: y_val})
 
+    @check_opset_min_version(9, "ConstantOfShape")
+    def test_layer_normalization(self):
+        x_val = make_xval([3, 4, 5])
+        scale_val = make_xval([3, 4, 5]) * 0.2
+        bias_val = make_xval([3, 4, 5]) * 0.1
+        def func(x):
+            mean = tf.reduce_mean(x, axis=[2], keepdims=True)
+            centered = tf.subtract(x, mean)
+            variance = tf.add(tf.reduce_mean(tf.square(centered), axis=[2], keepdims=True), 0.001)
+            inv_std_dev = tf.math.rsqrt(variance)
+            normalized = tf.multiply(centered, inv_std_dev)
+            scaled = tf.multiply(normalized, scale_val)
+            biased = tf.add(scaled, bias_val)
+            return tf.identity(biased, name=_TFOUTPUT)
+        self._run_test_case(func, [_OUTPUT], {_INPUT: x_val}, rtol=1e-05,
+                            graph_validator=lambda g: (check_op_count(g, "InstanceNormalization", 1)))
+
     @check_opset_min_version(9, "ConstantOfShape")
     def test_eye_non_const1(self):
         # tf.eye(num_rows), num_rows is not const here
diff --git a/tf2onnx/graph_matcher.py b/tf2onnx/graph_matcher.py
@@ -28,7 +28,7 @@
 class OpTypePattern(object):
     """A tree pattern that matches TF expressions with certain op types."""
 
-    def __init__(self, op_type, name=None, inputs=None):
+    def __init__(self, op_type, name=None, inputs=None, allow_reorder=None):
         """Initializes an OpTypePattern.
 
         Args:
@@ -43,9 +43,12 @@ def __init__(self, op_type, name=None, inputs=None):
           inputs: Optional list of `OpTypePattern`s or strings that specify the
             patterns for the inputs of a matching op. If None, this pattern accepts
             any inputs of a matching op.
+          allow_reorder: Optional boolean that overrides allow_reorder in GraphMatcher
+            for this pattern's immediate inputs.
         """
         self._op_type = op_type
         self._name = name
+        self.allow_reorder = allow_reorder
         if inputs is None:
             inputs = []
         self._inputs = [
@@ -202,7 +205,10 @@ def _match_pattern(self, pattern, op, tensor):
         if not op or len(op.inputs) != len(pattern.inputs):
             return False, match_list
 
-        if self._allow_reorder:
+        allow_reorder = pattern.allow_reorder
+        if allow_reorder is None:
+            allow_reorder = self._allow_reorder
+        if allow_reorder:
             pattern_inputs_list = permutations(pattern.inputs)
         else:
             pattern_inputs_list = [pattern.inputs]
diff --git a/tf2onnx/rewriter/__init__.py b/tf2onnx/rewriter/__init__.py
@@ -22,6 +22,7 @@
 from tf2onnx.rewriter.transpose_rewriter import rewrite_transpose
 from tf2onnx.rewriter.conv2d_with_add_rewriter import rewrite_biasadd_with_conv2d
 from tf2onnx.rewriter.quantization_ops_rewriter import rewrite_quantize_and_dequantize
+from tf2onnx.rewriter.layer_normalization_rewriter import rewrite_layer_normalization
 
 
 __all__ = [
@@ -44,5 +45,6 @@
     "rewrite_custom_rnn_cell",
     "rewrite_generic_loop",
     "rewrite_biasadd_with_conv2d",
-    "rewrite_quantize_and_dequantize"
+    "rewrite_quantize_and_dequantize",
+    "rewrite_layer_normalization"
 ]
diff --git a/tf2onnx/rewriter/layer_normalization_rewriter.py b/tf2onnx/rewriter/layer_normalization_rewriter.py
@@ -0,0 +1,123 @@
+# SPDX-License-Identifier: Apache-2.0
+
+
+"""
+tf2onnx.rewrite - Rewrites a pattern from the tf layer_norm contrib op.
+Converts a mean/variance normalization pattern (using ReduceMean, RSqrt, Sub, Mul, etc.) into InstanceNormalization
+"""
+from onnx import TensorProto, helper
+from tf2onnx.graph_matcher import OpTypePattern, GraphMatcher
+from tf2onnx.graph_builder import GraphBuilder
+
+
+# pylint: disable=missing-docstring
+
+def rewrite_layer_normalization(g, ops):
+    # Needs ConstantOfShape
+    if g.opset <= 9:
+        return ops
+
+    inner_pattern = \
+        OpTypePattern('Rsqrt', inputs=[
+            OpTypePattern('Add', inputs=[
+                OpTypePattern('Mean', allow_reorder=False, inputs=[
+                    OpTypePattern('Square', inputs=[
+                        OpTypePattern('Sub', allow_reorder=False, inputs=[
+                            OpTypePattern('*', name='input'),
+                            OpTypePattern('Mean', name='mean', allow_reorder=False, inputs=[
+                                OpTypePattern('*', name='input_r2'),
+                                OpTypePattern('Const|ConstV2', name='mean_axes')
+                            ])
+                        ])
+                    ]),
+                    OpTypePattern('Const|ConstV2', name='variance_axes')
+                ]),
+                OpTypePattern('Const|ConstV2', name='epsilon')
+            ])
+        ])
+
+    pattern0 = \
+        OpTypePattern('Add', name='bias_add', inputs=[
+            OpTypePattern('Mul', name='scale_mul', inputs=[
+                OpTypePattern('Mul', inputs=[
+                    inner_pattern,
+                    OpTypePattern('*', name='scale')
+                ]),
+                OpTypePattern('Sub', inputs=[
+                    OpTypePattern('*', name='input_r3'),
+                    OpTypePattern('Mean', name='mean_r2')
+                ])
+            ]),
+            OpTypePattern('*', name='bias')
+        ])
+    pattern1 = \
+        OpTypePattern('Add', name='bias_add', inputs=[
+            OpTypePattern('Mul', name='scale_mul', inputs=[
+                OpTypePattern('Mul', inputs=[
+                    inner_pattern,
+                    OpTypePattern('Sub', inputs=[
+                        OpTypePattern('*', name='input_r3'),
+                        OpTypePattern('Mean', name='mean_r2')
+                    ])
+                ]),
+                OpTypePattern('*', name='scale')
+            ]),
+            OpTypePattern('*', name='bias'),
+        ])
+    pattern2 = \
+        OpTypePattern('Add', name='bias_add', inputs=[
+            OpTypePattern('Mul', name='scale_mul', inputs=[
+                OpTypePattern('Mul', inputs=[
+                    OpTypePattern('*', name='scale'),
+                    OpTypePattern('Sub', inputs=[
+                        OpTypePattern('*', name='input_r3'),
+                        OpTypePattern('Mean', name='mean_r2')
+                    ])
+                ]),
+                inner_pattern
+            ]),
+            OpTypePattern('*', name='bias'),
+        ])
+
+    pattern_list = [pattern0, pattern1, pattern2]
+
+    for pattern in pattern_list:
+        matcher = GraphMatcher(pattern, allow_reorder=True)
+        match_results = list(matcher.match_ops(ops))
+        if match_results:
+            for match in match_results:
+                inp_node = match.get_op('input')
+                rank = g.get_rank(inp_node.output[0])
+                node = match.get_op('bias_add')
+                if inp_node.name != match.get_op('input_r2').name or inp_node.name != match.get_op('input_r3').name:
+                    continue
+                if match.get_op('mean').name != match.get_op('mean_r2').name:
+                    continue
+                inp = match.get_op('mean').input[0]
+                if rank != 3:
+                    continue
+                mean_axes = match.get_op('mean_axes').get_tensor_value(as_list=True)
+                variance_axes = match.get_op('variance_axes').get_tensor_value(as_list=True)
+                mean_axes = [a % rank for a in mean_axes]
+                variance_axes = [a % rank for a in variance_axes]
+                if mean_axes != [2] or variance_axes != [2]:
+                    continue
+                epsilon = match.get_op('epsilon').get_tensor_value(as_list=False).flatten().tolist()
+                if len(epsilon) != 1:
+                    continue
+                scale = match.get_op('scale').output[0]
+                bias = match.get_op('bias').output[0]
+                shape = g.make_node("Shape", [inp]).output[0]
+                dim_2_shape = GraphBuilder(g).make_slice(
+                    {"data": shape, "ends": [2], "starts": [1], "axes": [0]})
+                zero_tensor = helper.make_tensor("value", TensorProto.FLOAT, dims=[1], vals=[0])
+                one_tensor = helper.make_tensor("value", TensorProto.FLOAT, dims=[1], vals=[1])
+                zeros_of_shape = g.make_node("ConstantOfShape", [dim_2_shape], attr={'value': zero_tensor}).output[0]
+                ones_of_shape = g.make_node("ConstantOfShape", [dim_2_shape], attr={'value': one_tensor}).output[0]
+                norm = g.make_node("InstanceNormalization", [inp, ones_of_shape, zeros_of_shape],
+                                   attr={'epsilon': epsilon[0]}, op_name_scope=node.name).output[0]
+                mul = g.make_node("Mul", [norm, scale]).output[0]
+                add = g.make_node("Add", [mul, bias]).output[0]
+                g.replace_all_inputs(node.output[0], add)
+                g.remove_node(node.name)
+    return ops
diff --git a/tf2onnx/tfonnx.py b/tf2onnx/tfonnx.py
@@ -616,6 +616,7 @@ def compat_handler(ctx, node, **kwargs):
         rewrite_custom_rnn_cell,
         rewrite_generic_loop, rewrite_cond,
         rewrite_biasadd_with_conv2d,
+        rewrite_layer_normalization,
         rewrite_gemm,
     ]
 

Original file line number	Diff line number	Diff line change
`@@ -616,6 +616,7 @@ def compat_handler(ctx, node, **kwargs):`
`616`	`616`	`rewrite_custom_rnn_cell,`
`617`	`617`	`rewrite_generic_loop, rewrite_cond,`
`618`	`618`	`rewrite_biasadd_with_conv2d,`
	`619`	`+ rewrite_layer_normalization,`
`619`	`620`	`rewrite_gemm,`
`620`	`621`	`]`
`621`	`622`