Fix bug for tf.layers when reuse=True (#685)

zsdonghao · Jonathan DEKHTIAR · commit a55daa6b459d · 2018-06-07T21:40:15.000+02:00
* [WIP] rearrange readme and example list

* fixing Conv2d reuse bug

* remove print

* fix bug !

* fix bug

* fix all CNN layers use tf.layers

* run yapf

* changelog

* reposition activation parameter

* activation parameter moved in doc

* fix bug with new function

* fix bug with new function

* test TF Layers for reuse=True added

* 1.8.6rc5 release

* Codacy Cleaning
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -95,6 +95,7 @@ To release a new version, please update the changelog as followed:
 - Layer:
   - ElementwiseLambdaLayer added to use custom function to connect multiple layer inputs (by @One-sixth in #579)
   - AtrousDeConv2dLayer added (by @2wins in #662)
+  - Fix bugs of using `tf.layers` in CNN (by @zsdonghao in #686)
 - Optimizer:
   - AMSGrad Optimizer added based on `On the Convergence of Adam and Beyond (ICLR 2018)` (by @DEKHTIARJonathan in #636)
 - Setup:
@@ -306,5 +307,5 @@ To release a new version, please update the changelog as followed:
 @zsdonghao @luomai @DEKHTIARJonathan
 
 [Unreleased]: https://github.com/tensorlayer/tensorlayer/compare/1.8.5...master
-[1.8.6]: https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc4...1.8.5
+[1.8.6]: https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc5...1.8.5
 [1.8.5]: https://github.com/tensorlayer/tensorlayer/compare/1.8.4...1.8.5
diff --git a/README.md b/README.md
@@ -14,7 +14,7 @@
 
 ![PyPI Stable Version](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/github/release/tensorlayer/tensorlayer.svg?label=PyPI%20-%20Release)
 ![PyPI RC Version](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/github/release/tensorlayer/tensorlayer/all.svg?label=PyPI%20-%20Pre-Release)
-[![Github commits (since latest release)](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/github/commits-since/tensorlayer/tensorlayer/latest.svg)](https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc4...master)
+[![Github commits (since latest release)](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/github/commits-since/tensorlayer/tensorlayer/latest.svg)](https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc5...master)
 [![PyPI - Python Version](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/pypi/pyversions/tensorlayer.svg)](https://pypi.org/project/tensorlayer/)
 [![Supported TF Version](http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/badge/tensorflow-1.6.0+-blue.svg)](https://github.com/tensorflow/tensorflow/releases)
 
diff --git a/README.rst b/README.rst
@@ -40,7 +40,7 @@
     :target: https://pypi.org/project/tensorlayer/
 
 .. image:: http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/github/commits-since/tensorlayer/tensorlayer/latest.svg
-    :target: https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc4...master
+    :target: https://github.com/tensorlayer/tensorlayer/compare/1.8.6rc5...master
 
 .. image:: http://ec2-35-178-47-120.eu-west-2.compute.amazonaws.com/pypi/pyversions/tensorlayer.svg
     :target: https://pypi.org/project/tensorlayer/
diff --git a/tensorlayer/__init__.py b/tensorlayer/__init__.py
@@ -56,7 +56,7 @@
     global_dict = {}
 
 # Use the following formating: (major, minor, patch, prerelease)
-VERSION = (1, 8, 6, "rc4")
+VERSION = (1, 8, 6, "rc5")
 __shortversion__ = '.'.join(map(str, VERSION[:3]))
 __version__ = '.'.join(map(str, VERSION[:3])) + "".join(VERSION[3:])
 
diff --git a/tensorlayer/layers/convolution.py b/tensorlayer/layers/convolution.py
@@ -36,6 +36,15 @@
 ]
 
 
+def _get_collection_trainable(name=''):
+    variables = []
+    for p in tf.trainable_variables():
+        # print(p.name.rpartition('/')[0], self.name)
+        if p.name.rpartition('/')[0] == name:
+            variables.append(p)
+    return variables
+
+
 class Conv1dLayer(Layer):
     """
     The :class:`Conv1dLayer` class is a 1D CNN layer, see `tf.nn.convolution <https://www.tensorflow.org/api_docs/python/tf/nn/convolution>`__.
@@ -382,15 +391,15 @@ class Conv3dLayer(Layer):
     ----------
     prev_layer : :class:`Layer`
         Previous layer.
-    act : activation function
-        The activation function of this layer.
     shape : tuple of int
         Shape of the filters: (filter_depth, filter_height, filter_width, in_channels, out_channels).
     strides : tuple of int
         The sliding window strides for corresponding input dimensions.
         Must be in the same order as the shape dimension.
     padding : str
         The padding algorithm type: "SAME" or "VALID".
+    act : activation function
+        The activation function of this layer.
     W_init : initializer
         The initializer for the weight matrix.
     b_init : initializer or None
@@ -414,10 +423,10 @@ class Conv3dLayer(Layer):
     def __init__(
             self,
             prev_layer,
-            act=None,
             shape=(2, 2, 2, 3, 32),
             strides=(1, 2, 2, 2, 1),
             padding='SAME',
+            act=None,
             W_init=tf.truncated_normal_initializer(stddev=0.02),
             b_init=tf.constant_initializer(value=0.0),
             W_init_args=None,
@@ -1335,7 +1344,9 @@ def __init__(
 
         # _conv1d.dtype = LayersConfig.tf_dtype   # unsupport, it will use the same dtype of inputs
         self.outputs = _conv1d(self.inputs)
-        new_variables = _conv1d.weights  # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        # new_variables = _conv1d.weights  # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
 
         self._add_layers(self.outputs)
         self._add_params(new_variables)
@@ -1455,11 +1466,23 @@ def __init__(
             name=name,
             # reuse=None,
         )
-
-        self.outputs = conv2d(self.inputs)
+        self.outputs = conv2d(self.inputs)  # must put before ``new_variables``
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
+        # new_variables = []
+        # for p in tf.trainable_variables():
+        #     # print(p.name.rpartition('/')[0], self.name)
+        #     if p.name.rpartition('/')[0] == self.name:
+        #         new_variables.append(p)
+        # exit()
+        # TF_GRAPHKEYS_VARIABLES  TF_GRAPHKEYS_VARIABLES
+        # print(self.name, name)
+        # print(tf.trainable_variables())#tf.GraphKeys.TRAINABLE_VARIABLES)
+        # print(new_variables)
+        # print(conv2d.weights)
 
         self._add_layers(self.outputs)
-        self._add_params(conv2d.weights)
+        self._add_params(new_variables)  #conv2d.weights)
 
 
 class DeConv2d(Layer):
@@ -1535,7 +1558,9 @@ def __init__(
         )
 
         self.outputs = conv2d_transpose(self.inputs)
-        new_variables = conv2d_transpose.weights  # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        # new_variables = conv2d_transpose.weights  # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
 
         self._add_layers(self.outputs)
         self._add_params(new_variables)
@@ -1597,21 +1622,16 @@ def __init__(
             )
         )
 
-        with tf.variable_scope(name) as vs:
-
-            nn = tf.layers.Conv3DTranspose(
-                filters=n_filter,
-                kernel_size=filter_size,
-                strides=strides,
-                padding=padding,
-                activation=self.act,
-                kernel_initializer=W_init,
-                bias_initializer=b_init,
-                name=None,
-            )
+        # with tf.variable_scope(name) as vs:
+        nn = tf.layers.Conv3DTranspose(
+            filters=n_filter, kernel_size=filter_size, strides=strides, padding=padding, activation=self.act,
+            kernel_initializer=W_init, bias_initializer=b_init, name=name
+        )
 
-            self.outputs = nn(self.inputs)
-            new_variables = nn.weights  # tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        self.outputs = nn(self.inputs)
+        # new_variables = nn.weights  # tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=vs.name)
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
 
         self._add_layers(self.outputs)
         self._add_params(new_variables)
@@ -1814,33 +1834,35 @@ def __init__(
                 if self.act is not None else 'No Activation'
             )
         )
-        with tf.variable_scope(name) as vs:
-            nn = tf.layers.SeparableConv1D(
-                filters=n_filter,
-                kernel_size=filter_size,
-                strides=strides,
-                padding=padding,
-                data_format=data_format,
-                dilation_rate=dilation_rate,
-                depth_multiplier=depth_multiplier,
-                activation=self.act,
-                use_bias=(True if b_init is not None else False),
-                depthwise_initializer=depthwise_init,
-                pointwise_initializer=pointwise_init,
-                bias_initializer=b_init,
-                # depthwise_regularizer=None,
-                # pointwise_regularizer=None,
-                # bias_regularizer=None,
-                # activity_regularizer=None,
-                # depthwise_constraint=None,
-                # pointwise_constraint=None,
-                # bias_constraint=None,
-                trainable=True,
-                name=None
-            )
+        # with tf.variable_scope(name) as vs:
+        nn = tf.layers.SeparableConv1D(
+            filters=n_filter,
+            kernel_size=filter_size,
+            strides=strides,
+            padding=padding,
+            data_format=data_format,
+            dilation_rate=dilation_rate,
+            depth_multiplier=depth_multiplier,
+            activation=self.act,
+            use_bias=(True if b_init is not None else False),
+            depthwise_initializer=depthwise_init,
+            pointwise_initializer=pointwise_init,
+            bias_initializer=b_init,
+            # depthwise_regularizer=None,
+            # pointwise_regularizer=None,
+            # bias_regularizer=None,
+            # activity_regularizer=None,
+            # depthwise_constraint=None,
+            # pointwise_constraint=None,
+            # bias_constraint=None,
+            trainable=True,
+            name=name
+        )
 
-            self.outputs = nn(self.inputs)
-            new_variables = nn.weights
+        self.outputs = nn(self.inputs)
+        # new_variables = nn.weights
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
 
         self._add_layers(self.outputs)
         self._add_params(new_variables)
@@ -1925,33 +1947,35 @@ def __init__(
             )
         )
 
-        with tf.variable_scope(name) as vs:
-            nn = tf.layers.SeparableConv2D(
-                filters=n_filter,
-                kernel_size=filter_size,
-                strides=strides,
-                padding=padding,
-                data_format=data_format,
-                dilation_rate=dilation_rate,
-                depth_multiplier=depth_multiplier,
-                activation=self.act,
-                use_bias=(True if b_init is not None else False),
-                depthwise_initializer=depthwise_init,
-                pointwise_initializer=pointwise_init,
-                bias_initializer=b_init,
-                # depthwise_regularizer=None,
-                # pointwise_regularizer=None,
-                # bias_regularizer=None,
-                # activity_regularizer=None,
-                # depthwise_constraint=None,
-                # pointwise_constraint=None,
-                # bias_constraint=None,
-                trainable=True,
-                name=None
-            )
+        # with tf.variable_scope(name) as vs:
+        nn = tf.layers.SeparableConv2D(
+            filters=n_filter,
+            kernel_size=filter_size,
+            strides=strides,
+            padding=padding,
+            data_format=data_format,
+            dilation_rate=dilation_rate,
+            depth_multiplier=depth_multiplier,
+            activation=self.act,
+            use_bias=(True if b_init is not None else False),
+            depthwise_initializer=depthwise_init,
+            pointwise_initializer=pointwise_init,
+            bias_initializer=b_init,
+            # depthwise_regularizer=None,
+            # pointwise_regularizer=None,
+            # bias_regularizer=None,
+            # activity_regularizer=None,
+            # depthwise_constraint=None,
+            # pointwise_constraint=None,
+            # bias_constraint=None,
+            trainable=True,
+            name=name
+        )
 
-            self.outputs = nn(self.inputs)
-            new_variables = nn.weights
+        self.outputs = nn(self.inputs)
+        # new_variables = nn.weights
+        # new_variables = tf.get_collection(TF_GRAPHKEYS_VARIABLES, scope=self.name)  #vs.name)
+        new_variables = _get_collection_trainable(self.name)
 
         self._add_layers(self.outputs)
         self._add_params(new_variables)
diff --git a/tests/test_tf_layers.py b/tests/test_tf_layers.py