Added embedding layer support and reduce_sum operation.

gmalivenko · gmalivenko · commit 00ac466df0da · 2018-02-19T23:49:08.000+03:00
diff --git a/pytorch2keras/layers.py b/pytorch2keras/layers.py
@@ -444,6 +444,7 @@ def convert_concat(params, w_name, scope_name, inputs, layers, weights):
     """
     print('Converting concat ...')
     concat_nodes = [layers[i] for i in inputs]
+    print (concat_nodes)
     tf_name = w_name + str(random.random())
     cat = keras.layers.Concatenate(name=tf_name, axis=params['axis'])
     layers[scope_name] = cat(concat_nodes)
@@ -569,7 +570,7 @@ def convert_reshape(params, w_name, scope_name, inputs, layers, weights):
 
 def convert_matmul(params, w_name, scope_name, inputs, layers, weights):
     """
-    Convert tanh layer.
+    Convert matmul layer.
 
    Args:
         params: dictionary with layer parameters
@@ -591,7 +592,6 @@ def convert_matmul(params, w_name, scope_name, inputs, layers, weights):
 
         keras_weights = [W]
 
-        print(layers[inputs[0]])
         dense = keras.layers.Dense(
             output_channels,
             weights=keras_weights, use_bias=False, name=tf_name
@@ -601,6 +601,57 @@ def convert_matmul(params, w_name, scope_name, inputs, layers, weights):
         raise AssertionError('Cannot convert matmul layer')
 
 
+def convert_gather(params, w_name, scope_name, inputs, layers, weights):
+    """
+    Convert gather (embedding) layer.
+
+   Args:
+        params: dictionary with layer parameters
+        w_name: name prefix in state_dict
+        scope_name: pytorch scope name
+        inputs: pytorch node inputs
+        layers: dictionary with keras tensors
+        weights: pytorch state_dict
+    """
+    print('Converting embedding ...')
+
+    tf_name = w_name + str(random.random())
+
+    weights_name = '{0}.weight'.format(w_name)
+
+    W = weights[weights_name].numpy()
+    input_channels, output_channels = W.shape
+
+    keras_weights = [W]
+
+    dense = keras.layers.Embedding(
+        input_channels,
+        weights=keras_weights, output_dim=output_channels, name=tf_name
+    )
+    layers[scope_name] = dense(layers[inputs[0]])
+
+
+def convert_reduce_sum(params, w_name, scope_name, inputs, layers, weights):
+    """
+    Convert reduce_sum layer.
+
+   Args:
+        params: dictionary with layer parameters
+        w_name: name prefix in state_dict
+        scope_name: pytorch scope name
+        inputs: pytorch node inputs
+        layers: dictionary with keras tensors
+        weights: pytorch state_dict
+    """
+    print('Converting reduce_sum ...')
+
+    keepdims = params['keepdims'] > 0
+    target_layer = lambda x: keras.backend.sum(x, keepdims=keepdims, axis=params['axes'])
+
+    lambda_layer = keras.layers.Lambda(target_layer)
+    layers[scope_name] = lambda_layer(layers[inputs[0]])
+
+
 AVAILABLE_CONVERTERS = {
     'Conv': convert_conv,
     'ConvTranspose': convert_convtranspose,
@@ -622,4 +673,6 @@ def convert_matmul(params, w_name, scope_name, inputs, layers, weights):
     'Transpose': convert_transpose,
     'Reshape': convert_reshape,
     'MatMul': convert_matmul,
+    'Gather': convert_gather,
+    'ReduceSum': convert_reduce_sum,
 }
diff --git a/tests/embedding.py b/tests/embedding.py
@@ -0,0 +1,41 @@
+import keras  # work around segfault
+import sys
+import numpy as np
+
+import torch
+import torch.nn as nn
+from torch.autograd import Variable
+
+sys.path.append('../pytorch2keras')
+from converter import pytorch_to_keras
+
+
+class TestEmbedding(nn.Module):
+    def __init__(self, input_size):
+        super(TestEmbedding, self).__init__()
+        self.embedd = nn.Embedding(input_size, 100)
+
+    def forward(self, input):
+        return self.embedd(input).sum(dim=0)
+
+
+if __name__ == '__main__':
+    max_error = 0
+    for i in range(100):
+        input_np = np.random.randint(0, 10, (1, 1, 4))
+        input = Variable(torch.LongTensor(input_np))
+
+        simple_net = TestEmbedding(1000)
+        output = simple_net(input)
+
+        k_model = pytorch_to_keras(simple_net, input, (1, 4), verbose=True)
+
+        pytorch_output = output.data.numpy()
+        keras_output = k_model.predict(input_np)
+
+        error = np.max(pytorch_output - keras_output[0])
+        print(error)
+        if max_error < error:
+            max_error = error
+
+    print('Max error: {0}'.format(max_error))