shenweichen
diff --git a/‎README.md‎
Lines changed: 2 additions & 1 deletion b/‎README.md‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎deepctr/__init__.py‎
Lines changed: 1 addition & 1 deletion b/‎deepctr/__init__.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎deepctr/inputs.py‎
Lines changed: 22 additions & 11 deletions b/‎deepctr/inputs.py‎
Lines changed: 22 additions & 11 deletions
diff --git a/‎deepctr/layers/__init__.py‎
Lines changed: 2 additions & 1 deletion b/‎deepctr/layers/__init__.py‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎deepctr/layers/sequence.py‎
Lines changed: 79 additions & 49 deletions b/‎deepctr/layers/sequence.py‎
Lines changed: 79 additions & 49 deletions
diff --git a/‎deepctr/layers/utils.py‎
Lines changed: 6 additions & 1 deletion b/‎deepctr/layers/utils.py‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎deepctr/models/din.py‎
Lines changed: 2 additions & 2 deletions b/‎deepctr/models/din.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎deepctr/models/dsin.py‎
Lines changed: 3 additions & 4 deletions b/‎deepctr/models/dsin.py‎
Lines changed: 3 additions & 4 deletions
@@ -51,4 +51,5 @@ Let's [**Get Started!**](https://deepctr-doc.readthedocs.io/en/latest/Quick-Star
 Please follow our wechat to join group:  
 - 公众号：**浅梦的学习笔记**  
 - wechat ID: **deepctrbot**
-![wechat](./docs/pics/weichennote.png)
+
+  ![wechat](./docs/pics/weichennote.png)
@@ -2,5 +2,5 @@
 from . import models
 from .utils import check_version
 
-__version__ = '0.6.2'
+__version__ = '0.6.3'
 check_version(__version__)
@@ -13,7 +13,7 @@
 from tensorflow.python.keras.layers import  Embedding, Input, Flatten
 from tensorflow.python.keras.regularizers import l2
 
-from .layers.sequence import SequencePoolingLayer, SequenceMultiplyLayer
+from .layers.sequence import SequencePoolingLayer, WeightedSequenceLayer
 from .layers.utils import Hash,concat_fun,Linear
 
 class SparseFeat(namedtuple('SparseFeat', ['name', 'dimension', 'use_hash', 'dtype','embedding_name','embedding'])):
@@ -28,7 +28,7 @@ def __hash__(self):
         return self.name.__hash__()
 
     def __eq__(self, other):
-        if self.name == other.name:
+        if self.name == other.name and self.embedding_name == other.embedding_name:
             return True
         return False
 
@@ -53,13 +53,13 @@ def __eq__(self, other):
     def __repr__(self):
         return 'DenseFeat:'+self.name
 
-class VarLenSparseFeat(namedtuple('VarLenFeat', ['name', 'dimension', 'maxlen', 'combiner', 'use_hash', 'dtype','embedding_name','embedding'])):
+class VarLenSparseFeat(namedtuple('VarLenFeat', ['name', 'dimension', 'maxlen', 'combiner', 'use_hash', 'dtype','weight_name','embedding_name','embedding'])):
     __slots__ = ()
 
-    def __new__(cls, name, dimension, maxlen, combiner="mean", use_hash=False, dtype="float32", embedding_name=None,embedding=True):
+    def __new__(cls, name, dimension, maxlen,combiner="mean", use_hash=False, dtype="float32", weight_name=None,embedding_name=None,embedding=True):
         if embedding_name is None:
             embedding_name = name
-        return super(VarLenSparseFeat, cls).__new__(cls, name, dimension, maxlen, combiner, use_hash, dtype, embedding_name,embedding)
+        return super(VarLenSparseFeat, cls).__new__(cls, name, dimension, maxlen, combiner, use_hash, dtype,weight_name, embedding_name,embedding)
 
     def __hash__(self):
         return self.name.__hash__()
@@ -72,6 +72,7 @@ def __eq__(self, other):
     def __repr__(self):
         return 'VarLenSparseFeat:'+self.name
 
+
 def get_feature_names(feature_columns):
     features = build_input_features(feature_columns)
     return list(features.keys())
@@ -95,6 +96,9 @@ def build_input_features(feature_columns, mask_zero=True, prefix=''):
                 input_features[fc.name + "_seq_length"] = Input(shape=(
                     1,), name=prefix + 'seq_length_' + fc.name)
                 input_features[fc.name + "_seq_max_length"] = fc.maxlen
+            if fc.weight_name is not None:
+                input_features[fc.weight_name] = Input(shape=(fc.maxlen,1),name=prefix + fc.weight_name ,dtype="float32")
+
         else:
             raise TypeError("Invalid feature column type,got",type(fc))
 
@@ -201,7 +205,7 @@ def embedding_lookup(sparse_embedding_dict,sparse_input_dict,sparse_feature_colu
     for fc in sparse_feature_columns:
         feature_name = fc.name
         embedding_name = fc.embedding_name
-        if len(return_feat_list) == 0  or feature_name in return_feat_list and fc.embedding:
+        if (len(return_feat_list) == 0  or feature_name in return_feat_list ) and fc.embedding:
             if fc.use_hash:
                 lookup_idx = Hash(fc.dimension,mask_zero=(feature_name in mask_feat_list))(sparse_input_dict[feature_name])
             else:
@@ -221,7 +225,6 @@ def varlen_embedding_lookup(embedding_dict, sequence_input_dict, varlen_sparse_f
         else:
             lookup_idx = sequence_input_dict[feature_name]
         varlen_embedding_vec_dict[feature_name] = embedding_dict[embedding_name](lookup_idx)
-
     return varlen_embedding_vec_dict
 
 def get_varlen_pooling_list(embedding_dict, features, varlen_sparse_feature_columns):
@@ -231,11 +234,19 @@ def get_varlen_pooling_list(embedding_dict, features, varlen_sparse_feature_colu
         combiner = fc.combiner
         feature_length_name = feature_name + '_seq_length'
         if feature_length_name in features:
+            if fc.weight_name is not None:
+                seq_input =WeightedSequenceLayer()([embedding_dict[feature_name],features[feature_length_name],features[fc.weight_name]])
+            else:
+                seq_input = embedding_dict[feature_name]
             vec = SequencePoolingLayer(combiner, supports_masking=False)(
-            [embedding_dict[feature_name], features[feature_length_name]])
+            [seq_input, features[feature_length_name]])
         else:
+            if fc.weight_name is not None:
+                seq_input =WeightedSequenceLayer(supports_masking=True)([embedding_dict[feature_name],features[fc.weight_name]])
+            else:
+                seq_input = embedding_dict[feature_name]
             vec = SequencePoolingLayer(combiner, supports_masking=True)(
-            embedding_dict[feature_name])
+            seq_input)
         pooling_vec_list.append(vec)
     return pooling_vec_list
 
@@ -252,12 +263,12 @@ def get_varlen_multiply_list(embedding_dict, features, varlen_sparse_feature_col
             else:
                 raise TypeError("Invalid feature column type,got",type(value_feature))
             if key_feature_length_name in features:
-                varlen_vec = SequenceMultiplyLayer(supports_masking=False)(
+                varlen_vec = WeightedSequenceLayer()(
                     [embedding_dict[key_feature.name], features[key_feature_length_name], value_input])
                 vec = SequencePoolingLayer('sum', supports_masking=False)(
                     [varlen_vec, features[key_feature_length_name]])
             else:
-                varlen_vec = SequenceMultiplyLayer(supports_masking=True)(
+                varlen_vec = WeightedSequenceLayer(supports_masking=True)(
                     [embedding_dict[key_feature.name], value_input])
                 vec = SequencePoolingLayer('sum', supports_masking=True)( varlen_vec)
             multiply_vec_list.append(vec)
 
@@ -7,7 +7,7 @@
                           OutterProductLayer, FGCNNLayer,SENETLayer,BilinearInteraction)
 from .normalization import LayerNormalization
 from .sequence import (AttentionSequencePoolingLayer, BiasEncoding, BiLSTM,
-                       KMaxPooling, SequencePoolingLayer,
+                       KMaxPooling, SequencePoolingLayer,WeightedSequenceLayer,
                        Transformer, DynamicGRU)
 from .utils import NoMask, Hash,Linear
 
@@ -38,4 +38,5 @@
                   'DynamicGRU': DynamicGRU,
                   'SENETLayer':SENETLayer,
                   'BilinearInteraction':BilinearInteraction,
+                  'WeightedSequenceLayer':WeightedSequenceLayer
                   }
@@ -46,7 +46,7 @@ def __init__(self, mode='mean', supports_masking=False, **kwargs):
         if mode not in ['sum', 'mean', 'max']:
             raise ValueError("mode must be sum or mean")
         self.mode = mode
-        self.eps = 1e-8
+        self.eps = tf.constant(1e-8,tf.float32)
         super(SequencePoolingLayer, self).__init__(**kwargs)
 
         self.supports_masking = supports_masking
@@ -85,7 +85,7 @@ def call(self, seq_value_len_list, mask=None, **kwargs):
         hist = reduce_sum(hist, 1, keep_dims=False)
 
         if self.mode == "mean":
-            hist = div(hist, user_behavior_length + self.eps)
+            hist = div(hist, tf.cast(user_behavior_length,tf.float32) + self.eps)
 
         hist = tf.expand_dims(hist, axis=1)
         return hist
@@ -105,6 +105,83 @@ def get_config(self, ):
         return dict(list(base_config.items()) + list(config.items()))
 
 
+class WeightedSequenceLayer(Layer):
+    """The WeightedSequenceLayer is used to apply weight score on variable-length sequence feature/multi-value feature.
+
+      Input shape
+        - A list of two  tensor [seq_value,seq_len,seq_weight]
+
+        - seq_value is a 3D tensor with shape: ``(batch_size, T, embedding_size)``
+
+        - seq_len is a 2D tensor with shape : ``(batch_size, 1)``,indicate valid length of each sequence.
+
+        - seq_weight is a 3D tensor with shape: ``(batch_size, T, 1)``
+
+      Output shape
+        - 3D tensor with shape: ``(batch_size, T, embedding_size)``.
+
+      Arguments
+        - **weight_normalization**: bool.Whether normalize the weight socre before applying to sequence.
+
+        - **supports_masking**:If True,the input need to support masking.
+    """
+
+    def __init__(self,weight_normalization=False, supports_masking=False, **kwargs):
+        super(WeightedSequenceLayer, self).__init__(**kwargs)
+        self.weight_normalization = weight_normalization
+        self.supports_masking = supports_masking
+
+    def build(self, input_shape):
+        if not self.supports_masking:
+            self.seq_len_max = int(input_shape[0][1])
+        super(WeightedSequenceLayer, self).build(
+            input_shape)  # Be sure to call this somewhere!
+
+    def call(self, input_list, mask=None, **kwargs):
+        if self.supports_masking:
+            if mask is None:
+                raise ValueError(
+                    "When supports_masking=True,input must support masking")
+            key_input, value_input = input_list
+            mask = tf.expand_dims(mask[0], axis=2)
+        else:
+            key_input, key_length_input, value_input = input_list
+            mask = tf.sequence_mask(key_length_input,
+                                    self.seq_len_max, dtype=tf.bool)
+            mask = tf.transpose(mask, (0, 2, 1))
+
+        embedding_size = key_input.shape[-1]
+
+        if self.weight_normalization:
+            paddings = tf.ones_like(value_input) * (-2 ** 32 + 1)
+        else:
+            paddings = tf.zeros_like(value_input)
+        value_input = tf.where(mask, value_input, paddings)
+
+        if self.weight_normalization:
+           value_input = softmax(value_input,dim=1)
+
+
+        if len(value_input.shape) == 2:
+            value_input = tf.expand_dims(value_input, axis=2)
+            value_input = tf.tile(value_input, [1, 1, embedding_size])
+
+        return tf.multiply(key_input,value_input)
+
+    def compute_output_shape(self, input_shape):
+        return input_shape[0]
+
+    def compute_mask(self, inputs, mask):
+        if self.supports_masking:
+            return mask[0]
+        else:
+            return None
+
+    def get_config(self, ):
+        config = {'supports_masking': self.supports_masking}
+        base_config = super(WeightedSequenceLayer, self).get_config()
+        return dict(list(base_config.items()) + list(config.items()))
+
 class AttentionSequencePoolingLayer(Layer):
     """The Attentional sequence pooling operation used in DIN.
 
@@ -741,50 +818,3 @@ def get_config(self, ):
         return dict(list(base_config.items()) + list(config.items()))
 
 
-class SequenceMultiplyLayer(Layer):
-
-    def __init__(self, supports_masking, **kwargs):
-        super(SequenceMultiplyLayer, self).__init__(**kwargs)
-        self.supports_masking = supports_masking
-
-    def build(self, input_shape):
-        if not self.supports_masking:
-            self.seq_len_max = int(input_shape[0][1])
-        super(SequenceMultiplyLayer, self).build(
-            input_shape)  # Be sure to call this somewhere!
-
-    def call(self, input_list, mask=None, **kwargs):
-        if self.supports_masking:
-            if mask is None:
-                raise ValueError(
-                    "When supports_masking=True,input must support masking")
-            key_input, value_input = input_list
-            mask = tf.cast(mask[0], tf.float32)
-            mask = tf.expand_dims(mask, axis=2)
-        else:
-            key_input, key_length_input, value_input = input_list
-            mask = tf.sequence_mask(key_length_input,
-                                    self.seq_len_max, dtype=tf.float32)
-            mask = tf.transpose(mask, (0, 2, 1))
-
-        embedding_size = key_input.shape[-1]
-        mask = tf.tile(mask, [1, 1, embedding_size])
-        key_input *= mask
-        if len(tf.shape(value_input)) == 2:
-            value_input = tf.expand_dims(value_input, axis=2)
-            value_input = tf.tile(value_input, [1, 1, embedding_size])
-        return tf.multiply(key_input,value_input)
-
-    def compute_output_shape(self, input_shape):
-        return input_shape[0]
-
-    def compute_mask(self, inputs, mask):
-        if self.supports_masking:
-            return mask[0]
-        else:
-            return None
-
-    def get_config(self, ):
-        config = {'supports_masking': self.supports_masking}
-        base_config = super(SequenceMultiplyLayer, self).get_config()
-        return dict(list(base_config.items()) + list(config.items()))
 
@@ -107,13 +107,18 @@ def call(self, inputs , **kwargs):
     def compute_output_shape(self, input_shape):
         return (None, 1)
 
+    def compute_mask(self, inputs, mask):
+        return None
+
     def get_config(self, ):
         config = {'mode': self.mode, 'l2_reg': self.l2_reg}
         base_config = super(Linear, self).get_config()
         return dict(list(base_config.items()) + list(config.items()))
 
 
-def concat_fun(inputs, axis=-1):
+def concat_fun(inputs, axis=-1,mask=False):
+    if not mask:
+        inputs = list(map(NoMask(), inputs))
     if len(inputs) == 1:
         return inputs[0]
     else:
 
@@ -79,9 +79,9 @@ def DIN(dnn_feature_columns, history_feature_list, embedding_size=8, hist_len_ma
     dnn_input_emb_list += sequence_embed_list
 
 
-    keys_emb = concat_fun(keys_emb_list)
+    keys_emb = concat_fun(keys_emb_list,mask=True)
     deep_input_emb = concat_fun(dnn_input_emb_list)
-    query_emb = concat_fun(query_emb_list)
+    query_emb = concat_fun(query_emb_list,mask=True)
 
     hist = AttentionSequencePoolingLayer(att_hidden_size, att_activation,
                                          weight_normalization=att_weight_normalization, supports_masking=True)([
 
@@ -103,10 +103,9 @@ def DSIN(dnn_feature_columns, sess_feature_list, embedding_size=8, sess_max_coun
                                           mask_feat_list=sess_feature_list)
     dense_value_list = get_dense_input(features, dense_feature_columns)
 
-    query_emb = concat_fun(query_emb_list)
+    query_emb = concat_fun(query_emb_list,mask=True)
 
-    dnn_input_emb = concat_fun(dnn_input_emb_list)
-    dnn_input_emb = Flatten()(NoMask()(dnn_input_emb))
+    dnn_input_emb = Flatten()(concat_fun(dnn_input_emb_list))
 
     tr_input = sess_interest_division(embedding_dict, user_behavior_input_dict, sparse_feature_columns,
                                       sess_feature_list, sess_max_count, bias_encoding=bias_encoding)
@@ -158,7 +157,7 @@ def sess_interest_division(sparse_embedding_dict, user_behavior_input_dict, spar
                                                sparse_fg_list, sess_feture_list, sess_feture_list)
         # [sparse_embedding_dict[feat](user_behavior_input_dict[sess_name][feat]) for feat in
         #             sess_feture_list]
-        keys_emb = concat_fun(keys_emb_list)
+        keys_emb = concat_fun(keys_emb_list,mask=True)
         tr_input.append(keys_emb)
     if bias_encoding:
         tr_input = BiasEncoding(sess_max_count)(tr_input)