align

yinhaofeng · yinhaofeng · commit 49e669faea5f · 2021-02-24T14:11:38.000Z
diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
diff --git a/models/recall/ncf/config.yaml b/models/recall/ncf/config.yaml
@@ -35,5 +35,6 @@ hyper_parameters:
     learning_rate: 0.001
   num_users: 6040
   num_items: 3706
-  latent_dim: 8
+  mf_dim: 8
+  mode: "NCF_NeuMF"  # optional: NCF_NeuMF, NCF_GMF, NCF_MLP
   fc_layers: [64, 32, 16, 8]
diff --git a/models/recall/ncf/config_bigdata.yaml b/models/recall/ncf/config_bigdata.yaml
@@ -15,7 +15,7 @@
 runner:
   train_data_dir: "../../../datasets/movielens_pinterest_NCF/big_train"
   train_reader_path: "movielens_reader"  # importlib format
-  train_batch_size: 256
+  train_batch_size: 1024
   model_save_path: "output_model_ncf"
 
   use_gpu: False
@@ -35,5 +35,6 @@ hyper_parameters:
     learning_rate: 0.001
   num_users: 6040
   num_items: 3706
-  latent_dim: 8
+  mf_dim: 8
+  mode: "NCF_NeuMF"  # optional: NCF_NeuMF, NCF_GMF, NCF_MLP
   fc_layers: [64, 32, 16, 8]
diff --git a/models/recall/ncf/dygraph_model.py b/models/recall/ncf/dygraph_model.py
@@ -24,9 +24,16 @@ class DygraphModel():
     def create_model(self, config):
         num_users = config.get("hyper_parameters.num_users")
         num_items = config.get("hyper_parameters.num_items")
-        latent_dim = config.get("hyper_parameters.latent_dim")
+        mf_dim = config.get("hyper_parameters.mf_dim")
+        mode = config.get("hyper_parameters.mode")
         layers = config.get("hyper_parameters.fc_layers")
-        ncf_model = net.NCFLayer(num_users, num_items, latent_dim, layers)
+        if mode == "NCF_NeuMF":
+            ncf_model = net.NCF_NeuMF_Layer(num_users, num_items, mf_dim,
+                                            layers)
+        if mode == "NCF_GMF":
+            ncf_model = net.NCF_GMF_Layer(num_users, num_items, mf_dim, layers)
+        if mode == "NCF_MLP":
+            ncf_model = net.NCF_MLP_Layer(num_users, num_items, mf_dim, layers)
         return ncf_model
 
     # define feeds which convert numpy of batch data to paddle.tensor 
diff --git a/models/recall/ncf/evaluate.py b/models/recall/ncf/evaluate.py
diff --git a/models/recall/ncf/net.py b/models/recall/ncf/net.py
@@ -19,39 +19,47 @@
 import math
 
 
-class NCFLayer(nn.Layer):
-    def __init__(self, num_users, num_items, latent_dim, layers):
-        super(NCFLayer, self).__init__()
+class NCF_NeuMF_Layer(nn.Layer):
+    def __init__(self, num_users, num_items, mf_dim, layers):
+        super(NCF_NeuMF_Layer, self).__init__()
 
         self.num_users = num_users
         self.num_items = num_items
-        self.latent_dim = latent_dim
+        self.mf_dim = mf_dim
         self.layers = layers
 
         self.MF_Embedding_User = paddle.nn.Embedding(
             self.num_users,
-            self.latent_dim,
-            sparse=True,
-            weight_attr=nn.initializer.Normal(
-                mean=0.0, std=0.01))
+            self.mf_dim,
+            sparse=False,
+            weight_attr=paddle.ParamAttr(
+                initializer=nn.initializer.Normal(
+                    mean=0.0, std=0.01),
+                regularizer=paddle.regularizer.L2Decay(coeff=0)))
         self.MF_Embedding_Item = paddle.nn.Embedding(
             self.num_items,
-            self.latent_dim,
-            sparse=True,
-            weight_attr=nn.initializer.Normal(
-                mean=0.0, std=0.01))
+            self.mf_dim,
+            sparse=False,
+            weight_attr=paddle.ParamAttr(
+                initializer=nn.initializer.Normal(
+                    mean=0.0, std=0.01),
+                regularizer=paddle.regularizer.L2Decay(coeff=0)))
         self.MLP_Embedding_User = paddle.nn.Embedding(
             self.num_users,
             int(self.layers[0] / 2),
-            sparse=True,
-            weight_attr=nn.initializer.Normal(
-                mean=0.0, std=0.01))
+            sparse=False,
+            weight_attr=paddle.ParamAttr(
+                initializer=nn.initializer.Normal(
+                    mean=0.0, std=0.01),
+                regularizer=paddle.regularizer.L2Decay(coeff=0)))
         self.MLP_Embedding_Item = paddle.nn.Embedding(
             self.num_items,
             int(self.layers[0] / 2),
-            sparse=True,
-            weight_attr=nn.initializer.Normal(
-                mean=0.0, std=0.01))
+            sparse=False,
+            weight_attr=paddle.ParamAttr(
+                initializer=nn.initializer.Normal(
+                    mean=0.0, std=0.01),
+                regularizer=paddle.regularizer.L2Decay(coeff=0)))
 
         num_layer = len(self.layers)
         self.MLP_fc = []
@@ -62,7 +70,7 @@ def __init__(self, num_users, num_items, latent_dim, layers):
                 weight_attr=paddle.ParamAttr(
                     initializer=nn.initializer.TruncatedNormal(
                         mean=0.0, std=1.0 / math.sqrt(self.layers[i - 1])),
-                    regularizer=paddle.regularizer.L2Decay(coeff=1e-4)),
+                    regularizer=paddle.regularizer.L2Decay(coeff=0)),
                 name='layer_' + str(i))
             self.add_sublayer('layer_%d' % i, Linear)
             self.MLP_fc.append(Linear)
@@ -73,7 +81,8 @@ def __init__(self, num_users, num_items, latent_dim, layers):
         self.prediction = paddle.nn.Linear(
             in_features=self.layers[2],
             out_features=1,
-            weight_attr=nn.initializer.KaimingUniform(fan_in=None),
+            weight_attr=nn.initializer.KaimingUniform(fan_in=self.layers[2] *
+                                                      2),
             name='prediction')
         self.sigmoid = paddle.nn.Sigmoid()
 
@@ -112,3 +121,121 @@ def forward(self, input_data):
         prediction = self.prediction(predict_vector)
         prediction = self.sigmoid(prediction)
         return prediction
+
+
+class NCF_GMF_Layer(nn.Layer):
+    def __init__(self, num_users, num_items, mf_dim, layers):
+        super(NCF_GMF_Layer, self).__init__()
+
+        self.num_users = num_users
+        self.num_items = num_items
+        self.mf_dim = mf_dim
+        self.layers = layers
+
+        self.MF_Embedding_User = paddle.nn.Embedding(
+            self.num_users,
+            self.mf_dim,
+            sparse=True,
+            weight_attr=nn.initializer.Normal(
+                mean=0.0, std=0.01))
+
+        self.MF_Embedding_Item = paddle.nn.Embedding(
+            self.num_items,
+            self.mf_dim,
+            sparse=True,
+            weight_attr=nn.initializer.Normal(
+                mean=0.0, std=0.01))
+
+        self.prediction = paddle.nn.Linear(
+            in_features=self.layers[3],
+            out_features=1,
+            weight_attr=nn.initializer.KaimingUniform(fan_in=None),
+            name='prediction')
+
+        self.sigmoid = paddle.nn.Sigmoid()
+
+    def forward(self, input_data):
+
+        user_input = input_data[0]
+        item_input = input_data[1]
+        label = input_data[2]
+
+        user_embedding_mf = self.MF_Embedding_User(user_input)
+        mf_user_latent = paddle.flatten(
+            x=user_embedding_mf, start_axis=1, stop_axis=2)
+        item_embedding_mf = self.MF_Embedding_Item(item_input)
+        mf_item_latent = paddle.flatten(
+            x=item_embedding_mf, start_axis=1, stop_axis=2)
+        mf_vector = paddle.multiply(mf_user_latent, mf_item_latent)
+        prediction = self.prediction(mf_vector)
+        prediction = self.sigmoid(prediction)
+        return prediction
+
+
+class NCF_MLP_Layer(nn.Layer):
+    def __init__(self, num_users, num_items, mf_dim, layers):
+        super(NCF_MLP_Layer, self).__init__()
+
+        self.num_users = num_users
+        self.num_items = num_items
+        self.mf_dim = mf_dim
+        self.layers = layers
+
+        self.MLP_Embedding_User = paddle.nn.Embedding(
+            self.num_users,
+            int(self.layers[0] / 2),
+            sparse=True,
+            weight_attr=nn.initializer.Normal(
+                mean=0.0, std=0.01))
+        self.MLP_Embedding_Item = paddle.nn.Embedding(
+            self.num_items,
+            int(self.layers[0] / 2),
+            sparse=True,
+            weight_attr=nn.initializer.Normal(
+                mean=0.0, std=0.01))
+
+        num_layer = len(self.layers)
+        self.MLP_fc = []
+        for i in range(1, num_layer):
+            Linear = paddle.nn.Linear(
+                in_features=self.layers[i - 1],
+                out_features=self.layers[i],
+                weight_attr=paddle.ParamAttr(
+                    initializer=nn.initializer.TruncatedNormal(
+                        mean=0.0, std=1.0 / math.sqrt(self.layers[i - 1]))),
+                name='layer_' + str(i))
+            self.add_sublayer('layer_%d' % i, Linear)
+            self.MLP_fc.append(Linear)
+            act = paddle.nn.ReLU()
+            self.add_sublayer('act_%d' % i, act)
+            self.MLP_fc.append(act)
+
+        self.prediction = paddle.nn.Linear(
+            in_features=self.layers[3],
+            out_features=1,
+            weight_attr=nn.initializer.KaimingUniform(fan_in=self.layers[3] *
+                                                      2),
+            name='prediction')
+
+        self.sigmoid = paddle.nn.Sigmoid()
+
+    def forward(self, input_data):
+        user_input = input_data[0]
+        item_input = input_data[1]
+        label = input_data[2]
+
+        user_embedding_mlp = self.MLP_Embedding_User(user_input)
+        mlp_user_latent = paddle.flatten(
+            x=user_embedding_mlp, start_axis=1, stop_axis=2)
+        item_embedding_mlp = self.MLP_Embedding_Item(item_input)
+        mlp_item_latent = paddle.flatten(
+            x=item_embedding_mlp, start_axis=1, stop_axis=2)
+        mlp_vector = paddle.concat(
+            x=[mlp_user_latent, mlp_item_latent], axis=-1)
+
+        for n_layer in self.MLP_fc:
+            mlp_vector = n_layer(mlp_vector)
+
+        prediction = self.prediction(mlp_vector)
+        prediction = self.sigmoid(prediction)
+        return prediction
diff --git a/models/recall/ncf/readme.md b/models/recall/ncf/readme.md
@@ -66,7 +66,7 @@ python -u infer.py -m config.yaml
 # 静态图训练
 python -u ../../../tools/static_trainer.py -m config.yaml # 全量数据运行config_bigdata.yaml 
 # 静态图预测
-python -u static_infer.py -m config.yaml 
+python -u ../../../tools/static_infer.py -m config.yaml 
 ``` 
 
 ## 模型组网
@@ -81,13 +81,13 @@ python -u static_infer.py -m config.yaml
 
 | 模型 | HR@10 | NDCG@10 | batch_size | epoch_num| Time of each epoch |
 | :------| :------ |:------ | :------ | :------| :------ | 
-| NCF | 0.58 | 0.33 | 256 | 20 | 约20分钟 |
+| NCF_NeuMF | 0.58 | 0.33 | 1024 | 20 | 约20分钟 |
 
 1. 确认您当前所在目录为PaddleRec/models/recall/ncf  
 2. 进入paddlerec/datasets/movielens_pinterest_NCF目录下，执行该脚本，会从国内源的服务器上下载我们预处理完成的movielens和pinterest全量数据集，并解压到指定文件夹。
 ``` bash
 cd ../../../datasets/movielens_pinterest_NCF
-sh run.sh
+bash run.sh
 ```
 3. 切回模型目录,执行命令运行全量数据
 ```bash
diff --git a/models/recall/ncf/run.sh b/models/recall/ncf/run.sh
@@ -1,3 +1,4 @@
+#!/bin/bash
 # Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
 #
 # Licensed under the Apache License, Version 2.0 (the "License");
@@ -11,11 +12,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-#!/bin/bash
 echo "................run................."
-echo "................The training log has been redirected to the log_train.txt file................."
 python -u ../../../tools/trainer.py -m config_bigdata.yaml &> log_train.txt
-echo "................The testing log has been redirected to the result.txt file................."
 python -u ../../../tools/infer.py -m config_bigdata.yaml &> result.txt
-echo "..............evaluate..................."
 python3 evaluate.py
diff --git a/models/recall/ncf/static_model.py b/models/recall/ncf/static_model.py
@@ -16,7 +16,7 @@
 import paddle
 import paddle.nn as nn
 import paddle.nn.functional as F
-from net import NCFLayer
+from net import NCF_NeuMF_Layer, NCF_GMF_Layer, NCF_MLP_Layer
 
 
 class StaticModel():
@@ -28,7 +28,8 @@ def __init__(self, config):
     def _init_hyper_parameters(self):
         self.num_users = self.config.get("hyper_parameters.num_users")
         self.num_items = self.config.get("hyper_parameters.num_items")
-        self.latent_dim = self.config.get("hyper_parameters.latent_dim")
+        self.mf_dim = self.config.get("hyper_parameters.mf_dim")
+        self.mode = self.config.get("hyper_parameters.mode")
         self.layers = self.config.get("hyper_parameters.fc_layers")
         self.learning_rate = self.config.get(
             "hyper_parameters.optimizer.learning_rate")
@@ -44,8 +45,16 @@ def create_feeds(self, is_infer=False):
         return feeds_list
 
     def net(self, input, is_infer=False):
-        ncf_model = NCFLayer(self.num_users, self.num_items, self.latent_dim,
-                             self.layers)
+        if self.mode == "NCF_NeuMF":
+            ncf_model = NCF_NeuMF_Layer(self.num_users, self.num_items,
+                                        self.mf_dim, self.layers)
+        if self.mode == "NCF_GMF":
+            ncf_model = NCF_GMF_Layer(self.num_users, self.num_items,
+                                      self.mf_dim, self.layers)
+        if self.mode == "NCF_MLP":
+            ncf_model = NCF_MLP_Layer(self.num_users, self.num_items,
+                                      self.mf_dim, self.layers)
+
         prediction = ncf_model(input)
 
         self.inference_target_var = prediction