keras-team
diff --git a/‎examples/keras_rs/dcn.py‎
Lines changed: 62 additions & 37 deletions b/‎examples/keras_rs/dcn.py‎
Lines changed: 62 additions & 37 deletions
diff --git a/‎examples/keras_rs/img/dcn/dcn_16_2.png‎
-25.1 KB b/‎examples/keras_rs/img/dcn/dcn_16_2.png‎
-25.1 KB
diff --git a/‎examples/keras_rs/img/dcn/dcn_17_2.png‎
12 KB b/‎examples/keras_rs/img/dcn/dcn_17_2.png‎
12 KB
diff --git a/‎examples/keras_rs/img/dcn/dcn_31_2.png‎
-32.5 KB b/‎examples/keras_rs/img/dcn/dcn_31_2.png‎
-32.5 KB
diff --git a/‎examples/keras_rs/img/dcn/dcn_32_2.png‎
16.1 KB b/‎examples/keras_rs/img/dcn/dcn_32_2.png‎
16.1 KB
diff --git a/‎examples/keras_rs/ipynb/dcn.ipynb‎
Lines changed: 67 additions & 42 deletions b/‎examples/keras_rs/ipynb/dcn.ipynb‎
Lines changed: 67 additions & 42 deletions
@@ -116,14 +116,14 @@
         "user_occupation_text",
     ],
     # model
-    "embedding_dim": 32,
+    "embedding_dim": 8,
     "deep_net_num_units": [192, 192, 192],
-    "projection_dim": 20,
+    "projection_dim": 8,
     "dcn_num_units": [192, 192],
     # training
-    "learning_rate": 0.01,
-    "num_epochs": 10,
-    "batch_size": 1024,
+    "learning_rate": 1e-2,
+    "num_epochs": 8,
+    "batch_size": 8192,
 }
 
 
@@ -144,8 +144,8 @@ def visualize_layer(matrix, features):
     cax = divider.append_axes("right", size="5%", pad=0.05)
     plt.colorbar(im, cax=cax)
     cax.tick_params(labelsize=10)
-    ax.set_xticklabels([""] + features, rotation=45, fontsize=10)
-    ax.set_yticklabels([""] + features, fontsize=10)
+    ax.set_xticklabels([""] + features, rotation=45, fontsize=5)
+    ax.set_yticklabels([""] + features, fontsize=5)
 
 
 def train_and_evaluate(
@@ -441,36 +441,61 @@ def get_mixer_data(data_size=100_000):
 """
 
 
-def get_model(
-    dense_num_units_lst,
-    embedding_dim=MOVIELENS_CONFIG["embedding_dim"],
-    use_cross_layer=False,
-    projection_dim=None,
-):
-    inputs = {}
-    embeddings = []
-    for feature_name, vocabulary in vocabularies.items():
-        inputs[feature_name] = keras.Input(shape=(), dtype="int32", name=feature_name)
-        embedding_layer = keras.layers.Embedding(
-            input_dim=len(vocabulary) + 1,
-            output_dim=embedding_dim,
-        )
-        embedding = embedding_layer(inputs[feature_name])
-        embeddings.append(embedding)
+class DCN(keras.Model):
+    def __init__(
+        self,
+        dense_num_units_lst,
+        embedding_dim=MOVIELENS_CONFIG["embedding_dim"],
+        use_cross_layer=False,
+        projection_dim=None,
+        **kwargs,
+    ):
+        super().__init__(**kwargs)
+
+        # Layers.
+
+        self.embedding_layers = []
+        for feature_name, vocabulary in vocabularies.items():
+            self.embedding_layers.append(
+                keras.layers.Embedding(
+                    input_dim=len(vocabulary) + 1,
+                    output_dim=embedding_dim,
+                )
+            )
+
+        if use_cross_layer:
+            self.cross_layer = keras_rs.layers.FeatureCross(
+                projection_dim=projection_dim
+            )
+
+        self.dense_layers = []
+        for num_units in dense_num_units_lst:
+            self.dense_layers.append(keras.layers.Dense(num_units, activation="relu"))
+
+        self.output_layer = keras.layers.Dense(1)
+
+        # Attributes.
+        self.dense_num_units_lst = dense_num_units_lst
+        self.embedding_dim = embedding_dim
+        self.use_cross_layer = use_cross_layer
+        self.projection_dim = projection_dim
+
+    def call(self, inputs):
+        embeddings = []
+        for feature_name, embedding_layer in zip(vocabularies, self.embedding_layers):
+            embeddings.append(embedding_layer(inputs[feature_name]))
 
-    x = keras.ops.concatenate(embeddings, axis=1)
+        x = keras.ops.concatenate(embeddings, axis=1)
 
-    # Cross layer.
-    if use_cross_layer:
-        x = keras_rs.layers.FeatureCross(projection_dim=projection_dim)(x)
+        if self.use_cross_layer:
+            x = self.cross_layer(x)
 
-    # Dense layer.
-    for num_units in dense_num_units_lst:
-        x = keras.layers.Dense(num_units, activation="relu")(x)
+        for dense_layer in self.dense_layers:
+            x = dense_layer(x)
 
-    x = keras.layers.Dense(1)(x)
+        x = self.output_layer(x)
 
-    return keras.Model(inputs=inputs, outputs=x)
+        return x
 
 
 """
@@ -486,8 +511,8 @@ def get_model(
 opt_cross_network_rmse_list = []
 deep_network_rmse_list = []
 
-for _ in range(10):
-    cross_network = get_model(
+for _ in range(20):
+    cross_network = DCN(
         dense_num_units_lst=MOVIELENS_CONFIG["dcn_num_units"],
         embedding_dim=MOVIELENS_CONFIG["embedding_dim"],
         use_cross_layer=True,
@@ -501,7 +526,7 @@ def get_model(
     )
     cross_network_rmse_list.append(rmse)
 
-    opt_cross_network = get_model(
+    opt_cross_network = DCN(
         dense_num_units_lst=MOVIELENS_CONFIG["dcn_num_units"],
         embedding_dim=MOVIELENS_CONFIG["embedding_dim"],
         use_cross_layer=True,
@@ -516,7 +541,7 @@ def get_model(
     )
     opt_cross_network_rmse_list.append(rmse)
 
-    deep_network = get_model(dense_num_units_lst=MOVIELENS_CONFIG["deep_net_num_units"])
+    deep_network = DCN(dense_num_units_lst=MOVIELENS_CONFIG["deep_net_num_units"])
     rmse, deep_network_num_params = train_and_evaluate(
         learning_rate=MOVIELENS_CONFIG["learning_rate"],
         epochs=MOVIELENS_CONFIG["num_epochs"],
@@ -543,7 +568,7 @@ def get_model(
 )
 
 """
-DCN outperforms a similarly sized DNN with ReLU layers, demonstrating
+DCN slightly outperforms a larger DNN with ReLU layers, demonstrating
 superior performance. Furthermore, the low-rank DCN effectively reduces the
 number of parameters without compromising accuracy.
 """
 
@@ -157,14 +157,14 @@
     "        \"user_occupation_text\",\n",
     "    ],\n",
     "    # model\n",
-    "    \"embedding_dim\": 32,\n",
+    "    \"embedding_dim\": 8,\n",
     "    \"deep_net_num_units\": [192, 192, 192],\n",
-    "    \"projection_dim\": 20,\n",
+    "    \"projection_dim\": 8,\n",
     "    \"dcn_num_units\": [192, 192],\n",
     "    # training\n",
-    "    \"learning_rate\": 0.01,\n",
-    "    \"num_epochs\": 10,\n",
-    "    \"batch_size\": 1024,\n",
+    "    \"learning_rate\": 1e-2,\n",
+    "    \"num_epochs\": 8,\n",
+    "    \"batch_size\": 8192,\n",
     "}\n",
     ""
    ]
@@ -199,8 +199,8 @@
     "    cax = divider.append_axes(\"right\", size=\"5%\", pad=0.05)\n",
     "    plt.colorbar(im, cax=cax)\n",
     "    cax.tick_params(labelsize=10)\n",
-    "    ax.set_xticklabels([\"\"] + features, rotation=45, fontsize=10)\n",
-    "    ax.set_yticklabels([\"\"] + features, fontsize=10)\n",
+    "    ax.set_xticklabels([\"\"] + features, rotation=45, fontsize=5)\n",
+    "    ax.set_yticklabels([\"\"] + features, fontsize=5)\n",
     "\n",
     "\n",
     "def train_and_evaluate(\n",
@@ -636,36 +636,61 @@
    "outputs": [],
    "source": [
     "\n",
-    "def get_model(\n",
-    "    dense_num_units_lst,\n",
-    "    embedding_dim=MOVIELENS_CONFIG[\"embedding_dim\"],\n",
-    "    use_cross_layer=False,\n",
-    "    projection_dim=None,\n",
-    "):\n",
-    "    inputs = {}\n",
-    "    embeddings = []\n",
-    "    for feature_name, vocabulary in vocabularies.items():\n",
-    "        inputs[feature_name] = keras.Input(shape=(), dtype=\"int32\", name=feature_name)\n",
-    "        embedding_layer = keras.layers.Embedding(\n",
-    "            input_dim=len(vocabulary) + 1,\n",
-    "            output_dim=embedding_dim,\n",
-    "        )\n",
-    "        embedding = embedding_layer(inputs[feature_name])\n",
-    "        embeddings.append(embedding)\n",
-    "\n",
-    "    x = keras.ops.concatenate(embeddings, axis=1)\n",
-    "\n",
-    "    # Cross layer.\n",
-    "    if use_cross_layer:\n",
-    "        x = keras_rs.layers.FeatureCross(projection_dim=projection_dim)(x)\n",
-    "\n",
-    "    # Dense layer.\n",
-    "    for num_units in dense_num_units_lst:\n",
-    "        x = keras.layers.Dense(num_units, activation=\"relu\")(x)\n",
-    "\n",
-    "    x = keras.layers.Dense(1)(x)\n",
-    "\n",
-    "    return keras.Model(inputs=inputs, outputs=x)\n",
+    "class DCN(keras.Model):\n",
+    "    def __init__(\n",
+    "        self,\n",
+    "        dense_num_units_lst,\n",
+    "        embedding_dim=MOVIELENS_CONFIG[\"embedding_dim\"],\n",
+    "        use_cross_layer=False,\n",
+    "        projection_dim=None,\n",
+    "        **kwargs,\n",
+    "    ):\n",
+    "        super().__init__(**kwargs)\n",
+    "\n",
+    "        # Layers.\n",
+    "\n",
+    "        self.embedding_layers = []\n",
+    "        for feature_name, vocabulary in vocabularies.items():\n",
+    "            self.embedding_layers.append(\n",
+    "                keras.layers.Embedding(\n",
+    "                    input_dim=len(vocabulary) + 1,\n",
+    "                    output_dim=embedding_dim,\n",
+    "                )\n",
+    "            )\n",
+    "\n",
+    "        if use_cross_layer:\n",
+    "            self.cross_layer = keras_rs.layers.FeatureCross(\n",
+    "                projection_dim=projection_dim\n",
+    "            )\n",
+    "\n",
+    "        self.dense_layers = []\n",
+    "        for num_units in dense_num_units_lst:\n",
+    "            self.dense_layers.append(keras.layers.Dense(num_units, activation=\"relu\"))\n",
+    "\n",
+    "        self.output_layer = keras.layers.Dense(1)\n",
+    "\n",
+    "        # Attributes.\n",
+    "        self.dense_num_units_lst = dense_num_units_lst\n",
+    "        self.embedding_dim = embedding_dim\n",
+    "        self.use_cross_layer = use_cross_layer\n",
+    "        self.projection_dim = projection_dim\n",
+    "\n",
+    "    def call(self, inputs):\n",
+    "        embeddings = []\n",
+    "        for feature_name, embedding_layer in zip(vocabularies, self.embedding_layers):\n",
+    "            embeddings.append(embedding_layer(inputs[feature_name]))\n",
+    "\n",
+    "        x = keras.ops.concatenate(embeddings, axis=1)\n",
+    "\n",
+    "        if self.use_cross_layer:\n",
+    "            x = self.cross_layer(x)\n",
+    "\n",
+    "        for dense_layer in self.dense_layers:\n",
+    "            x = dense_layer(x)\n",
+    "\n",
+    "        x = self.output_layer(x)\n",
+    "\n",
+    "        return x\n",
     ""
    ]
   },
@@ -695,8 +720,8 @@
     "opt_cross_network_rmse_list = []\n",
     "deep_network_rmse_list = []\n",
     "\n",
-    "for _ in range(10):\n",
-    "    cross_network = get_model(\n",
+    "for _ in range(20):\n",
+    "    cross_network = DCN(\n",
     "        dense_num_units_lst=MOVIELENS_CONFIG[\"dcn_num_units\"],\n",
     "        embedding_dim=MOVIELENS_CONFIG[\"embedding_dim\"],\n",
     "        use_cross_layer=True,\n",
@@ -710,7 +735,7 @@
     "    )\n",
     "    cross_network_rmse_list.append(rmse)\n",
     "\n",
-    "    opt_cross_network = get_model(\n",
+    "    opt_cross_network = DCN(\n",
     "        dense_num_units_lst=MOVIELENS_CONFIG[\"dcn_num_units\"],\n",
     "        embedding_dim=MOVIELENS_CONFIG[\"embedding_dim\"],\n",
     "        use_cross_layer=True,\n",
@@ -725,7 +750,7 @@
     "    )\n",
     "    opt_cross_network_rmse_list.append(rmse)\n",
     "\n",
-    "    deep_network = get_model(dense_num_units_lst=MOVIELENS_CONFIG[\"deep_net_num_units\"])\n",
+    "    deep_network = DCN(dense_num_units_lst=MOVIELENS_CONFIG[\"deep_net_num_units\"])\n",
     "    rmse, deep_network_num_params = train_and_evaluate(\n",
     "        learning_rate=MOVIELENS_CONFIG[\"learning_rate\"],\n",
     "        epochs=MOVIELENS_CONFIG[\"num_epochs\"],\n",
@@ -758,7 +783,7 @@
     "colab_type": "text"
    },
    "source": [
-    "DCN outperforms a similarly sized DNN with ReLU layers, demonstrating\n",
+    "DCN slightly outperforms a larger DNN with ReLU layers, demonstrating\n",
     "superior performance. Furthermore, the low-rank DCN effectively reduces the\n",
     "number of parameters without compromising accuracy."
    ]