keras-team
diff --git a/‎scripts/autogen.py‎
Lines changed: 1 addition & 1 deletion b/‎scripts/autogen.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎scripts/nlp_api_master.py‎
Lines changed: 248 additions & 31 deletions b/‎scripts/nlp_api_master.py‎
Lines changed: 248 additions & 31 deletions
diff --git a/‎templates/api/keras_nlp/index.md‎
Lines changed: 5 additions & 4 deletions b/‎templates/api/keras_nlp/index.md‎
Lines changed: 5 additions & 4 deletions
diff --git a/‎templates/api/keras_nlp/models/bert/index.md‎
Lines changed: 9 additions & 0 deletions b/‎templates/api/keras_nlp/models/bert/index.md‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎templates/api/keras_nlp/models/distil_bert/index.md‎
Lines changed: 9 additions & 0 deletions b/‎templates/api/keras_nlp/models/distil_bert/index.md‎
Lines changed: 9 additions & 0 deletions
@@ -42,7 +42,7 @@
     "keras": "https://github.com/keras-team/keras/tree/v2.11.0/",
     "keras_tuner": "https://github.com/keras-team/keras-tuner/tree/1.1.3/",
     "keras_cv": "https://github.com/keras-team/keras-cv/tree/v0.3.4/",
-    "keras_nlp": "https://github.com/keras-team/keras-nlp/tree/v0.3.1/",
+    "keras_nlp": "https://github.com/keras-team/keras-nlp/tree/v0.4.0/",
 }
 
 
 
@@ -1,3 +1,179 @@
+MODELS_MASTER = {
+    "path": "models/",
+    "title": "Models",
+    "toc": True,
+    "children": [
+        {
+            "path": "bert/",
+            "title": "Bert",
+            "toc": True,
+            "children": [
+                {
+                    "path": "bert_tokenizer",
+                    "title": "BertTokenizer",
+                    "generate": [
+                        "keras_nlp.models.BertTokenizer",
+                        "keras_nlp.models.BertTokenizer.from_preset",
+                    ],
+                },
+                {
+                    "path": "bert_preprocessor",
+                    "title": "BertPreprocessor layer",
+                    "generate": [
+                        "keras_nlp.models.BertPreprocessor",
+                        "keras_nlp.models.BertPreprocessor.from_preset",
+                        "keras_nlp.models.BertPreprocessor.tokenizer",
+                    ],
+                },
+                {
+                    "path": "bert_backbone",
+                    "title": "BertBackbone model",
+                    "generate": [
+                        "keras_nlp.models.BertBackbone",
+                        "keras_nlp.models.BertBackbone.from_preset",
+                    ],
+                },
+                {
+                    "path": "bert_classifier",
+                    "title": "BertClassifier model",
+                    "generate": [
+                        "keras_nlp.models.BertClassifier",
+                        "keras_nlp.models.BertClassifier.from_preset",
+                        "keras_nlp.models.BertClassifier.backbone",
+                        "keras_nlp.models.BertClassifier.preprocessor",
+                    ],
+                },
+            ],
+        },
+        {
+            "path": "distil_bert/",
+            "title": "DistilBert",
+            "toc": True,
+            "children": [
+                {
+                    "path": "distil_bert_tokenizer",
+                    "title": "DistilBertTokenizer",
+                    "generate": [
+                        "keras_nlp.models.DistilBertTokenizer",
+                        "keras_nlp.models.DistilBertTokenizer.from_preset",
+                    ],
+                },
+                {
+                    "path": "distil_bert_preprocessor",
+                    "title": "DistilBertPreprocessor layer",
+                    "generate": [
+                        "keras_nlp.models.DistilBertPreprocessor",
+                        "keras_nlp.models.DistilBertPreprocessor.from_preset",
+                        "keras_nlp.models.DistilBertPreprocessor.tokenizer",
+                    ],
+                },
+                {
+                    "path": "distil_bert_backbone",
+                    "title": "DistilBertBackbone model",
+                    "generate": [
+                        "keras_nlp.models.DistilBertBackbone",
+                        "keras_nlp.models.DistilBertBackbone.from_preset",
+                    ],
+                },
+                {
+                    "path": "distil_bert_classifier",
+                    "title": "DistilBertClassifier model",
+                    "generate": [
+                        "keras_nlp.models.DistilBertClassifier",
+                        "keras_nlp.models.DistilBertClassifier.from_preset",
+                        "keras_nlp.models.DistilBertClassifier.backbone",
+                        "keras_nlp.models.DistilBertClassifier.preprocessor",
+                    ],
+                },
+            ],
+        },
+        {
+            "path": "roberta/",
+            "title": "Roberta",
+            "toc": True,
+            "children": [
+                {
+                    "path": "roberta_tokenizer",
+                    "title": "RobertaTokenizer",
+                    "generate": [
+                        "keras_nlp.models.RobertaTokenizer",
+                        "keras_nlp.models.RobertaTokenizer.from_preset",
+                    ],
+                },
+                {
+                    "path": "roberta_preprocessor",
+                    "title": "RobertaPreprocessor layer",
+                    "generate": [
+                        "keras_nlp.models.RobertaPreprocessor",
+                        "keras_nlp.models.RobertaPreprocessor.from_preset",
+                        "keras_nlp.models.RobertaPreprocessor.tokenizer",
+                    ],
+                },
+                {
+                    "path": "roberta_backbone",
+                    "title": "RobertaBackbone model",
+                    "generate": [
+                        "keras_nlp.models.RobertaBackbone",
+                        "keras_nlp.models.RobertaBackbone.from_preset",
+                    ],
+                },
+                {
+                    "path": "roberta_classifier",
+                    "title": "RobertaClassifier model",
+                    "generate": [
+                        "keras_nlp.models.RobertaClassifier",
+                        "keras_nlp.models.RobertaClassifier.from_preset",
+                        "keras_nlp.models.RobertaClassifier.backbone",
+                        "keras_nlp.models.RobertaClassifier.preprocessor",
+                    ],
+                },
+            ],
+        },
+        {
+            "path": "xlm_roberta/",
+            "title": "XLMRoberta",
+            "toc": True,
+            "children": [
+                {
+                    "path": "xlm_roberta_tokenizer",
+                    "title": "XLMRobertaTokenizer",
+                    "generate": [
+                        "keras_nlp.models.XLMRobertaTokenizer",
+                        "keras_nlp.models.XLMRobertaTokenizer.from_preset",
+                    ],
+                },
+                {
+                    "path": "xlm_roberta_preprocessor",
+                    "title": "XLMRobertaPreprocessor layer",
+                    "generate": [
+                        "keras_nlp.models.XLMRobertaPreprocessor",
+                        "keras_nlp.models.XLMRobertaPreprocessor.from_preset",
+                        "keras_nlp.models.XLMRobertaPreprocessor.tokenizer",
+                    ],
+                },
+                {
+                    "path": "xlm_roberta_backbone",
+                    "title": "XLMRobertaBackbone model",
+                    "generate": [
+                        "keras_nlp.models.XLMRobertaBackbone",
+                        "keras_nlp.models.XLMRobertaBackbone.from_preset",
+                    ],
+                },
+                {
+                    "path": "xlm_roberta_classifier",
+                    "title": "XLMRobertaClassifier model",
+                    "generate": [
+                        "keras_nlp.models.XLMRobertaClassifier",
+                        "keras_nlp.models.XLMRobertaClassifier.from_preset",
+                        "keras_nlp.models.XLMRobertaClassifier.backbone",
+                        "keras_nlp.models.XLMRobertaClassifier.preprocessor",
+                    ],
+                },
+            ],
+        },
+    ],
+}
+
 TOKENIZERS_MASTER = {
     "path": "tokenizers/",
     "title": "Tokenizers",
@@ -69,24 +245,67 @@
             ],
         },
         {
-            "path": "unicode_character_tokenizer",
-            "title": "UnicodeCharacterTokenizer",
+            "path": "unicode_codepoint_tokenizer",
+            "title": "UnicodeCodepointTokenizer",
             "generate": [
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.tokenize",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.detokenize",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.get_vocabulary",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.vocabulary_size",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.token_to_id",
-                "keras_nlp.tokenizers.UnicodeCharacterTokenizer.id_to_token",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.tokenize",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.detokenize",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.get_vocabulary",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.vocabulary_size",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.token_to_id",
+                "keras_nlp.tokenizers.UnicodeCodepointTokenizer.id_to_token",
             ],
         },
+        {
+            "path": "compute_word_piece_vocabulary",
+            "title": "compute_word_piece_vocabulary function",
+            "generate": ["keras_nlp.tokenizers.compute_word_piece_vocabulary"],
+        },
+        {
+            "path": "compute_sentence_piece_proto",
+            "title": "compute_sentence_piece_proto function",
+            "generate": ["keras_nlp.tokenizers.compute_sentence_piece_proto"],
+        },
     ],
 }
 
-LAYERS_MASTER = {
-    "path": "layers/",
-    "title": "Layers",
+PREPROCESSING_LAYERS_MASTER = {
+    "path": "preprocessing_layers/",
+    "title": "Preprocessing Layers",
+    "toc": True,
+    "children": [
+        {
+            "path": "start_end_packer",
+            "title": "StartEndPacker layer",
+            "generate": ["keras_nlp.layers.StartEndPacker"],
+        },
+        {
+            "path": "multi_segment_packer",
+            "title": "MultiSegmentPacker layer",
+            "generate": ["keras_nlp.layers.MultiSegmentPacker"],
+        },
+        {
+            "path": "random_swap",
+            "title": "RandomSwap layer",
+            "generate": ["keras_nlp.layers.RandomSwap"],
+        },
+        {
+            "path": "random_deletion",
+            "title": "RandomDeletion layer",
+            "generate": ["keras_nlp.layers.RandomDeletion"],
+        },
+        {
+            "path": "masked_lm_mask_generator",
+            "title": "MaskedLMMaskGenerator layer",
+            "generate": ["keras_nlp.layers.MaskedLMMaskGenerator"],
+        },
+    ],
+}
+
+MODELING_LAYERS_MASTER = {
+    "path": "modeling_layers/",
+    "title": "Modeling Layers",
     "toc": True,
     "children": [
         {
@@ -126,24 +345,9 @@
             "generate": ["keras_nlp.layers.TokenAndPositionEmbedding"],
         },
         {
-            "path": "mlm_mask_generator",
-            "title": "MLMMaskGenerator layer",
-            "generate": ["keras_nlp.layers.MLMMaskGenerator"],
-        },
-        {
-            "path": "mlm_head",
-            "title": "MLMHead layer",
-            "generate": ["keras_nlp.layers.MLMHead"],
-        },
-        {
-            "path": "start_end_packer",
-            "title": "StartEndPacker layer",
-            "generate": ["keras_nlp.layers.StartEndPacker"],
-        },
-        {
-            "path": "multi_segment_packer",
-            "title": "MultiSegmentPacker layer",
-            "generate": ["keras_nlp.layers.MultiSegmentPacker"],
+            "path": "masked_lm_head",
+            "title": "MaskedLMHead layer",
+            "generate": ["keras_nlp.layers.MaskedLMHead"],
         },
     ],
 }
@@ -169,6 +373,17 @@
             "title": "RougeN metric",
             "generate": ["keras_nlp.metrics.RougeN"],
         },
+        {
+            "path": "bleu",
+            "title": "Bleu metric",
+            "generate": ["keras_nlp.metrics.Bleu"],
+        },
+        {
+            "path": "edit_distance",
+            "title": "EditDistance metric",
+            "generate": ["keras_nlp.metrics.EditDistance"],
+        },
+
     ],
 }
 
@@ -210,8 +425,10 @@
     "title": "KerasNLP",
     "toc": True,
     "children": [
+        MODELS_MASTER,
         TOKENIZERS_MASTER,
-        LAYERS_MASTER,
+        PREPROCESSING_LAYERS_MASTER,
+        MODELING_LAYERS_MASTER,
         METRICS_MASTER,
         UTILS_MASTER,
     ],
 
@@ -1,8 +1,9 @@
 # KerasNLP
 
-KerasNLP is a toolbox of modular building blocks (layers, metrics, etc.) that
-NLP engineers can leverage to develop
-production-grade, state-of-the-art training and inference pipelines for common NLP workflows.
+KerasNLP is a toolbox of modular building blocks ranging from pretrained
+state-of-the-art models, to low-level Transformer Encoder layers. For an
+introduction to the library see the  [KerasNLP home page](/keras_nlp). For a
+high-level introduction to the API see our
+[getting started guide](guides/keras_nlp/getting_started/).
 
 {{toc}}
-
 
@@ -0,0 +1,9 @@
+# BERT
+
+Models, tokenizers, and preprocessing layers for BERT,
+as described in ["BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"](https://arxiv.org/abs/1810.04805).
+
+For a full list of available **presets**, see the
+[models page](/api/keras_nlp/models).
+
+{{toc}}
@@ -0,0 +1,9 @@
+# DistilBERT
+
+Models, tokenizers, and preprocessing layers for DistilBERT,
+as described in ["DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter"](https://arxiv.org/abs/1910.01108).
+
+For a full list of available **presets**, see the
+[models page](/api/keras_nlp/models).
+
+{{toc}}
Original file line number	Diff line number	Diff line change
`@@ -42,7 +42,7 @@`
`42`	`42`	`"keras": "https://github.com/keras-team/keras/tree/v2.11.0/",`
`43`	`43`	`"keras_tuner": "https://github.com/keras-team/keras-tuner/tree/1.1.3/",`
`44`	`44`	`"keras_cv": "https://github.com/keras-team/keras-cv/tree/v0.3.4/",`
`45`		`- "keras_nlp": "https://github.com/keras-team/keras-nlp/tree/v0.3.1/",`
	`45`	`+ "keras_nlp": "https://github.com/keras-team/keras-nlp/tree/v0.4.0/",`
`46`	`46`	`}`
`47`	`47`
`48`	`48`