PaddlePaddle
diff --git a/‎docs/model_zoo/index.rst‎
Lines changed: 8 additions & 0 deletions b/‎docs/model_zoo/index.rst‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎docs/model_zoo/transformers/Deberta/contents.rst‎
Lines changed: 17 additions & 0 deletions b/‎docs/model_zoo/transformers/Deberta/contents.rst‎
Lines changed: 17 additions & 0 deletions
diff --git a/‎docs/model_zoo/transformers/DebertaV2/contents.rst‎
Lines changed: 30 additions & 0 deletions b/‎docs/model_zoo/transformers/DebertaV2/contents.rst‎
Lines changed: 30 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta.modeling.rst‎
Lines changed: 7 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta.modeling.rst‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta.rst‎
Lines changed: 14 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta.rst‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta.tokenizer.rst‎
Lines changed: 7 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta.tokenizer.rst‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta_v2.modeling.rst‎
Lines changed: 7 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta_v2.modeling.rst‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta_v2.rst‎
Lines changed: 14 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta_v2.rst‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.deberta_v2.tokenizer.rst‎
Lines changed: 7 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.deberta_v2.tokenizer.rst‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎docs/source/paddlenlp.transformers.rst‎
Lines changed: 2 additions & 0 deletions b/‎docs/source/paddlenlp.transformers.rst‎
Lines changed: 2 additions & 0 deletions
@@ -84,6 +84,8 @@ PaddleNLP的Transformer预训练模型包含从 `huggingface.co`_ 直接转换
    ChineseBert <transformers/ChineseBert/contents>
    ConvBert <transformers/ConvBert/contents>
    CTRL <transformers/CTRL/contents>
+   Deberta <transformers/Deberta/contents>
+   DebertaV2 <transformers/DebertaV2/contents>
    DistilBert <transformers/DistilBert/contents>
    ELECTRA <transformers/ELECTRA/contents>
    ERNIE <transformers/ERNIE/contents>
@@ -145,6 +147,10 @@ Transformer预训练模型适用任务汇总
 +--------------------+-------------------------+----------------------+--------------------+-----------------+-----------------+
 |CTRL_               | ✅                      | ❌                   | ❌                 | ❌              | ❌              |
 +--------------------+-------------------------+----------------------+--------------------+-----------------+-----------------+
+|Deberta_            | ✅                      | ✅                   | ✅                 | ❌              | ✅              |
++--------------------+-------------------------+----------------------+--------------------+-----------------+-----------------+
+|DebertaV2_          | ✅                      | ✅                   | ✅                 | ❌              | ✅              |
++--------------------+-------------------------+----------------------+--------------------+-----------------+-----------------+
 |DistilBert_         | ✅                      | ✅                   | ✅                 | ❌              | ❌              |
 +--------------------+-------------------------+----------------------+--------------------+-----------------+-----------------+
 |ELECTRA_            | ✅                      | ✅                   | ✅                 | ❌              | ✅              |
@@ -220,6 +226,8 @@ Transformer预训练模型适用任务汇总
 .. _ChineseBert: https://arxiv.org/abs/2106.16038
 .. _ConvBert: https://arxiv.org/abs/2008.02496
 .. _CTRL: https://arxiv.org/abs/1909.05858
+.. _DeBERTa: https://arxiv.org/abs/2006.03654
+.. _DebertaV2: https://arxiv.org/abs/2111.09543
 .. _DistilBert: https://arxiv.org/abs/1910.01108
 .. _ELECTRA: https://arxiv.org/abs/2003.10555
 .. _ERNIE: https://arxiv.org/abs/1904.09223
 
@@ -0,0 +1,17 @@
+
+
+------------------------------------
+Deberta模型汇总
+------------------------------------
+
+
+
+下表汇总介绍了目前PaddleNLP支持的Deberta模型对应预训练权重。
+
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+| Pretrained Weight                                                                | Language     | Details of the model                                                             |
++==================================================================================+==============+==================================================================================+
+|``microsoft/deberta-base``                                                        | English      | 12-layer, 768-hidden,                                                            |
+|                                                                                  |              | 12-heads, 100M parameters.                                                       |
+|                                                                                  |              | It outperforms BERT and RoBERTa on majority of NLU tasks with 80GB training data.|
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
@@ -0,0 +1,30 @@
+
+
+------------------------------------
+DebertaV2模型汇总
+------------------------------------
+
+
+
+下表汇总介绍了目前PaddleNLP支持的DebertaV2模型对应预训练权重。
+
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+| Pretrained Weight                                                                | Language     | Details of the model                                                             |
++==================================================================================+==============+==================================================================================+
+|``deepset/deberta-v3-large-squad2``                                               | English      | 24-layer, 1024-hidden,                                                           |
+|                                                                                  |              | 16-heads, 304M parameters.                                                       |
+|                                                                                  |              | The deberta-v3-large model fine-tuned using the SQuAD2.0 dataset.                |
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+|``microsoft/deberta-v2-xlarge``                                                   | English      | 24-layer, 1536-hidden,                                                           |
+|                                                                                  |              | 24-heads, 900M parameters.                                                       |
+|                                                                                  |              | The deberta-v2 model.                                                            |
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+|``microsoft/deberta-v3-base``                                                     | English      | 12-layer, 768-hidden,                                                            |
+|                                                                                  |              | 12-heads, 86M parameters.                                                        |
+|                                                                                  |              | The deberta-v2 model.                                                            |
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+|``microsoft/deberta-v3-large``                                                    | English      | 24-layer, 1024-hidden,                                                           |
+|                                                                                  |              | 16-heads, 304M parameters.                                                       |
+|                                                                                  |              | The deberta-v2 model.                                                            |
++----------------------------------------------------------------------------------+--------------+----------------------------------------------------------------------------------+
+
@@ -0,0 +1,7 @@
+modeling
+===========================================
+
+.. automodule:: paddlenlp.transformers.deberta.modeling
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
@@ -0,0 +1,14 @@
+deberta
+========================================
+
+.. automodule:: paddlenlp.transformers.deberta
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
+
+
+.. toctree::
+   :maxdepth: 4
+
+   paddlenlp.transformers.deberta.modeling
+   paddlenlp.transformers.deberta.tokenizer
@@ -0,0 +1,7 @@
+tokenizer
+=================================================
+
+.. automodule:: paddlenlp.transformers.deberta.tokenizer
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
@@ -0,0 +1,7 @@
+modeling
+===========================================
+
+.. automodule:: paddlenlp.transformers.deberta_v2.modeling
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
@@ -0,0 +1,14 @@
+deberta_v2
+========================================
+
+.. automodule:: paddlenlp.transformers.deberta_v2
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
+
+
+.. toctree::
+   :maxdepth: 4
+
+   paddlenlp.transformers.deberta_v2.modeling
+   paddlenlp.transformers.deberta_v2.tokenizer
@@ -0,0 +1,7 @@
+tokenizer
+=================================================
+
+.. automodule:: paddlenlp.transformers.deberta_v2.tokenizer
+   :members:
+   :no-undoc-members:
+   :show-inheritance:
@@ -24,6 +24,8 @@ paddlenlp.transformers
    paddlenlp.transformers.convbert
    paddlenlp.transformers.ctrl
    paddlenlp.transformers.dallebart
+   paddlenlp.transformers.deberta
+   paddlenlp.transformers.deberta_v2
    paddlenlp.transformers.distilbert
    paddlenlp.transformers.electra
    paddlenlp.transformers.ernie