Fix gpt download bug (#8253)

w5688414 · web-flow · commit 84615ea086ad · 2024-04-11T14:06:34.000+08:00
diff --git a/paddlenlp/transformers/gpt/configuration.py b/paddlenlp/transformers/gpt/configuration.py
@@ -18,7 +18,7 @@
 
 from paddlenlp.transformers.configuration_utils import PretrainedConfig
 
-__all__ = ["GPT_PRETRAINED_INIT_CONFIGURATION", "GPTConfig"]
+__all__ = ["GPT_PRETRAINED_INIT_CONFIGURATION", "GPTConfig", "GPT_PRETRAINED_RESOURCE_FILES_MAP"]
 
 GPT_PRETRAINED_INIT_CONFIGURATION = {
     "gpt-cpm-large-cn": {  # 2.6B
@@ -147,6 +147,17 @@
     },
 }
 
+GPT_PRETRAINED_RESOURCE_FILES_MAP = {
+    "model_state": {
+        "gpt-cpm-large-cn": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt-cpm-large-cn.pdparams",
+        "gpt-cpm-small-cn-distill": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt-cpm-small-cn-distill.pdparams",
+        "gpt2-en": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt2-en.pdparams",
+        "gpt2-medium-en": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt2-medium-en.pdparams",
+        "gpt2-large-en": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt2-large-en.pdparams",
+        "gpt2-xl-en": "https://bj.bcebos.com/paddlenlp/models/transformers/gpt/gpt2-xl-en.pdparams",
+    }
+}
+
 
 class GPTConfig(PretrainedConfig):
     r"""
diff --git a/paddlenlp/transformers/gpt/modeling.py b/paddlenlp/transformers/gpt/modeling.py
@@ -49,7 +49,11 @@
     TokenClassifierOutput,
 )
 from ..model_utils import dy2st_nocheck_guard_context
-from .configuration import GPT_PRETRAINED_INIT_CONFIGURATION, GPTConfig
+from .configuration import (
+    GPT_PRETRAINED_INIT_CONFIGURATION,
+    GPT_PRETRAINED_RESOURCE_FILES_MAP,
+    GPTConfig,
+)
 
 try:
     from paddle.nn.functional.flash_attention import flash_attention
@@ -787,6 +791,7 @@ class GPTPretrainedModel(PretrainedModel):
     base_model_prefix = "gpt"
     config_class = GPTConfig
     pretrained_init_configuration = GPT_PRETRAINED_INIT_CONFIGURATION
+    pretrained_resource_files_map = GPT_PRETRAINED_RESOURCE_FILES_MAP
 
     @classmethod
     def _get_tensor_parallel_mappings(cls, config, is_split=True):