PaddlePaddle
diff --git a/‎paddleformers/__init__.py‎
Lines changed: 48 additions & 17 deletions b/‎paddleformers/__init__.py‎
Lines changed: 48 additions & 17 deletions
diff --git a/‎paddleformers/data/__init__.py‎
Lines changed: 93 additions & 7 deletions b/‎paddleformers/data/__init__.py‎
Lines changed: 93 additions & 7 deletions
diff --git a/‎paddleformers/datasets/__init__.py‎
Lines changed: 44 additions & 3 deletions b/‎paddleformers/datasets/__init__.py‎
Lines changed: 44 additions & 3 deletions
diff --git a/‎paddleformers/generation/__init__.py‎
Lines changed: 84 additions & 21 deletions b/‎paddleformers/generation/__init__.py‎
Lines changed: 84 additions & 21 deletions
diff --git a/‎paddleformers/mergekit/__init__.py‎
Lines changed: 27 additions & 5 deletions b/‎paddleformers/mergekit/__init__.py‎
Lines changed: 27 additions & 5 deletions
@@ -14,10 +14,19 @@
 
 import os
 import sys
+from contextlib import suppress
 from datetime import datetime
+from typing import TYPE_CHECKING
+
+from .utils.lazy_import import _LazyModule
 
 PADDLEFORMERS_STABLE_VERSION = "PADDLEFORMERS_STABLE_VERSION"
 
+with suppress(Exception):
+    import paddle
+
+    paddle.disable_signal_handler()
+
 # this version is used for develop and test.
 # release version will be added fixed version by setup.py.
 __version__ = "0.1.2.post"
@@ -38,20 +47,42 @@
         "This may cause PaddleFormers datasets to be unavailable in intranet. "
         "Please import paddleformers before datasets module to avoid download issues"
     )
-import paddle
-
-from . import (
-    data,
-    datasets,
-    mergekit,
-    ops,
-    peft,
-    quantization,
-    trainer,
-    transformers,
-    trl,
-    utils,
-    version,
-)
-
-paddle.disable_signal_handler()
+
+# module index
+modules = [
+    "data",
+    "datasets",
+    "mergekit",
+    "ops",
+    "peft",
+    "quantization",
+    "trainer",
+    "transformers",
+    "trl",
+    "utils",
+    "version",
+]
+import_structure = {module: [] for module in modules}
+
+if TYPE_CHECKING:
+    from . import (
+        data,
+        datasets,
+        mergekit,
+        ops,
+        peft,
+        quantization,
+        trainer,
+        transformers,
+        trl,
+        utils,
+        version,
+    )
+else:
+    sys.modules[__name__] = _LazyModule(
+        __name__,
+        globals()["__file__"],
+        import_structure,
+        module_spec=__spec__,
+        extra_objects={"__version__": __version__},
+    )
@@ -12,10 +12,96 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from .blendable_dataset import *
-from .causal_dataset import *
-from .collate import *
-from .data_collator import *
-from .dist_dataloader import *
-from .sampler import *
-from .vocab import *
+
+import sys
+from typing import TYPE_CHECKING
+
+from ..utils.lazy_import import _LazyModule
+
+import_structure = {
+    "sampler": ["SamplerHelper"],
+    "causal_dataset": [
+        "check_data_split",
+        "get_train_valid_test_split_",
+        "get_datasets_weights_and_num_samples",
+        "print_rank_0",
+        "build_train_valid_test_datasets",
+        "_build_train_valid_test_datasets",
+        "get_indexed_dataset_",
+        "GPTDataset",
+        "_build_index_mappings",
+        "_num_tokens",
+        "_num_epochs",
+        "_build_doc_idx",
+        "_build_sample_idx",
+        "_build_shuffle_idx",
+    ],
+    "data_collator": [
+        "DataCollatorForSeq2Seq",
+        "default_data_collator",
+        "DataCollator",
+        "DataCollatorWithPadding",
+        "InputDataClass",
+        "DataCollatorMixin",
+        "paddle_default_data_collator",
+        "numpy_default_data_collator",
+        "DefaultDataCollator",
+        "DataCollatorForTokenClassification",
+        "DataCollatorForEmbedding",
+        "_paddle_collate_batch",
+        "_numpy_collate_batch",
+        "tolist",
+        "DataCollatorForLanguageModeling",
+    ],
+    "dist_dataloader": ["DummyDataset", "IterableDummyDataset", "DistDataLoader", "init_dataloader_comm_group"],
+    "blendable_dataset": ["print_rank_0", "BlendableDataset"],
+    "collate": ["Dict", "Pad", "Stack", "Tuple"],
+    "vocab": ["Vocab"],
+    "tokenizer": ["BaseTokenizer"],
+    "indexed_dataset": [
+        "print_rank_0",
+        "get_available_dataset_impl",
+        "make_dataset",
+        "make_sft_dataset",
+        "dataset_exists",
+        "read_longs",
+        "write_longs",
+        "read_shorts",
+        "write_shorts",
+        "dtypes",
+        "code",
+        "index_file_path",
+        "sft_index_file_path",
+        "sft_data_file_path",
+        "data_file_path",
+        "loss_mask_file_path",
+        "create_doc_idx",
+        "IndexedDataset",
+        "IndexedDatasetBuilder",
+        "_warmup_mmap_file",
+        "MMapIndexedDataset",
+        "SFTMMapIndexedDataset",
+        "make_builder",
+        "SFTMMapIndexedDatasetBuilder",
+        "MMapIndexedDatasetBuilder",
+        "get_indexed_dataset_",
+        "CompatibleIndexedDataset",
+    ],
+}
+
+
+if TYPE_CHECKING:
+    from .blendable_dataset import *
+    from .causal_dataset import *
+    from .collate import *
+    from .data_collator import *
+    from .dist_dataloader import *
+    from .sampler import *
+    from .vocab import *
+else:
+    sys.modules[__name__] = _LazyModule(
+        __name__,
+        globals()["__file__"],
+        import_structure,
+        module_spec=__spec__,
+    )
@@ -12,7 +12,48 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
+import sys
+from typing import TYPE_CHECKING
 
-from .dataset import *
-from .embedding_dataset import *
-from .zero_padding_dataset import *
+from ..utils.lazy_import import _LazyModule
+
+import_structure = {
+    "zero_padding_dataset": [
+        "block_diag",
+        "generate_greedy_packs",
+        "ZeroPadding",
+        "ZeroPaddingMapDataset",
+        "ZeroPaddingIterableDataset",
+    ],
+    "dataset": [
+        "load_from_ppnlp",
+        "DatasetTuple",
+        "import_main_class",
+        "load_from_hf",
+        "load_dataset",
+        "MapDataset",
+        "IterDataset",
+        "DatasetBuilder",
+        "SimpleBuilder",
+    ],
+    "embedding_dataset": [
+        "Example",
+        "Sequence",
+        "Pair",
+        "EmbeddingDatasetMixin",
+        "EmbeddingDataset",
+        "EmbeddingIterableDataset",
+    ],
+}
+
+if TYPE_CHECKING:
+    from .dataset import *
+    from .embedding_dataset import *
+    from .zero_padding_dataset import *
+else:
+    sys.modules[__name__] = _LazyModule(
+        __name__,
+        globals()["__file__"],
+        import_structure,
+        module_spec=__spec__,
+    )
@@ -11,24 +11,87 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
-from .configuration_utils import GenerationConfig
-from .logits_process import (
-    ForcedBOSTokenLogitsProcessor,
-    ForcedEOSTokenLogitsProcessor,
-    HammingDiversityLogitsProcessor,
-    LogitsProcessor,
-    LogitsProcessorList,
-    MinLengthLogitsProcessor,
-    RepetitionPenaltyLogitsProcessor,
-    TopKProcess,
-    TopPProcess,
-)
-from .stopping_criteria import (
-    MaxLengthCriteria,
-    MaxTimeCriteria,
-    StoppingCriteria,
-    StoppingCriteriaList,
-    validate_stopping_criteria,
-)
-from .streamers import BaseStreamer, TextIteratorStreamer, TextStreamer
-from .utils import BeamSearchScorer, GenerationMixin, get_unfinished_flag
+
+import sys
+from typing import TYPE_CHECKING
+
+from ..utils.lazy_import import _LazyModule
+
+import_structure = {
+    "utils": [
+        "GenerationMixin",
+        "MinLengthLogitsProcessor",
+        "convert_dtype",
+        "get_unfinished_flag",
+        "LogitsProcessor",
+        "BeamHypotheses",
+        "RepetitionPenaltyLogitsProcessor",
+        "LogitsProcessorList",
+        "TopKProcess",
+        "map_structure",
+        "BeamSearchScorer",
+        "TopPProcess",
+        "get_scale_by_dtype",
+        "validate_stopping_criteria",
+    ],
+    "model_outputs": ["ModelOutput"],
+    "configuration_utils": ["GenerationConfig", "resolve_hf_generation_config_path"],
+    "logits_process": [
+        "MinLengthLogitsProcessor",
+        "SequenceBiasLogitsProcessor",
+        "NoRepeatNGramLogitsProcessor",
+        "PrefixConstrainedLogitsProcessor",
+        "TopPProcess",
+        "LogitsWarper",
+        "HammingDiversityLogitsProcessor",
+        "ForcedEOSTokenLogitsProcessor",
+        "ForcedBOSTokenLogitsProcessor",
+        "LogitsProcessor",
+        "RepetitionPenaltyLogitsProcessor",
+        "TemperatureLogitsWarper",
+        "TopKProcess",
+        "_get_ngrams",
+        "_get_generated_ngrams",
+        "LogitsProcessorList",
+        "NoBadWordsLogitsProcessor",
+        "_calc_banned_ngram_tokens",
+    ],
+    "stopping_criteria": [
+        "validate_stopping_criteria",
+        "StoppingCriteria",
+        "MaxLengthCriteria",
+        "StoppingCriteriaList",
+        "MaxTimeCriteria",
+    ],
+    "streamers": ["BaseStreamer", "TextIteratorStreamer", "TextStreamer"],
+}
+
+if TYPE_CHECKING:
+    from .configuration_utils import GenerationConfig
+    from .logits_process import (
+        ForcedBOSTokenLogitsProcessor,
+        ForcedEOSTokenLogitsProcessor,
+        HammingDiversityLogitsProcessor,
+        LogitsProcessor,
+        LogitsProcessorList,
+        MinLengthLogitsProcessor,
+        RepetitionPenaltyLogitsProcessor,
+        TopKProcess,
+        TopPProcess,
+    )
+    from .stopping_criteria import (
+        MaxLengthCriteria,
+        MaxTimeCriteria,
+        StoppingCriteria,
+        StoppingCriteriaList,
+        validate_stopping_criteria,
+    )
+    from .streamers import BaseStreamer, TextIteratorStreamer, TextStreamer
+    from .utils import BeamSearchScorer, GenerationMixin, get_unfinished_flag
+else:
+    sys.modules[__name__] = _LazyModule(
+        __name__,
+        globals()["__file__"],
+        import_structure,
+        module_spec=__spec__,
+    )
@@ -12,8 +12,30 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from .merge_config import *
-from .merge_method import *
-from .merge_model import *
-from .merge_utils import *
-from .sparsify_method import *
+
+import sys
+from typing import TYPE_CHECKING
+
+from ..utils.lazy_import import _LazyModule
+
+import_structure = {
+    "merge_model": ["save_file", "device_guard", "divide_lora_key_list", "divide_positions", "MergeModel"],
+    "merge_method": ["MergeMethod"],
+    "sparsify_method": ["SparsifyMethod"],
+    "merge_utils": ["divide_positions", "divide_lora_key_list", "divide_safetensor_key_list"],
+    "merge_config": ["MergeConfig"],
+}
+
+if TYPE_CHECKING:
+    from .merge_config import *
+    from .merge_method import *
+    from .merge_model import *
+    from .merge_utils import *
+    from .sparsify_method import *
+else:
+    sys.modules[__name__] = _LazyModule(
+        __name__,
+        globals()["__file__"],
+        import_structure,
+        module_spec=__spec__,
+    )