kili-python-sdk/src/kili/services/asset_import/__init__.py at 2a0f846ed9d4912d96a8e4d9aabeceb396b08680 · kili-technology/kili-python-sdk · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
"""Service for importing objects into kili."""

from typing import TYPE_CHECKING, Optional, cast

from kili.domain.project import ProjectId
from kili.services.asset_import.exceptions import (
    ImportValidationError,
)

from .audio import AudioDataImporter
from .base import (
    BaseAbstractAssetImporter,
    LoggerParams,
    ProcessingParams,
    ProjectParams,
)
from .image import ImageDataImporter
from .llm import LLMDataImporter
from .pdf import PdfDataImporter
from .text import TextDataImporter
from .types import AssetLike
from .video import VideoDataImporter

if TYPE_CHECKING:
    from kili.client import Kili

importer_by_type: dict[str, type[BaseAbstractAssetImporter]] = {
    "AUDIO": AudioDataImporter,
    "PDF": PdfDataImporter,
    "IMAGE": ImageDataImporter,
    "GEOSPATIAL": ImageDataImporter,
    "TEXT": TextDataImporter,
    "VIDEO": VideoDataImporter,
    "VIDEO_LEGACY": VideoDataImporter,
    "LLM_RLHF": LLMDataImporter,
}


def import_assets(  # pylint: disable=too-many-arguments
    kili: "Kili",
    project_id: ProjectId,
    assets: list[dict],
    raise_error: bool = True,
    disable_tqdm: Optional[bool] = False,
    verify: bool = True,
):
    """Import the selected assets into the specified project."""
    input_type = kili.kili_api_gateway.get_project(project_id, ("inputType",))["inputType"]

    project_params = ProjectParams(project_id=project_id, input_type=input_type)
    processing_params = ProcessingParams(raise_error=raise_error, verify=verify)
    logger_params = LoggerParams(disable_tqdm=disable_tqdm)
    importer_params = (kili, project_params, processing_params, logger_params)

    if input_type not in importer_by_type:
        raise NotImplementedError(f"There is no importer for the input type: {input_type}")
    if input_type not in ["IMAGE", "GEOSPATIAL"] and any(
        asset.get("multi_layer_content") for asset in assets
    ):
        raise ImportValidationError(
            f"Import of multi-layer assets is not supported for input type: {input_type}"
        )
    asset_importer = importer_by_type[input_type](*importer_params)
    casted_assets = cast(list[AssetLike], assets)
    asset_importer.check_asset_contents(casted_assets)
    return asset_importer.import_assets(assets=casted_assets, input_type=input_type)