aws
diff --git a/‎awswrangler/catalog.py‎
Lines changed: 0 additions & 2033 deletions b/‎awswrangler/catalog.py‎
Lines changed: 0 additions & 2033 deletions
diff --git a/‎awswrangler/catalog/__init__.py‎
Lines changed: 37 additions & 0 deletions b/‎awswrangler/catalog/__init__.py‎
Lines changed: 37 additions & 0 deletions
diff --git a/‎awswrangler/catalog/_add.py‎
Lines changed: 144 additions & 0 deletions b/‎awswrangler/catalog/_add.py‎
Lines changed: 144 additions & 0 deletions
@@ -0,0 +1,37 @@
+"""Amazon Glue Catalog Module."""
+
+from awswrangler.catalog._add import add_csv_partitions, add_parquet_partitions  # noqa
+from awswrangler.catalog._create import (  # noqa
+    create_csv_table,
+    create_database,
+    create_parquet_table,
+    overwrite_table_parameters,
+    upsert_table_parameters,
+)
+from awswrangler.catalog._delete import delete_database, delete_table_if_exists  # noqa
+from awswrangler.catalog._get import (  # noqa
+    databases,
+    get_columns_comments,
+    get_connection,
+    get_csv_partitions,
+    get_databases,
+    get_engine,
+    get_parquet_partitions,
+    get_partitions,
+    get_table_description,
+    get_table_location,
+    get_table_parameters,
+    get_table_types,
+    get_tables,
+    search_tables,
+    table,
+    tables,
+)
+from awswrangler.catalog._utils import (  # noqa
+    does_table_exist,
+    drop_duplicated_columns,
+    extract_athena_types,
+    sanitize_column_name,
+    sanitize_dataframe_columns_names,
+    sanitize_table_name,
+)
@@ -0,0 +1,144 @@
+"""AWS Glue Catalog Delete Module."""
+
+import logging
+from typing import Any, Dict, List, Optional
+
+import boto3  # type: ignore
+
+from awswrangler import _utils, exceptions
+from awswrangler._config import apply_configs
+from awswrangler.catalog._definitions import _csv_partition_definition, _parquet_partition_definition
+from awswrangler.catalog._utils import _catalog_id
+
+_logger: logging.Logger = logging.getLogger(__name__)
+
+
+def _add_partitions(
+    database: str,
+    table: str,
+    boto3_session: Optional[boto3.Session],
+    inputs: List[Dict[str, Any]],
+    catalog_id: Optional[str] = None,
+):
+    chunks: List[List[Dict[str, Any]]] = _utils.chunkify(lst=inputs, max_length=100)
+    client_glue: boto3.client = _utils.client(service_name="glue", session=boto3_session)
+    for chunk in chunks:  # pylint: disable=too-many-nested-blocks
+        res: Dict[str, Any] = client_glue.batch_create_partition(
+            **_catalog_id(catalog_id=catalog_id, DatabaseName=database, TableName=table, PartitionInputList=chunk)
+        )
+        if ("Errors" in res) and res["Errors"]:
+            for error in res["Errors"]:
+                if "ErrorDetail" in error:
+                    if "ErrorCode" in error["ErrorDetail"]:
+                        if error["ErrorDetail"]["ErrorCode"] != "AlreadyExistsException":
+                            raise exceptions.ServiceApiError(str(res["Errors"]))
+
+
+@apply_configs
+def add_csv_partitions(
+    database: str,
+    table: str,
+    partitions_values: Dict[str, List[str]],
+    compression: Optional[str] = None,
+    sep: str = ",",
+    boto3_session: Optional[boto3.Session] = None,
+) -> None:
+    """Add partitions (metadata) to a CSV Table in the AWS Glue Catalog.
+
+    Parameters
+    ----------
+    database : str
+        Database name.
+    table : str
+        Table name.
+    partitions_values: Dict[str, List[str]]
+        Dictionary with keys as S3 path locations and values as a list of partitions values as str
+        (e.g. {'s3://bucket/prefix/y=2020/m=10/': ['2020', '10']}).
+    compression: str, optional
+        Compression style (``None``, ``gzip``, etc).
+    sep : str
+        String of length 1. Field delimiter for the output file.
+    boto3_session : boto3.Session(), optional
+        Boto3 Session. The default boto3 session will be used if boto3_session receive None.
+
+    Returns
+    -------
+    None
+        None.
+
+    Examples
+    --------
+    >>> import awswrangler as wr
+    >>> wr.catalog.add_csv_partitions(
+    ...     database='default',
+    ...     table='my_table',
+    ...     partitions_values={
+    ...         's3://bucket/prefix/y=2020/m=10/': ['2020', '10'],
+    ...         's3://bucket/prefix/y=2020/m=11/': ['2020', '11'],
+    ...         's3://bucket/prefix/y=2020/m=12/': ['2020', '12']
+    ...     }
+    ... )
+
+    """
+    inputs: List[Dict[str, Any]] = [
+        _csv_partition_definition(location=k, values=v, compression=compression, sep=sep)
+        for k, v in partitions_values.items()
+    ]
+    _add_partitions(database=database, table=table, boto3_session=boto3_session, inputs=inputs)
+
+
+@apply_configs
+def add_parquet_partitions(
+    database: str,
+    table: str,
+    partitions_values: Dict[str, List[str]],
+    catalog_id: Optional[str] = None,
+    compression: Optional[str] = None,
+    boto3_session: Optional[boto3.Session] = None,
+) -> None:
+    """Add partitions (metadata) to a Parquet Table in the AWS Glue Catalog.
+
+    Parameters
+    ----------
+    database : str
+        Database name.
+    table : str
+        Table name.
+    partitions_values: Dict[str, List[str]]
+        Dictionary with keys as S3 path locations and values as a list of partitions values as str
+        (e.g. {'s3://bucket/prefix/y=2020/m=10/': ['2020', '10']}).
+    catalog_id : str, optional
+        The ID of the Data Catalog from which to retrieve Databases.
+        If none is provided, the AWS account ID is used by default.
+    compression: str, optional
+        Compression style (``None``, ``snappy``, ``gzip``, etc).
+    boto3_session : boto3.Session(), optional
+        Boto3 Session. The default boto3 session will be used if boto3_session receive None.
+
+    Returns
+    -------
+    None
+        None.
+
+    Examples
+    --------
+    >>> import awswrangler as wr
+    >>> wr.catalog.add_parquet_partitions(
+    ...     database='default',
+    ...     table='my_table',
+    ...     partitions_values={
+    ...         's3://bucket/prefix/y=2020/m=10/': ['2020', '10'],
+    ...         's3://bucket/prefix/y=2020/m=11/': ['2020', '11'],
+    ...         's3://bucket/prefix/y=2020/m=12/': ['2020', '12']
+    ...     }
+    ... )
+
+    """
+    if partitions_values:
+        inputs: List[Dict[str, Any]] = [
+            _parquet_partition_definition(location=k, values=v, compression=compression)
+            for k, v in partitions_values.items()
+        ]
+        _add_partitions(
+            database=database, table=table, boto3_session=boto3_session, inputs=inputs, catalog_id=catalog_id
+        )