[DOP-22344] Add transformations for Transfers with file filtering

Ilyas Gasanov · Ilyas Gasanov · commit 407f230cfd65 · 2025-02-07T15:30:30.000+03:00
diff --git a/docs/changelog/next_release/198.feature.rst b/docs/changelog/next_release/198.feature.rst
@@ -0,0 +1 @@
+Add transformations for **Transfers** with file filtering
diff --git a/poetry.lock b/poetry.lock
diff --git a/pyproject.toml b/pyproject.toml
@@ -59,7 +59,7 @@ pyjwt = { version = "^2.10.1", optional = true }
 jinja2 = { version = "^3.1.4", optional = true }
 python-multipart = { version = ">=0.0.9,<0.0.21", optional = true }
 celery = { version = "^5.4.0", optional = true }
-onetl = { version = "^0.12.0", extras = ["spark"], optional = true }
+onetl = { git = "https://github.com/MobileTeleSystems/onetl.git", rev = "develop", extras = ["spark"] }
 pyyaml = {version = "*", optional = true}
 # due to not supporting MacOS 14.x https://www.psycopg.org/psycopg3/docs/news.html#psycopg-3-1-20
 psycopg = { version = ">=3.1.0,<3.2.5", extras = ["binary"], optional = true }
@@ -132,7 +132,7 @@ pytest-randomly = "^3.15.0"
 pytest-deadfixtures = "^2.2.1"
 pytest-mock = "^3.14.0"
 pytest-lazy-fixtures = "^1.1.1"
-onetl = {extras = ["spark", "s3", "hdfs", "files"], version = "^0.12.0"}
+onetl = { git = "https://github.com/MobileTeleSystems/onetl.git", rev = "develop", extras = ["spark", "s3", "hdfs", "files"] }
 faker = ">=33.3,<36.0"
 coverage = "^7.6.1"
 gevent = "^24.2.1"
diff --git a/syncmaster/schemas/v1/transfers/__init__.py b/syncmaster/schemas/v1/transfers/__init__.py
@@ -65,6 +65,9 @@
 from syncmaster.schemas.v1.transfers.transformations.dataframe_rows_filter import (
     DataframeRowsFilter,
 )
+from syncmaster.schemas.v1.transfers.transformations.file_metadata_filter import (
+    FileMetadataFilter,
+)
 from syncmaster.schemas.v1.types import NameConstr
 
 ReadTransferSchemaSource = (
@@ -165,7 +168,7 @@
     | None
 )
 
-TransformationSchema = DataframeRowsFilter | DataframeColumnsFilter
+TransformationSchema = DataframeRowsFilter | DataframeColumnsFilter | FileMetadataFilter
 
 
 class CopyTransferSchema(BaseModel):
diff --git a/syncmaster/schemas/v1/transfers/transformations/file_metadata_filter.py b/syncmaster/schemas/v1/transfers/transformations/file_metadata_filter.py
@@ -0,0 +1,35 @@
+# SPDX-FileCopyrightText: 2023-2024 MTS PJSC
+# SPDX-License-Identifier: Apache-2.0
+from typing import Annotated, Literal
+
+from pydantic import BaseModel, Field
+
+from syncmaster.schemas.v1.transformation_types import FILE_METADATA_FILTER
+
+
+class BaseMetadataFilter(BaseModel):
+    value: str
+
+
+class NameGlobFilter(BaseMetadataFilter):
+    type: Literal["name_glob"]
+
+
+class NameRegexpFilter(BaseMetadataFilter):
+    type: Literal["name_regexp"]
+
+
+class FileSizeMinFilter(BaseMetadataFilter):
+    type: Literal["file_size_min"]
+
+
+class FileSizeMaxFilter(BaseMetadataFilter):
+    type: Literal["file_size_max"]
+
+
+MetadataFilter = NameGlobFilter | NameRegexpFilter | FileSizeMinFilter | FileSizeMaxFilter
+
+
+class FileMetadataFilter(BaseModel):
+    type: FILE_METADATA_FILTER
+    filters: list[Annotated[MetadataFilter, Field(..., discriminator="type")]] = Field(default_factory=list)
diff --git a/syncmaster/schemas/v1/transformation_types.py b/syncmaster/schemas/v1/transformation_types.py
@@ -4,3 +4,4 @@
 
 DATAFRAME_ROWS_FILTER = Literal["dataframe_rows_filter"]
 DATAFRAME_COLUMNS_FILTER = Literal["dataframe_columns_filter"]
+FILE_METADATA_FILTER = Literal["file_metadata_filter"]
diff --git a/syncmaster/server/providers/auth/keycloak_provider.py b/syncmaster/server/providers/auth/keycloak_provider.py
@@ -94,8 +94,8 @@ async def get_current_user(self, access_token: str, *args, **kwargs) -> Any:
             try:
                 new_tokens = await self.refresh_access_token(refresh_token)
 
-                new_access_token = new_tokens.get("access_token")
-                new_refresh_token = new_tokens.get("refresh_token")
+                new_access_token = new_tokens["access_token"]
+                new_refresh_token = new_tokens["refresh_token"]
                 request.session["access_token"] = new_access_token
                 request.session["refresh_token"] = new_refresh_token
 
@@ -107,11 +107,15 @@ async def get_current_user(self, access_token: str, *args, **kwargs) -> Any:
                 log.debug("Failed to refresh access token: %s", e)
                 self.redirect_to_auth(request.url.path)
 
+        if not token_info:
+            raise AuthorizationError("Invalid token payload")
+
         # these names are hardcoded in keycloak:
         # https://github.com/keycloak/keycloak/blob/3ca3a4ad349b4d457f6829eaf2ae05f1e01408be/core/src/main/java/org/keycloak/representations/IDToken.java
+        # TODO: make sure which fields are guaranteed
         user_id = token_info.get("sub")
-        login = token_info.get("preferred_username")
-        email = token_info.get("email")
+        login = token_info["preferred_username"]
+        email = token_info["email"]
         first_name = token_info.get("given_name")
         middle_name = token_info.get("middle_name")
         last_name = token_info.get("family_name")
diff --git a/syncmaster/worker/handlers/db/base.py b/syncmaster/worker/handlers/db/base.py
@@ -79,21 +79,15 @@ def _get_rows_filter_expression(self) -> str | None:
             if transformation["type"] == "dataframe_rows_filter":
                 expressions.extend(transformation["filters"])
 
-        if expressions:
-            return self._make_rows_filter_expression(expressions)
-
-        return None
+        return self._make_rows_filter_expression(expressions)
 
     def _get_columns_filter_expressions(self) -> list[str] | None:
         expressions = []
         for transformation in self.transfer_dto.transformations:
             if transformation["type"] == "dataframe_columns_filter":
                 expressions.extend(transformation["filters"])
 
-        if expressions:
-            return self._make_columns_filter_expressions(expressions)
-
-        return None
+        return self._make_columns_filter_expressions(expressions)
 
     @staticmethod
     def _quote_field(field: str) -> str:
diff --git a/syncmaster/worker/handlers/file/base.py b/syncmaster/worker/handlers/file/base.py
@@ -68,7 +68,7 @@ def write(self, df: DataFrame) -> None:
 
         return writer.run(df=df)
 
-    def _make_rows_filter_expression(self, filters: list[dict]) -> str:
+    def _make_rows_filter_expression(self, filters: list[dict]) -> str | None:
         expressions = []
         for filter in filters:
             field = filter["field"]
@@ -77,7 +77,7 @@ def _make_rows_filter_expression(self, filters: list[dict]) -> str:
 
             expressions.append(f"{field} {op} '{value}'" if value is not None else f"{field} {op}")
 
-        return " AND ".join(expressions)
+        return " AND ".join(expressions) or None
 
     def _make_columns_filter_expressions(self, filters: list[dict]) -> list[str] | None:
         # TODO: another approach is to use df.select(col("col1"), col("col2").alias("new_col2"), ...)
@@ -103,18 +103,12 @@ def _get_rows_filter_expression(self) -> str | None:
             if transformation["type"] == "dataframe_rows_filter":
                 expressions.extend(transformation["filters"])
 
-        if expressions:
-            return self._make_rows_filter_expression(expressions)
-
-        return None
+        return self._make_rows_filter_expression(expressions)
 
     def _get_columns_filter_expressions(self) -> list[str] | None:
         expressions = []
         for transformation in self.transfer_dto.transformations:
             if transformation["type"] == "dataframe_columns_filter":
                 expressions.extend(transformation["filters"])
 
-        if expressions:
-            return self._make_columns_filter_expressions(expressions)
-
-        return None
+        return self._make_columns_filter_expressions(expressions)
diff --git a/syncmaster/worker/handlers/file/protocol.py b/syncmaster/worker/handlers/file/protocol.py
@@ -7,6 +7,7 @@
 from typing import TYPE_CHECKING
 
 from onetl.file import FileDFReader, FileDFWriter, FileDownloader, FileUploader
+from onetl.file.filter import FileSizeRange, Glob, Regexp
 
 from syncmaster.worker.handlers.file.base import FileHandler
 
@@ -23,6 +24,7 @@ def read(self) -> DataFrame:
             connection=self.connection,
             source_path=self.transfer_dto.directory_path,
             local_path=self.temp_dir.name,
+            filters=self._get_file_metadata_filters(),
         )
         downloader.run()
 
@@ -65,3 +67,28 @@ def write(self, df: DataFrame) -> None:
             options=self.transfer_dto.options,
         )
         uploader.run()
+
+    def _make_file_metadata_filters(self, filters: list[dict]) -> list[Glob | Regexp | FileSizeRange]:
+        processed_filters = []
+        for filter in filters:
+            filter_type = filter["type"]
+            value = filter["value"]
+
+            if filter_type == "name_glob":
+                processed_filters.append(Glob(value))
+            elif filter_type == "name_regexp":
+                processed_filters.append(Regexp(value))
+            elif filter_type == "file_size_min":
+                processed_filters.append(FileSizeRange(min=value))
+            elif filter_type == "file_size_max":
+                processed_filters.append(FileSizeRange(max=value))
+
+        return processed_filters
+
+    def _get_file_metadata_filters(self) -> list[Glob | Regexp | FileSizeRange]:
+        expressions = []
+        for transformation in self.transfer_dto.transformations:
+            if transformation["type"] == "file_metadata_filter":
+                expressions.extend(transformation["filters"])
+
+        return self._make_file_metadata_filters(expressions)
diff --git a/tests/resources/file_connection/csv/for_file_filtering/file.csv b/tests/resources/file_connection/csv/for_file_filtering/file.csv
@@ -0,0 +1,28 @@
+ID,PHONE_NUMBER,REGION,NUMBER,BIRTH_DATE,REGISTERED_AT,ACCOUNT_BALANCE
+7282,+7 (691) 449-06-79,клх Ейск,1,2011-04-26,2006-02-14T09:36:15.589307+00:00,5596.5715
+5716,8 (852) 546-3243,г. Карачаевск,2,2020-04-19,2011-05-30T03:18:33.454814+00:00,7161.7426
+815,+1-777-622-4699,South Ashleyshire,3,2014-11-20,1998-11-09T22:46:12.228133+00:00,3897.5482
+7497,278-262-8115,ст. Комсомольск-на-Амуре,4,2004-02-19,1991-02-08T01:34:38.319212+00:00,5475.3048
+7570,3857284085,клх Химки,5,1991-04-17,2012-09-24T19:44:52.342526+00:00,8683.9899
+6160,+7 438 458 0404,ст. Балашиха,6,2013-10-05,2018-08-07T14:15:30.500278+00:00,397.8062
+3355,8 (727) 522-68-10,Careyview,7,1984-09-13,1977-09-21T08:02:16.691351+00:00,9984.1109
+4399,8 (950) 887-6214,Meyerport,8,2000-12-28,1991-01-26T19:49:01.052404+00:00,2138.7511
+4438,+7 (986) 346-45-32,клх Новый Оскол,9,1976-04-05,1987-10-01T19:40:43.435484+00:00,5379.6649
+3554,+1-241-698-1734x68678,ст. Грозный,10,1972-04-19,2003-10-19T23:39:25.607917+00:00,7344.857
+4376,635.306.7174x6895,с. Северодвинск,11,2009-12-19,2014-12-10T23:57:38.978435+00:00,90.9397
+6686,001-439-525-7944x0894,к. Охотск,12,2007-02-20,1982-12-11T21:36:51.431771+00:00,2012.0701
+4530,83371734832,г. Гаврилов-Ям,13,2000-02-08,1990-09-26T14:14:24.544322+00:00,9158.2148
+7229,+7 (928) 455-59-50,с. Петрозаводск,14,1987-02-22,2021-03-29T21:17:08.110878+00:00,9495.4051
+7228,479-469-4465,New Christopher,15,1976-04-25,1976-07-21T10:25:29.538945+00:00,5459.1735
+4306,001-431-242-8450x83170,Port Timothyfort,16,1990-04-28,1997-12-01T03:02:08.306977+00:00,1746.0504
+4458,+70438690715,п. Балтийск,17,2016-09-05,2024-01-11T06:34:09.873247+00:00,8563.8989
+8589,828-839-2009x5127,Baileytown,18,1996-01-01,2003-11-05T22:26:28.069468+00:00,707.4749
+6180,401.205.7356,Karenside,19,1989-04-05,2010-12-07T06:18:41.647421+00:00,7321.6199
+6130,642-456-8305x73206,North Darlene,20,2001-08-10,1991-11-20T05:45:19.379241+00:00,7529.7984
+4874,+73613741079,ст. Тамбей,21,2019-08-17,1999-09-07T16:58:59.105933+00:00,2465.4116
+6662,(882)500-1941x491,ст. Пермь,22,1995-07-10,1970-04-09T18:18:03.033712+00:00,8278.2693
+4301,+7 (535) 260-55-27,New Christopher,23,1992-11-21,1994-12-05T13:46:34.451286+00:00,1974.0252
+1794,001-933-371-2198,с. Приморско-Ахтарск,24,2013-05-19,1998-10-29T17:15:46.207609+00:00,8753.7965
+5096,001-499-346-5978x39210,ст. Лотошино,25,1995-01-18,1993-03-29T00:11:40.463076+00:00,4226.1755
+5605,8 (413) 673-89-27,Wolfeville,26,1990-03-05,1994-10-20T17:38:21.039941+00:00,5931.4869
+9845,+7 366 768 7792,East Zachary,27,2017-05-12,2001-08-28T13:15:21.965741+00:00,8716.9687
diff --git a/tests/resources/file_connection/csv/for_file_filtering/file.txt b/tests/resources/file_connection/csv/for_file_filtering/file.txt
@@ -0,0 +1,28 @@
+ID,PHONE_NUMBER,REGION,NUMBER,BIRTH_DATE,REGISTERED_AT,ACCOUNT_BALANCE
+7282,+7 (691) 449-06-79,клх Ейск,1,2011-04-26,2006-02-14T09:36:15.589307+00:00,5596.5715
+5716,8 (852) 546-3243,г. Карачаевск,2,2020-04-19,2011-05-30T03:18:33.454814+00:00,7161.7426
+815,+1-777-622-4699,South Ashleyshire,3,2014-11-20,1998-11-09T22:46:12.228133+00:00,3897.5482
+7497,278-262-8115,ст. Комсомольск-на-Амуре,4,2004-02-19,1991-02-08T01:34:38.319212+00:00,5475.3048
+7570,3857284085,клх Химки,5,1991-04-17,2012-09-24T19:44:52.342526+00:00,8683.9899
+6160,+7 438 458 0404,ст. Балашиха,6,2013-10-05,2018-08-07T14:15:30.500278+00:00,397.8062
+3355,8 (727) 522-68-10,Careyview,7,1984-09-13,1977-09-21T08:02:16.691351+00:00,9984.1109
+4399,8 (950) 887-6214,Meyerport,8,2000-12-28,1991-01-26T19:49:01.052404+00:00,2138.7511
+4438,+7 (986) 346-45-32,клх Новый Оскол,9,1976-04-05,1987-10-01T19:40:43.435484+00:00,5379.6649
+3554,+1-241-698-1734x68678,ст. Грозный,10,1972-04-19,2003-10-19T23:39:25.607917+00:00,7344.857
+4376,635.306.7174x6895,с. Северодвинск,11,2009-12-19,2014-12-10T23:57:38.978435+00:00,90.9397
+6686,001-439-525-7944x0894,к. Охотск,12,2007-02-20,1982-12-11T21:36:51.431771+00:00,2012.0701
+4530,83371734832,г. Гаврилов-Ям,13,2000-02-08,1990-09-26T14:14:24.544322+00:00,9158.2148
+7229,+7 (928) 455-59-50,с. Петрозаводск,14,1987-02-22,2021-03-29T21:17:08.110878+00:00,9495.4051
+7228,479-469-4465,New Christopher,15,1976-04-25,1976-07-21T10:25:29.538945+00:00,5459.1735
+4306,001-431-242-8450x83170,Port Timothyfort,16,1990-04-28,1997-12-01T03:02:08.306977+00:00,1746.0504
+4458,+70438690715,п. Балтийск,17,2016-09-05,2024-01-11T06:34:09.873247+00:00,8563.8989
+8589,828-839-2009x5127,Baileytown,18,1996-01-01,2003-11-05T22:26:28.069468+00:00,707.4749
+6180,401.205.7356,Karenside,19,1989-04-05,2010-12-07T06:18:41.647421+00:00,7321.6199
+6130,642-456-8305x73206,North Darlene,20,2001-08-10,1991-11-20T05:45:19.379241+00:00,7529.7984
+4874,+73613741079,ст. Тамбей,21,2019-08-17,1999-09-07T16:58:59.105933+00:00,2465.4116
+6662,(882)500-1941x491,ст. Пермь,22,1995-07-10,1970-04-09T18:18:03.033712+00:00,8278.2693
+4301,+7 (535) 260-55-27,New Christopher,23,1992-11-21,1994-12-05T13:46:34.451286+00:00,1974.0252
+1794,001-933-371-2198,с. Приморско-Ахтарск,24,2013-05-19,1998-10-29T17:15:46.207609+00:00,8753.7965
+5096,001-499-346-5978x39210,ст. Лотошино,25,1995-01-18,1993-03-29T00:11:40.463076+00:00,4226.1755
+5605,8 (413) 673-89-27,Wolfeville,26,1990-03-05,1994-10-20T17:38:21.039941+00:00,5931.4869
+9845,+7 366 768 7792,East Zachary,27,2017-05-12,2001-08-28T13:15:21.965741+00:00,8716.9687
diff --git a/tests/resources/file_connection/csv/for_file_filtering/large_file.csv b/tests/resources/file_connection/csv/for_file_filtering/large_file.csv
@@ -0,0 +1,55 @@
+ID,PHONE_NUMBER,REGION,NUMBER,BIRTH_DATE,REGISTERED_AT,ACCOUNT_BALANCE
+5401,(612)994-6366x697,North Robertview,1,2021-08-24,1990-01-31T14:51:41.116624+00:00,8133.8808
+4445,+7 (081) 960-8324,West Mitchellhaven,2,2024-11-22,1976-04-17T21:08:13.261415+00:00,271.6555
+4318,+1-824-301-7019x1541,Brittanyview,3,1982-09-17,1988-08-06T20:11:43.624514+00:00,8696.7694
+9604,+1-616-889-3460x0783,Lawrenceshire,4,2011-04-05,2016-03-21T17:16:59.963273+00:00,7334.0825
+2617,350.449.9166,Delgadomouth,5,2013-12-30,1989-06-30T04:59:41.924259+00:00,7405.6783
+6228,(318)268-9782x4356,г. Слюдянка,6,1984-04-22,1982-10-28T10:14:25.574158+00:00,3028.7511
+4832,569-200-2134,East Jamesshire,7,1970-03-16,2017-07-25T03:57:31.360859+00:00,7189.1356
+2325,8 545 109 3032,Brownside,8,2019-05-07,1977-08-23T00:33:35.980524+00:00,7526.0043
+2813,8 728 186 4367,Lake Cameronberg,9,1997-08-07,1983-07-07T08:35:21.339505+00:00,1922.3577
+8454,(739)807-6409,Alishabury,10,1996-01-27,2004-07-24T16:46:08.884485+00:00,7222.4738
+5606,+7 334 207 27 25,West Samuelmouth,11,2005-09-28,2008-09-14T03:42:35.855769+00:00,6449.8758
+4084,8 (414) 124-5455,East Ryan,12,2007-08-20,1977-09-30T03:45:34.091804+00:00,2735.4785
+4804,+1-293-238-7776,Sheltonberg,13,2014-10-13,2018-08-08T22:37:17.010331+00:00,3112.611
+3088,544.625.0131x441,ст. Лабытнанги,14,1994-10-17,2013-02-21T11:51:38.998164+00:00,2953.3245
+3514,+7 516 629 5589,Brownhaven,15,2024-01-04,1990-04-05T00:16:16.528791+00:00,3522.6961
+5352,+7 (798) 476-3030,клх Смирных,16,1990-02-08,1981-07-14T01:28:21.624703+00:00,5387.6461
+7618,+7 (603) 849-42-55,Danielshire,17,1999-01-01,2007-10-21T12:02:51.169618+00:00,6040.7639
+6568,82916686742,к. Кетченеры,18,1985-03-27,2007-01-03T04:04:35.778909+00:00,1083.2623
+7117,89729209282,East Joannestad,19,2024-10-28,1977-01-06T22:39:05.817553+00:00,8630.6767
+1211,722.948.8556x6205,д. Гатчина,20,2004-09-06,2016-08-15T11:49:35.224455+00:00,5546.1445
+7705,8 (319) 983-83-53,с. Тутончаны,21,2012-02-14,2011-04-02T01:56:06.995264+00:00,9204.4631
+6817,8 (522) 334-5711,Port Jason,22,2004-10-29,2007-06-12T13:32:19.007801+00:00,714.125
+1332,8 478 521 9154,Perryhaven,23,2002-10-08,2011-06-29T09:48:43.082152+00:00,3997.7366
+3389,+1-855-665-6032,South Joshuabury,24,1975-04-04,1970-03-27T16:32:05.879168+00:00,3795.3309
+8018,+7 455 928 94 83,к. Эльтон,25,1994-10-18,2001-04-06T10:29:11.714611+00:00,4581.5433
+223,+7 134 011 2080,д. Лесной (Сверд.),26,2019-01-26,1973-02-10T04:11:36.218626+00:00,346.9418
+2344,+7 (884) 795-2230,ст. Невьянск,27,1977-05-30,1974-04-06T14:44:16.665658+00:00,5618.7341
+3360,+7 340 530 80 48,клх Дмитров,28,2023-03-24,1989-09-25T06:05:49.225882+00:00,9833.3088
+886,265-588-1138,г. Оленегорск (Якут.),29,2019-01-19,2009-12-25T04:52:24.204947+00:00,5102.6538
+6742,82064201016,г. Красноуфимск,30,1995-09-10,1990-09-02T06:52:56.667951+00:00,8721.8153
+7652,(537)379-8088x903,д. Жуковский,31,1990-12-26,2008-02-14T10:47:15.131450+00:00,3280.7563
+9219,813.483.8517,Hartmouth,32,2001-12-29,2017-02-28T01:57:00.891990+00:00,69.6551
+4840,8 (954) 185-8983,г. Касимов,33,2014-06-18,1983-01-31T16:00:34.184385+00:00,6014.4565
+9729,8 (723) 650-4242,д. Череповец,34,1992-03-26,1978-11-17T01:19:44.990573+00:00,5376.6063
+8039,8 (671) 084-1974,East Cindystad,35,1981-04-28,1998-08-18T09:05:05.544105+00:00,3330.7474
+5585,+7 790 194 7780,ст. Шаховская,36,2024-04-21,1995-03-02T19:47:42.992476+00:00,8562.4235
+5854,001-631-755-9442x3228,New Samantha,37,2011-09-09,1986-04-28T23:48:24.281412+00:00,8477.1846
+974,+71987632329,Robinbury,38,2022-06-03,1992-02-01T18:52:15.035729+00:00,1088.6179
+9097,(893)566-3953,Rebeccaview,39,2019-09-07,1991-02-02T19:52:19.178704+00:00,8149.6262
+2965,+76985060299,к. Невельск,40,1999-06-30,1976-09-25T19:02:30.946040+00:00,632.705
+3837,80557330623,г. Россошь,41,2008-01-27,2002-06-25T18:01:36.592421+00:00,3320.8555
+6991,+1-706-836-4187x84724,New Donaldport,42,1975-10-22,2016-10-03T01:16:09.376286+00:00,9175.2545
+3204,8 976 896 01 88,Howellland,43,2013-06-13,2007-06-07T07:15:58.719946+00:00,9685.7303
+3502,870.886.4228,к. Верхоянск,44,1987-06-19,2024-01-22T16:59:11.899087+00:00,3057.4238
+2291,8 (291) 012-6864,Hollymouth,45,1984-08-14,2018-08-21T07:13:21.116847+00:00,6182.9872
+4333,272-750-3677x66594,д. Псебай,46,1981-09-29,2017-05-27T01:48:53.329379+00:00,2884.4758
+9895,001-863-547-0639x8775,д. Махачкала,47,1992-08-08,2007-02-15T06:51:25.041999+00:00,3061.4572
+8172,(766)864-7667x70310,Randyton,48,2009-12-22,1998-05-30T15:35:18.844453+00:00,5012.0786
+5286,+7 312 946 81 84,Melanieside,49,1977-12-13,2025-02-04T19:01:59.132166+00:00,6965.285
+3240,423-530-0433x74918,г. Горно-Алтайск,50,1980-05-21,1989-10-01T22:29:12.783677+00:00,3830.4708
+1836,777.291.7350,North Derrickshire,51,1985-06-13,2006-03-11T22:14:28.397799+00:00,833.1143
+6253,625.909.2381x89435,п. Партизанск,52,2000-06-30,1976-08-10T21:01:59.793688+00:00,1848.4389
+8771,(225)225-0448x5148,к. Новомосковск,53,1992-12-20,1983-08-22T23:35:58.517511+00:00,4154.2944
+2546,8 (077) 464-4713,South Robertburgh,54,2008-07-18,1972-12-13T06:57:24.096367+00:00,1286.7376
diff --git a/tests/resources/file_connection/csv/for_file_filtering/small_file.csv b/tests/resources/file_connection/csv/for_file_filtering/small_file.csv
@@ -0,0 +1,2 @@
+ID,PHONE_NUMBER,REGION,NUMBER,BIRTH_DATE,REGISTERED_AT,ACCOUNT_BALANCE
+7282,+7 (691) 449-06-79,клх Ейск,1,2011-04-26,2006-02-14T09:36:15.589307+00:00,5596.5715
diff --git a/tests/resources/file_connection/csv/for_file_filtering/unknown_name.csv b/tests/resources/file_connection/csv/for_file_filtering/unknown_name.csv
diff --git a/tests/test_integration/test_run_transfer/connection_fixtures/__init__.py b/tests/test_integration/test_run_transfer/connection_fixtures/__init__.py
diff --git a/tests/test_integration/test_run_transfer/connection_fixtures/filters_fixtures.py b/tests/test_integration/test_run_transfer/connection_fixtures/filters_fixtures.py
diff --git a/tests/test_integration/test_run_transfer/test_sftp.py b/tests/test_integration/test_run_transfer/test_sftp.py

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+Add transformations for Transfers with file filtering`
Original file line number	Diff line number	Diff line change
`@@ -65,6 +65,9 @@`
`65`	`65`	`from syncmaster.schemas.v1.transfers.transformations.dataframe_rows_filter import (`
`66`	`66`	`DataframeRowsFilter,`
`67`	`67`	`)`
	`68`	`+from syncmaster.schemas.v1.transfers.transformations.file_metadata_filter import (`
	`69`	`+ FileMetadataFilter,`
	`70`	`+)`
`68`	`71`	`from syncmaster.schemas.v1.types import NameConstr`
`69`	`72`
`70`	`73`	`ReadTransferSchemaSource = (`
`@@ -165,7 +168,7 @@`
`165`	`168`	`\| None`
`166`	`169`	`)`
`167`	`170`
`168`		`-TransformationSchema = DataframeRowsFilter \| DataframeColumnsFilter`
	`171`	`+TransformationSchema = DataframeRowsFilter \| DataframeColumnsFilter \| FileMetadataFilter`
`169`	`172`
`170`	`173`
`171`	`174`	`class CopyTransferSchema(BaseModel):`
Original file line number	Diff line number	Diff line change
`@@ -4,3 +4,4 @@`
`4`	`4`
`5`	`5`	`DATAFRAME_ROWS_FILTER = Literal["dataframe_rows_filter"]`
`6`	`6`	`DATAFRAME_COLUMNS_FILTER = Literal["dataframe_columns_filter"]`
	`7`	`+FILE_METADATA_FILTER = Literal["file_metadata_filter"]`