Skip to content
This repository was archived by the owner on Oct 26, 2021. It is now read-only.

Запуск TDC с переданными файлами-конфигурациями #3

@saippuakauppias

Description

@saippuakauppias

Необходимо написать python-скрипт, который будет запускать обработку датасета на нескольких предопределенных конфигурационных файлах (список процессоров внутри на свой вкус).

Для справки:
Loader - базовый класс в TDC для запуска процессоров: https://github.com/TextDatasetCleaner/TextDatasetCleaner/blob/master/src/textdatasetcleaner/loaders.py
Пример использования Loader: https://github.com/TextDatasetCleaner/TextDatasetCleaner/blob/master/src/textdatasetcleaner/cli.py#L57

Также, в этой задаче нужно подготовить несколько конфигов (>2), чтобы запускать обработку на них в цикле.

Будет хорошим бонусом, если:

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions