1.. Была добавлена новая модель Turbo.
Данная модель была обучена на 200 гб размеченных разными пайплайнами текстов. Размер модели сопоставим с medium_poetry, но качество выше big_poetry.
Метрики:
ruaccent_big -> 0.93 avg
ruaccent_turbo -> 0.95 avg
- Отказ от собственного тяжеловесного пайплайна морфологического анализатора, в сторону проекта Ильи Козиева rupostagger.
- Доработка пайплайна с нейросетью для расстановки ударений в обычных слов
- Исправлены некоторые ошибки