You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
- На данный момент доступно 6 моделей. **big** (рекомендуется к использованию), **medium** и **small**. Рекомендуются к использованию модели версии **poetry**. Их названия **big_poetry**, **medium_poetry**, **small_poetry**.
20
-
- Модель **big** имеет 178 миллионов параметров, **medium** 85 миллионов, а **small**42 миллиона
21
+
- Модель **big** имеет 178 миллионов параметров, **medium** 85 миллионов, а **small**12 миллионов
21
22
- Переменная **use_dictionary** отвечает за загрузку всего словаря (требуется больше ОЗУ), иначе все ударения расставляет нейросеть.
22
-
- Переменная **custom_homographs** отвечает за добавление своих омографов. Формат такой: `{'слово-омограф': ['вариант ударения 1', 'вариант ударения 2']}`.
23
23
- Функция **custom_dict** отвечает за добавление своих вариантов ударений в словарь. Формат такой: `{'слово': 'сл+ово с удар+ением'}`
24
24
25
-
25
+
**Для работы требуется 5 гигабайт ОЗУ**
26
26
## Пример использования
27
27
```python
28
28
from ruaccent import RUAccent
@@ -37,10 +37,4 @@ text = 'ежик нашел в лесу ягоды.'
37
37
print(accentizer.process_yo(text))
38
38
```
39
39
40
-
## Датасеты
41
-
42
-
-[Датасет](https://huggingface.co/datasets/TeraTTS/nkrja_raw) собранный с [НКРЯ](https://ruscorpora.ru/) (удален по просьбе разработчиков НКРЯ)
43
-
-[Датасет](https://huggingface.co/datasets/TeraTTS/stress_dataset_sft_proza) использовавшийся для обучения моделей акцентуатора (версия только с прозой)
44
-
-[Датасет](https://huggingface.co/datasets/TeraTTS/stress_dataset_sft_poetry) использовавшийся для обучения моделей акцентуатора (версия проза + поэзия)
45
-
46
-
Файлы моделей и словарей располагаются по [ссылке](https://huggingface.co/TeraTTS/accentuator). Мы будем признательны фидбеку на [telegram аккаунт](https://t.me/chckdskeasfsd)
40
+
Файлы моделей и словарей располагаются по [ссылке](https://huggingface.co/ruaccent/accentuator). Мы будем признательны фидбеку на [telegram аккаунт](https://t.me/chckdskeasfsd)
0 commit comments