Skip to content

Commit dc11bef

Browse files
committed
Обновлена документация
1 parent 2d8c46d commit dc11bef

File tree

1 file changed

+170
-1
lines changed

1 file changed

+170
-1
lines changed

docs/components.md

Lines changed: 170 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1 +1,170 @@
1-
# Компоненты
1+
# Компоненты
2+
3+
Набор модулей для создания компонентов [spaCy](https://github.com/explosion/spaCy). Каждый модуль представляет собой класс с двумя реализованными методами: `__init__` (добавляет новое расширение в пайплайн при инициализации) и `__call__` (принимает объект класса `Doc` и возвращает его модифицированную версию).
4+
5+
!!! note "Примечание"
6+
Подробную информацию о разработке пользовательских компонентов для spaCy можно узнать в соответствующем разделе [документации](https://spacy.io/usage/processing-pipelines#custom-components).
7+
8+
## BasicStatsComponent
9+
10+
!!! info ""
11+
**ruts.components.BasicStatsComponent**
12+
13+
Модуль для компонента основных текстовых статистик.
14+
15+
Параметры:
16+
17+
| Параметр | Тип | По умолчанию | Описание |
18+
| :------: | :-: | :----------: | :------: |
19+
| `name` | str | `"bs"` | Наименование компонента в пайплайне |
20+
21+
Пример использования:
22+
23+
!!! example "Пример"
24+
25+
_Код_:
26+
27+
``` python
28+
# Загрузка библиотек
29+
from ruts import BasicStatsComponent
30+
31+
# Загрузка модели spaCy
32+
nlp = spacy.load('ru')
33+
34+
# Добавление компонента
35+
bsc = BasicStatsComponent()
36+
nlp.add_pipe(bsc, 'basic', last=True)
37+
38+
# Доступ к посчитанным метрикам
39+
doc = nlp("мама мыла раму")
40+
doc._.bs.c_letters
41+
```
42+
43+
_Результат_:
44+
45+
``` bash
46+
{4: 3}
47+
```
48+
49+
## MorphStatsComponent
50+
51+
!!! info ""
52+
**ruts.components.MorphStatsComponent**
53+
54+
Модуль для компонента морфологических статистик текста.
55+
56+
Параметры:
57+
58+
| Параметр | Тип | По умолчанию | Описание |
59+
| :------: | :-: | :----------: | :------: |
60+
| `name` | str | `"ms"` | Наименование компонента в пайплайне |
61+
62+
Пример использования:
63+
64+
!!! example "Пример"
65+
66+
_Код_:
67+
68+
``` python
69+
# Загрузка библиотек
70+
from ruts import MorphStatsComponent
71+
72+
# Загрузка модели spaCy
73+
nlp = spacy.load('ru')
74+
75+
# Добавление компонента
76+
msc = MorphStatsComponent()
77+
nlp.add_pipe(msc, 'morph', last=True)
78+
79+
# Доступ к посчитанным метрикам
80+
doc = nlp("мама мыла раму")
81+
doc._.ms.case
82+
```
83+
84+
_Результат_:
85+
86+
``` bash
87+
('nomn', 'gent', 'datv')
88+
```
89+
90+
## ReadabilityStatsComponent
91+
92+
!!! info ""
93+
**ruts.components.ReadabilityStatsComponent**
94+
95+
Модуль для компонента основных метрик удобочитаемости текста.
96+
97+
Параметры:
98+
99+
| Параметр | Тип | По умолчанию | Описание |
100+
| :------: | :-: | :----------: | :------: |
101+
| `name` | str | `"rs"` | Наименование компонента в пайплайне |
102+
103+
Пример использования:
104+
105+
!!! example "Пример"
106+
107+
_Код_:
108+
109+
``` python
110+
# Загрузка библиотек
111+
from ruts import ReadabilityStatsComponent
112+
113+
# Загрузка модели spaCy
114+
nlp = spacy.load('ru')
115+
116+
# Добавление компонента
117+
rsc = ReadabilityStatsComponent()
118+
nlp.add_pipe(rsc, 'readability', last=True)
119+
120+
# Доступ к посчитанным метрикам
121+
doc = nlp("мама мыла раму")
122+
doc._.rs.flesch_reading_easy
123+
```
124+
125+
_Результат_:
126+
127+
``` bash
128+
82.735
129+
```
130+
131+
## DiversityStatsComponent
132+
133+
!!! info ""
134+
**ruts.components.DiversityStatsComponent**
135+
136+
Модуль для компонента основных метрик лексического разнообразия текста.
137+
138+
Параметры:
139+
140+
| Параметр | Тип | По умолчанию | Описание |
141+
| :------: | :-: | :----------: | :------: |
142+
| `name` | str | `"ds"` | Наименование компонента в пайплайне |
143+
144+
Пример использования:
145+
146+
!!! example "Пример"
147+
148+
_Код_:
149+
150+
``` python
151+
# Загрузка библиотек
152+
from ruts import DiversityStatsComponent
153+
154+
# Загрузка модели spaCy
155+
nlp = spacy.load('ru')
156+
157+
# Добавление компонента
158+
dsc = DiversityStatsComponent()
159+
nlp.add_pipe(dsc, 'diversity', last=True)
160+
161+
# Доступ к посчитанным метрикам
162+
doc = nlp("мама мыла раму")
163+
doc._.ds.rttr
164+
```
165+
166+
_Результат_:
167+
168+
``` bash
169+
1.7320508075688774
170+
```

0 commit comments

Comments
 (0)