Skip to content

Commit 01df52e

Browse files
Update rules for Ukrainian
1 parent 4585e6c commit 01df52e

File tree

1 file changed

+22
-2
lines changed

1 file changed

+22
-2
lines changed

src/rules/uk.toml

Lines changed: 22 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -7,8 +7,8 @@ quote_start_with_letter = true
77
needs_punctuation_end = true
88
needs_letter_start = true
99
needs_uppercase_start = true
10-
# Allow letters, apostrophe, spaces, ",.!?" and various dashes
11-
allowed_symbols_regex = "[А-ЩЬЮЯҐЄІЇа-щьюяґєії'\\s,.\\-‑?!—­‐–―−]"
10+
# Allow letters, apostrophe, spaces, ",.!?:;", double quotes and various dashes
11+
allowed_symbols_regex = "[А-ЩЬЮЯҐЄІЇа-щьюяґєії'\\s,.\\-‑?!—­‐–―−:;]"
1212
disallowed_symbols = []
1313
broken_whitespace = [" ", " ,", " .", " ?", " !", " ;", " \""]
1414
matching_symbols = [
@@ -80,4 +80,24 @@ other_patterns = [
8080
"\\s'\\s",
8181
# Very frequent sentence-initial patterns, would skew the sentence distribution if allowed
8282
"^(Локалізований у (клітинн|цитоплазм)|Кодований геном білок за функці|Задіяний у таких біологічних процесах|Основою економіки є сільське господарство|По завершенні ігрової кар'єри|Статус (надано|присвоєно) (для|з метою) збереження)",
83+
84+
# Additional patterns contributed by @tamila-krashtan and @danmysak
85+
86+
# в/й між приголосними й між паузою та приголосним (у т.ч. як префікс)
87+
"[бвгґджзйклмнпрстфхцчшщь,;:—]\\s[вй]\\s?[бвгґджзйклмнпрстфхцчшщь]",
88+
# в/й на початку речення перед приголосним
89+
"^[ЙВ]\\s[бвгґджзйклмнпрстфхцчшщь]",
90+
# в перед в, ф, а також перед льв, зв, св, дв, тв, гв, хв і под.
91+
"\\\\s(ф|[бвгґджзйклмнпрстфхцчшщь]*в)",
92+
# й перед йотованими голосними
93+
"\\\\s[єїюя]",
94+
# з перед шиплячими і свистячими
95+
"\\\\s[зсцчш]",
96+
97+
# у між голосними (у т.ч. як префікс)
98+
"[аеиіоуєїюя]\\\\s?[аеиіоуєїюя]",
99+
# і між нейотованими голосними (у т.ч. як префікс)
100+
"[аеиіоу]\\\\s?[аеиіоу]",
101+
# у на початку речення перед голосним
102+
"\\s[аеиіоуєїюя]",
83103
]

0 commit comments

Comments
 (0)