AI-скілл для Windsurf/Cursor/Claude Code, який перетворює штучний AI-текст на живу українську мову
Ukrainianizer — скілл для AI-асистентів (Windsurf, Cursor, Claude Code), що ловить і прибирає сліди AI-генерації з українського тексту.
AI-моделі часто продукують текст, який:
- Містить русизми через російськомовні дані в навчанні
- Переповнений канцеляризмами та номіналізаціями
- Має низьку burstiness (всі речення однакової довжини)
- Звучить штучно та передбачувано
- Містить приховані Unicode watermarks
Ukrainianizer з цим бореться. І непогано, чесно.
| Функція | Опис |
|---|---|
| 🔍 Виявлення watermarks | Знаходить приховані Unicode символи (U+200B, U+202F тощо) |
| 🇺🇦 Видалення русизмів | "приймати участь" → "брати участь" |
| ✂️ Очистка канцеляризмів | "здійснення контролю" → "контролювати" |
| 📊 Покращення метрик | Підвищує burstiness, perplexity, TTR |
| 💬 Додавання живості | Частки, фразеологізми, емоційне забарвлення |
# Клонуй репо у директорію скіллів Windsurf
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.codeium/windsurf/skills/ukrainianizer# Клонуй репо у директорію правил Cursor
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.cursor/rules/ukrainianizer# Клонуй репо у директорію скіллів Claude Code
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.claude/skills/ukrainianizer
# Або для конкретного проєкту:
git clone git@github.com:vitalii4reva/ukrainianizer.git ./skills/ukrainianizerГотово. Скілл з'явиться в списку.
Просто напиши в чаті:
/ukrainianizer
[Твій текст для редагування]
Або:
Зроби текст українським:
[Твій AI-генерований текст]
Працює на тригери:
humanize Ukrainian textзробити текст українськимприбрати AIвиправити суржикредагувати українськоювиправити русизмиканцелярит
До:
На протязі останніх років ми приймали участь в різних міроприємствах. Це являється важливим для нашого розвитку. Здійснення контролю над процесами є критично важливим.
Після:
Протягом останніх років ми брали участь у різних заходах. Це важливо для нашого розвитку. Контролювати процеси — вкрай важливо.
До:
Впровадження даної системи є критично важливим для підвищення ефективності організації. Система забезпечує оптимізацію процесів. Це сприяє досягненню стратегічних цілей. Результати демонструють позитивну динаміку.
Після:
Ця система? Вона реально потрібна. За три місяці тестування ми скоротили час обробки заявок з двох днів до трьох годин. Клієнти помітили — дзвінків зі скаргами стало на 60% менше. І от, найцікавіше: команда тепер має час на нові проєкти, бо рутину забрала автоматика.
Зміни метрик:
| Метрика | До | Після |
|---|---|---|
| Burstiness | низька (8-11 слів) | висока (3-20 слів) |
| TTR | 0.35 | 0.68 |
| Канцеляризми | 5 | 0 |
| Емоційність | 0 | висока |
До:
Це затишне містечко в серці Карпат вражає своєю неперевершеною красою та унікальною культурною спадщиною.
Після:
Це містечко в Карпатах відоме щотижневим ринком та церквою XVIII століття.
| ❌ | ✅ |
|---|---|
| приймати участь | брати участь |
| на протязі | протягом |
| являється | є |
| слідуючий | наступний |
| співпадати | збігатися |
| ❌ | ✅ |
|---|---|
| здійснення контролю | контролювати |
| на даний момент | зараз |
| з метою | щоб |
ключовий,критично важливий,фундаментальнийтрансформаційний,всеосяжний,безпрецедентний
| ❌ | ✅ |
|---|---|
| фокусуватися на | зосереджуватися на |
| мати місце | траплятися |
| базуючись на | на основі |
Оптимізує за метриками:
- Низька = речення однакової довжини → AI-паттерн
- Висока = різна довжина речень → людський текст
- Ціль: variance > 20 слів
- Низька = передбачуваний текст → AI-сигнал
- Висока = непередбачуваний → людський текст
- < 0.4 → занадто повторювано
- 0.4-0.6 → норма
- > 0.6 → багата лексика
- AI схильний до нейтральності
- Людський текст має емоційні коливання
Скілл не просто прибирає погане — він додає живе:
- Частки: ж, бо, от, ну, та, хіба, невже, адже
- Зменшувальні: трішечки, хвилиночку, словечко
- Фразеологізми: "пропав як швед під Полтавою"
- Конкретика: замість "багато компаній" → "52 стартапи"
Сучасні AI-моделі вбудовують приховані символи:
U+200B— Zero-Width Space (найчастіший)U+202F— Narrow No-Break Space (GPT-o3/o4)U+FEFF— BOM
Знаходить і прибирає їх.
def clean_watermarks(text):
"""Видалити всі приховані Unicode watermarks"""
invisible = [
'\u200B', # Zero-Width Space
'\u200C', # Zero-Width Non-Joiner
'\u200D', # Zero-Width Joiner
'\u00A0', # Non-Breaking Space
'\u00AD', # Soft Hyphen
'\u202F', # Narrow No-Break Space
'\u2060', # Word Joiner
'\uFEFF' # BOM
]
for char in invisible:
text = text.replace(char, ' ')
return ' '.join(text.split())ukrainianizer/
├── SKILL.md # Основний workflow (~200 рядків)
├── CHANGELOG.md # Історія змін
└── references/
├── rusyzmy.md # Словник русизмів
├── anglicyzmy.md # Англіцизми
├── kancelyaryzmy.md # Канцеляризми
├── pleonazmy.md # Плеоназми
├── ai-patterns.md # AI-лексика, промоційна мова
└── frazeologizmy.md # Фразеологізми для живості
Progressive Disclosure: Словники завантажуються тільки коли потрібні — економить контекст.
- GPT Cleanup — онлайн-детектор watermarks
- GetGPT Watermark — перевірка на AI-маркери
- Словник фразеологізмів — українські фразеологізми
PR-и вітаю. Що б допомогло:
- Нові русизми до словника
- Фразеологізми
- Краще виявлення патернів
MIT License — використовуй вільно.
Vitalii Petrenko — vitalii4reva.com
🇺🇦 Бо мова — це душа.
Версія: 2.1 (Лютий 2026)