Skip to content

vitalii4reva/ukrainianizer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🇺🇦 Ukrainianizer

AI-скілл для Windsurf/Cursor/Claude Code, який перетворює штучний AI-текст на живу українську мову

License: MIT Made for Ukraine


🎯 Що це?

Ukrainianizer — скілл для AI-асистентів (Windsurf, Cursor, Claude Code), що ловить і прибирає сліди AI-генерації з українського тексту.

AI-моделі часто продукують текст, який:

  • Містить русизми через російськомовні дані в навчанні
  • Переповнений канцеляризмами та номіналізаціями
  • Має низьку burstiness (всі речення однакової довжини)
  • Звучить штучно та передбачувано
  • Містить приховані Unicode watermarks

Ukrainianizer з цим бореться. І непогано, чесно.


✨ Можливості

Функція Опис
🔍 Виявлення watermarks Знаходить приховані Unicode символи (U+200B, U+202F тощо)
🇺🇦 Видалення русизмів "приймати участь" → "брати участь"
✂️ Очистка канцеляризмів "здійснення контролю" → "контролювати"
📊 Покращення метрик Підвищує burstiness, perplexity, TTR
💬 Додавання живості Частки, фразеологізми, емоційне забарвлення

🚀 Встановлення

Windsurf

# Клонуй репо у директорію скіллів Windsurf
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.codeium/windsurf/skills/ukrainianizer

Cursor

# Клонуй репо у директорію правил Cursor
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.cursor/rules/ukrainianizer

Claude Code

# Клонуй репо у директорію скіллів Claude Code
git clone git@github.com:vitalii4reva/ukrainianizer.git ~/.claude/skills/ukrainianizer

# Або для конкретного проєкту:
git clone git@github.com:vitalii4reva/ukrainianizer.git ./skills/ukrainianizer

Готово. Скілл з'явиться в списку.


📖 Використання

Базовий виклик

Просто напиши в чаті:

/ukrainianizer

[Твій текст для редагування]

Або:

Зроби текст українським:

[Твій AI-генерований текст]

Тригери

Працює на тригери:

  • humanize Ukrainian text
  • зробити текст українським
  • прибрати AI
  • виправити суржик
  • редагувати українською
  • виправити русизми
  • канцелярит

📝 Приклади

Приклад 1: Русизми + канцеляризми

До:

На протязі останніх років ми приймали участь в різних міроприємствах. Це являється важливим для нашого розвитку. Здійснення контролю над процесами є критично важливим.

Після:

Протягом останніх років ми брали участь у різних заходах. Це важливо для нашого розвитку. Контролювати процеси — вкрай важливо.


Приклад 2: AI-слоп → жива мова

До:

Впровадження даної системи є критично важливим для підвищення ефективності організації. Система забезпечує оптимізацію процесів. Це сприяє досягненню стратегічних цілей. Результати демонструють позитивну динаміку.

Після:

Ця система? Вона реально потрібна. За три місяці тестування ми скоротили час обробки заявок з двох днів до трьох годин. Клієнти помітили — дзвінків зі скаргами стало на 60% менше. І от, найцікавіше: команда тепер має час на нові проєкти, бо рутину забрала автоматика.

Зміни метрик:

Метрика До Після
Burstiness низька (8-11 слів) висока (3-20 слів)
TTR 0.35 0.68
Канцеляризми 5 0
Емоційність 0 висока

Приклад 3: Промоційний текст

До:

Це затишне містечко в серці Карпат вражає своєю неперевершеною красою та унікальною культурною спадщиною.

Після:

Це містечко в Карпатах відоме щотижневим ринком та церквою XVIII століття.


🔧 Що виправляється

Русизми (20+ слів)

приймати участь брати участь
на протязі протягом
являється є
слідуючий наступний
співпадати збігатися

Канцеляризми

здійснення контролю контролювати
на даний момент зараз
з метою щоб

AI-лексика

  • ключовий, критично важливий, фундаментальний
  • трансформаційний, всеосяжний, безпрецедентний

Англіцизми

фокусуватися на зосереджуватися на
мати місце траплятися
базуючись на на основі

📊 Метрики якості

Оптимізує за метриками:

Burstiness (ритмічність)

  • Низька = речення однакової довжини → AI-паттерн
  • Висока = різна довжина речень → людський текст
  • Ціль: variance > 20 слів

Perplexity (передбачуваність)

  • Низька = передбачуваний текст → AI-сигнал
  • Висока = непередбачуваний → людський текст

TTR (Type-Token Ratio)

  • < 0.4 → занадто повторювано
  • 0.4-0.6 → норма
  • > 0.6 → багата лексика

Emotional Variance

  • AI схильний до нейтральності
  • Людський текст має емоційні коливання

💡 Додавання української душі

Скілл не просто прибирає погане — він додає живе:

  • Частки: ж, бо, от, ну, та, хіба, невже, адже
  • Зменшувальні: трішечки, хвилиночку, словечко
  • Фразеологізми: "пропав як швед під Полтавою"
  • Конкретика: замість "багато компаній" → "52 стартапи"

🛠️ Технічні деталі

Unicode Watermarks

Сучасні AI-моделі вбудовують приховані символи:

  • U+200B — Zero-Width Space (найчастіший)
  • U+202F — Narrow No-Break Space (GPT-o3/o4)
  • U+FEFF — BOM

Знаходить і прибирає їх.

Python-утиліта для очистки

def clean_watermarks(text):
    """Видалити всі приховані Unicode watermarks"""
    invisible = [
        '\u200B',  # Zero-Width Space
        '\u200C',  # Zero-Width Non-Joiner
        '\u200D',  # Zero-Width Joiner
        '\u00A0',  # Non-Breaking Space
        '\u00AD',  # Soft Hyphen
        '\u202F',  # Narrow No-Break Space
        '\u2060',  # Word Joiner
        '\uFEFF'   # BOM
    ]
    for char in invisible:
        text = text.replace(char, ' ')
    return ' '.join(text.split())

📁 Структура

ukrainianizer/
├── SKILL.md              # Основний workflow (~200 рядків)
├── CHANGELOG.md          # Історія змін
└── references/
    ├── rusyzmy.md        # Словник русизмів
    ├── anglicyzmy.md     # Англіцизми
    ├── kancelyaryzmy.md  # Канцеляризми
    ├── pleonazmy.md      # Плеоназми
    ├── ai-patterns.md    # AI-лексика, промоційна мова
    └── frazeologizmy.md  # Фразеологізми для живості

Progressive Disclosure: Словники завантажуються тільки коли потрібні — економить контекст.


📚 Корисні ресурси


🤝 Внесок

PR-и вітаю. Що б допомогло:

  • Нові русизми до словника
  • Фразеологізми
  • Краще виявлення патернів

📄 Ліцензія

MIT License — використовуй вільно.


👤 Автор

Vitalii Petrenkovitalii4reva.com

🇺🇦 Бо мова — це душа.


Версія: 2.1 (Лютий 2026)

About

AI-скілл для Windsurf/Cursor/Claude Code, який перетворює штучний AI-текст на живу українську мову

Resources

License

Stars

Watchers

Forks

Contributors