SubStyle AI — это инновационное веб-приложение для автоматического создания, редактирования и профессиональной стилизации субтитров в коротких видео. Ориентированное на создателей контента для TikTok, Reels и YouTube Shorts, приложение превращает сырые видеозаписи в готовые вирусные ролики за считанные секунды.
SubStyle AI v1 ≠ видеоредактор SubStyle AI v1 = генератор стильных субтитров с минимальным видео-рендерингом
Всё, что не усиливает ключевую ценность «быстро получить вирусные субтитры» — убираем.
- ИИ-Транскрибация: Автоматическое распознавание речи с высокой точностью с использованием NVIDIA Parakeet ASR модели
- Профессиональный стайлинг: Библиотека пресетов стилей и полная кастомизация
- Простой текстовый редактор: Интерактивный таймлайн для ручной правки текста
- Серверный рендеринг: Обработка видео происходит на сервере с использованием нативного FFmpeg
- Интуитивный UI/UX: Адаптивный интерфейс с dark mode и простым preview
- Поддержка временных меток: Точная синхронизация субтитров с аудио
- React.js
- Canvas API или HTML overlay
- FFmpeg (серверный)
- NVIDIA NeMo toolkit с Parakeet моделью
- Node.js / Python (backend)
- Клонируйте репозиторий:
git clone <repository-url>
cd substyle-ai- Установите зависимости:
npm install- Перейдите в директорию сервера и установите зависимости сервера:
cd server && npm install- Установите NVIDIA NeMo toolkit:
pip install nemo_toolkit[asr]- Запустите службу ASR в отдельном терминале:
cd server && python asr_service.py- Запустите основной сервер в новом терминале:
cd server && npm start- Запустите клиентскую часть в третьем терминале:
npm run devПриложение будет доступно по адресу http://localhost:3000
Для получения дополнительной информации о настройке службы ASR см. server/ASR_SETUP.md.
Для создания продакшен-сборки выполните:
npm run buildДля локального просмотра продакшен-сборки:
npm run previewsubstyle-ai/
├── components/ # React компоненты
│ ├── VideoUploader.jsx
│ ├── SubtitleEditor.jsx
│ ├── StyleEditor.jsx
│ ├── VideoRenderer.jsx
│ └── Timeline.jsx
├── services/ # Сервисы и API
│ └── transcriptionService.js
├── server/ # Серверная часть
│ ├── server.js # Основной сервер
│ ├── asr_service.py # Служба NVIDIA Parakeet ASR
│ ├── asr_client.js # Клиент для связи с ASR
│ └── package.json
├── src/ # Основной исходный код
│ ├── main.jsx
│ ├── App.jsx
│ └── style.css
├── public/ # Публичные ресурсы
├── package.json # Зависимости и скрипты
└── README.md
- Загрузите видеофайл (≤ 60 сек)
- Приложение автоматически транскрибирует аудио с помощью NVIDIA Parakeet и создаст субтитры
- Отредактируйте субтитры вручную при необходимости
- Выберите стиль или настройте собственный
- Используйте таймлайн для точной настройки синхронизации
- Нажмите "Export Video" для создания финального видео
- Скачайте готовое видео
Проект использует передовую модель NVIDIA Parakeet для транскрибации речи в текст. Модель обеспечивает:
- Высокую точность распознавания речи
- Поддержку временных меток на уровне символов, слов и сегментов
- Оптимизированную работу с CUDA (рекомендуется GPU)
MIT