Это простое приложение с графическим интерфейсом на Tkinter (gui_recorder.py
), которое позволяет записывать аудио с микрофона и затем транскрибировать его с использованием библиотеки faster-whisper.
Нажмите кнопку "Record", чтобы начать запись со выбранного микрофона. Нажмите "Stop", чтобы остановить запись и сохранить аудиофайл в examples/sample_audio.wav
. Затем вы можете нажать "Transcribe Last", чтобы запустить транскрибацию записанного аудио.
Особенности:
- Автоматическое обнаружение и выбор входного аудиоустройства.
- Использование оптимальной частоты дискретизации, поддерживаемой выбранным микрофоном.
- Автоматический выбор устройства транскрибации: Приложение автоматически определяет наличие GPU (CUDA) и использует его для более быстрой транскрибации. Если GPU недоступен, транскрибация будет выполняться на CPU.
- Транскрибация аудиофайлов с помощью faster-whisper.
sounddevice
(на вашей системе должен быть доступен PortAudio)soundfile
numpy
torch
(для определения наличия CUDA)
Для запуска приложения выполните следующие шаги:
-
Клонируйте репозиторий:
git clone [ссылка на ваш репозиторий] cd voice_recognition_api
(Замените
[ссылка на ваш репозиторий]
на фактическую ссылку на ваш репозиторий.) -
Создайте и активируйте виртуальное окружение (venv):
python -m venv .venv # Для Windows: .venv\Scripts\activate # Для macOS/Linux: source .venv/bin/activate
-
Установите все необходимые зависимости:
pip install -r requirements.txt
или, если используете
uv
:uv pip install -r requirements.txt
Примечание: Если вы планируете использовать GPU, вам может потребоваться установить
torch
с поддержкой CUDA вручную, следуя инструкциям на официальном сайте PyTorch. Например, для CUDA 12:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
. Без этих дополнительных шаговtorch.cuda.is_available()
может возвращатьFalse
, даже если GPU физически присутствует. -
Запустите приложение GUI:
python gui_recorder.py
или, если используете
uv
:uv run gui_recorder.py
После запуска приложения:
- В выпадающем списке "Input Device" выберите ваш микрофон.
- Нажмите "Record", чтобы начать запись.
- Нажмите "Stop", чтобы остановить запись.
- Нажмите "Transcribe Last", чтобы транскрибировать записанное аудио.