Skip to content

MishaNyaCopilot/VoiceRecognition

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎤 VoiceRecognition - Рекордер с GUI

🎛 GUI Рекордер

Это простое приложение с графическим интерфейсом на Tkinter (gui_recorder.py), которое позволяет записывать аудио с микрофона и затем транскрибировать его с использованием библиотеки faster-whisper.

Нажмите кнопку "Record", чтобы начать запись со выбранного микрофона. Нажмите "Stop", чтобы остановить запись и сохранить аудиофайл в examples/sample_audio.wav. Затем вы можете нажать "Transcribe Last", чтобы запустить транскрибацию записанного аудио.

Особенности:

  • Автоматическое обнаружение и выбор входного аудиоустройства.
  • Использование оптимальной частоты дискретизации, поддерживаемой выбранным микрофоном.
  • Автоматический выбор устройства транскрибации: Приложение автоматически определяет наличие GPU (CUDA) и использует его для более быстрой транскрибации. Если GPU недоступен, транскрибация будет выполняться на CPU.
  • Транскрибация аудиофайлов с помощью faster-whisper.

Требования для записи через GUI:

  • sounddevice (на вашей системе должен быть доступен PortAudio)
  • soundfile
  • numpy
  • torch (для определения наличия CUDA)

Порядок запуска:

Для запуска приложения выполните следующие шаги:

  1. Клонируйте репозиторий:

    git clone [ссылка на ваш репозиторий]
    cd voice_recognition_api

    (Замените [ссылка на ваш репозиторий] на фактическую ссылку на ваш репозиторий.)

  2. Создайте и активируйте виртуальное окружение (venv):

    python -m venv .venv
    # Для Windows:
    .venv\Scripts\activate
    # Для macOS/Linux:
    source .venv/bin/activate
  3. Установите все необходимые зависимости:

    pip install -r requirements.txt

    или, если используете uv:

    uv pip install -r requirements.txt

    Примечание: Если вы планируете использовать GPU, вам может потребоваться установить torch с поддержкой CUDA вручную, следуя инструкциям на официальном сайте PyTorch. Например, для CUDA 12: pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121. Без этих дополнительных шагов torch.cuda.is_available() может возвращать False, даже если GPU физически присутствует.

  4. Запустите приложение GUI:

    python gui_recorder.py

    или, если используете uv:

    uv run gui_recorder.py

После запуска приложения:

  • В выпадающем списке "Input Device" выберите ваш микрофон.
  • Нажмите "Record", чтобы начать запись.
  • Нажмите "Stop", чтобы остановить запись.
  • Нажмите "Transcribe Last", чтобы транскрибировать записанное аудио.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages