🎤 VoiceRecognition - Рекордер с GUI

🎛 GUI Рекордер

Это простое приложение с графическим интерфейсом на Tkinter (gui_recorder.py), которое позволяет записывать аудио с микрофона и затем транскрибировать его с использованием библиотеки faster-whisper.

Нажмите кнопку "Record", чтобы начать запись со выбранного микрофона. Нажмите "Stop", чтобы остановить запись и сохранить аудиофайл в examples/sample_audio.wav. Затем вы можете нажать "Transcribe Last", чтобы запустить транскрибацию записанного аудио.

Особенности:

Автоматическое обнаружение и выбор входного аудиоустройства.
Использование оптимальной частоты дискретизации, поддерживаемой выбранным микрофоном.
Автоматический выбор устройства транскрибации: Приложение автоматически определяет наличие GPU (CUDA) и использует его для более быстрой транскрибации. Если GPU недоступен, транскрибация будет выполняться на CPU.
Транскрибация аудиофайлов с помощью faster-whisper.

Требования для записи через GUI:

sounddevice (на вашей системе должен быть доступен PortAudio)
soundfile
numpy
torch (для определения наличия CUDA)

Порядок запуска:

Для запуска приложения выполните следующие шаги:

Клонируйте репозиторий:
```
git clone [ссылка на ваш репозиторий]
cd voice_recognition_api
```
(Замените [ссылка на ваш репозиторий] на фактическую ссылку на ваш репозиторий.)

Создайте и активируйте виртуальное окружение (venv):

python -m venv .venv
# Для Windows:
.venv\Scripts\activate
# Для macOS/Linux:
source .venv/bin/activate

Установите все необходимые зависимости:
```
pip install -r requirements.txt
```
или, если используете uv:
```
uv pip install -r requirements.txt
```
Примечание: Если вы планируете использовать GPU, вам может потребоваться установить torch с поддержкой CUDA вручную, следуя инструкциям на официальном сайте PyTorch. Например, для CUDA 12: pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121. Без этих дополнительных шагов torch.cuda.is_available() может возвращать False, даже если GPU физически присутствует.
Запустите приложение GUI:
```
python gui_recorder.py
```
или, если используете uv:
```
uv run gui_recorder.py
```

После запуска приложения:

В выпадающем списке "Input Device" выберите ваш микрофон.
Нажмите "Record", чтобы начать запись.
Нажмите "Stop", чтобы остановить запись.
Нажмите "Transcribe Last", чтобы транскрибировать записанное аудио.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
README.md		README.md
api_prototype.py		api_prototype.py
gui_recorder.py		gui_recorder.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🎤 VoiceRecognition - Рекордер с GUI

🎛 GUI Рекордер

Требования для записи через GUI:

Порядок запуска:

About

Uh oh!

Releases

Packages

Languages

MishaNyaCopilot/VoiceRecognition

Folders and files

Latest commit

History

Repository files navigation

🎤 VoiceRecognition - Рекордер с GUI

🎛 GUI Рекордер

Требования для записи через GUI:

Порядок запуска:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages