Skip to content

yandex-cloud-examples/yc-speechkit-streams-recognizer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SpeechKit Stream Recognizer

Процесс распознавания длинных аудио файлов



Этот скрипт приведен для демонстрации потокового распознавания.

Скрипт записывает голос через микрофон и передает его на распознавание в сервис SpeechKit, результат распознавания выводится в веб-консоль.

Скрипт написан на Python поэтому может быть легко доработан и оптимизирован под ваш сценарий. Скрипт использует WebSockets для передачи данных между клиентом и сервером.



Установка и использование

  1. Необходимо создать сервисную учетную запись, а также – назначить роль ai.speechkit-stt.user.

  2. Для созданной сервисной учетной записи необходимо получить API-ключ, его секрет потребуется для запуска скрипта.

  3. Склонируйте текущий репозиторий

  4. Установите зависимости:

pip install -r src/requirements.txt
  1. Запустите скрипт:
python src/web_app.py --api-key <API_KEY> --port 8080
  1. Перейдите на страницу http://localhost:8080

Либо, можно использовать готовый образ:

docker run -p 8080:8080 --env API_KEY=<API_KEY> cr.yandex/sol/ml-ai/speechkit-stream/speechkit-stream:v1.0.0

После запуска контейнера, также необходимо перейти на страницу http://localhost:8080.