Этот скрипт приведен для демонстрации потокового распознавания.
Скрипт записывает голос через микрофон и передает его на распознавание в сервис SpeechKit, результат распознавания выводится в веб-консоль.
Скрипт написан на Python поэтому может быть легко доработан и оптимизирован под ваш сценарий. Скрипт использует WebSockets для передачи данных между клиентом и сервером.
-
Необходимо создать сервисную учетную запись, а также – назначить роль
ai.speechkit-stt.user
. -
Для созданной сервисной учетной записи необходимо получить API-ключ, его секрет потребуется для запуска скрипта.
-
Склонируйте текущий репозиторий
-
Установите зависимости:
pip install -r src/requirements.txt
- Запустите скрипт:
python src/web_app.py --api-key <API_KEY> --port 8080
- Перейдите на страницу
http://localhost:8080
Либо, можно использовать готовый образ:
docker run -p 8080:8080 --env API_KEY=<API_KEY> cr.yandex/sol/ml-ai/speechkit-stream/speechkit-stream:v1.0.0
После запуска контейнера, также необходимо перейти на страницу http://localhost:8080
.