OpenClaw Skill: 本地中文语音识别,无需API Key
基于 faster-whisper(CTranslate2后端),比OpenAI原版Whisper更快,中文识别效果优秀。
- 🚀 快 — CTranslate2 后端,CPU上比原版Whisper快4倍
- 🇨🇳 中文优化 — 默认中文语言模型,识别准确率高
- 🔑 无需API Key — 完全本地运行,隐私安全
- 📁 多格式 — 支持 WAV/MP3/OGG/M4A/FLAC 输入,TEXT/JSON/SRT 输出
- 📦 一键安装 — 自动检测和安装依赖
# 安装到你的 OpenClaw workspace
clawhub install faster-whisper-zh
# 或者手动复制到 ~/.openclaw/skills/# 单文件转录
./scripts/transcribe.sh voice.ogg
# 指定模型和格式
./scripts/transcribe.sh voice.mp3 --model medium --format json
# 批量处理
./scripts/transcribe.sh --batch /path/to/audio --format srt
# 保存到文件
./scripts/transcribe.sh voice.wav --output transcript.txt在 CPU (Intel i7) 上实测:
| 模型 | 加载时间(首次/缓存) | 4秒音频转录 | 准确度 |
|---|---|---|---|
| tiny | 2s / 0.3s | 0.5s | ⭐⭐ |
| base | 3s / 1.1s | 1.2s | ⭐⭐⭐ |
| small | 5s / 2s | 3s | ⭐⭐⭐⭐ |
| medium | 10s / 4s | 8s | ⭐⭐⭐⭐⭐ |
- Python 3.8+
pip install faster-whisper
脚本会自动检查并提示安装。
MIT
- faster-whisper — SYSTRAN
- OpenClaw — AI Agent Framework
- AgentSkills — Skill Standard