Skip to content

ylytdeng/faster-whisper-zh

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

faster-whisper-zh 🎙️

OpenClaw Skill: 本地中文语音识别,无需API Key

基于 faster-whisper(CTranslate2后端),比OpenAI原版Whisper更快,中文识别效果优秀。

✨ 特点

  • 🚀 — CTranslate2 后端,CPU上比原版Whisper快4倍
  • 🇨🇳 中文优化 — 默认中文语言模型,识别准确率高
  • 🔑 无需API Key — 完全本地运行,隐私安全
  • 📁 多格式 — 支持 WAV/MP3/OGG/M4A/FLAC 输入,TEXT/JSON/SRT 输出
  • 📦 一键安装 — 自动检测和安装依赖

🚀 快速开始

作为 OpenClaw Skill 使用

# 安装到你的 OpenClaw workspace
clawhub install faster-whisper-zh

# 或者手动复制到 ~/.openclaw/skills/

直接使用脚本

# 单文件转录
./scripts/transcribe.sh voice.ogg

# 指定模型和格式
./scripts/transcribe.sh voice.mp3 --model medium --format json

# 批量处理
./scripts/transcribe.sh --batch /path/to/audio --format srt

# 保存到文件
./scripts/transcribe.sh voice.wav --output transcript.txt

📊 性能

在 CPU (Intel i7) 上实测:

模型 加载时间(首次/缓存) 4秒音频转录 准确度
tiny 2s / 0.3s 0.5s ⭐⭐
base 3s / 1.1s 1.2s ⭐⭐⭐
small 5s / 2s 3s ⭐⭐⭐⭐
medium 10s / 4s 8s ⭐⭐⭐⭐⭐

🛠️ 依赖

  • Python 3.8+
  • pip install faster-whisper

脚本会自动检查并提示安装。

📄 License

MIT

🙏 致谢

About

🎙️ OpenClaw Skill: 本地中文语音识别,无需API Key,比原版Whisper快4倍

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages