极简、高效、现代化的 Windows 语音输入助手
Voice2Type 是一款基于 Rust 编写的轻量级语音转文字工具。它常驻后台,通过全局热键实现“按住说话,松开上屏”的流畅体验。接入 SiliconFlow 高精度语音模型,支持中英文混合识别,并配有精美的灵动岛式状态悬浮窗。

- ⚡ 极速交互:按住热键(默认
F2)说话,松开立即转写并输入。 - 🏝️ 灵动状态:桌面顶部悬浮窗(Dynamic Island 风格),实时显示录音、处理、成功及取消(ESC)状态。
- 🎯 双重模式:
- 剪贴板模式(推荐):极速上屏,支持绝大多数编辑器。
- 注入模式:模拟键盘敲击,兼容部分不仅支持粘贴的游戏或特殊软件。
- 🤖 智能处理:
- 支持自动标点(可配置开关)。
- 支持Emoji 表情(可配置开关)。
- 中/英 输出语言自动或手动切换。
- 🔄 自动更新:内置版本检测与自动更新功能,始终保持最新。
- 🛡️ 隐私安全:音频数据全程内存处理,录音结束后立即释放,不写入本地磁盘。
- 🚀 极低占用:原生 Rust + WinAPI 开发,无 Electron 臃肿,内存占用极低。
- 下载:前往 Releases 页面下载最新版本的
voice2type.exe。 - 运行:双击启动,程序将最小化至系统托盘。
- 配置:
- 右键托盘图标 -> 设置 -> 配置 -> 模型设置。
- 填入你的 SiliconFlow API Key(注册就有免费的模型和KEY,也可以使用其它服务商)。
- 点击保存。
- 使用:
- 选中任意输入框。
- 按住
F2键开始说话。 - 说完松开
F2,文字将自动出现在输入框中。 - 如需取消录音,请在按住 F2 的同时按下
ESC键。
通过右键托盘图标,你可以进行丰富的个性化设置:
- 通用:开机自启动、状态悬浮窗开关、标点/表情输出控制。
- 输出方式:在“剪贴板模式”和“注入模式”之间切换。
- 语言:切换界面语言或识别输出语言(中文/英文/自动)。
- 热键绑定:支持自定义全局热键(F1-F12, CapsLock, Ctrl/Alt 等)。
- 调试:内置实时日志查看器,方便排查问题。
如果你想参与开发或自行编译:
环境要求:
- Rust (Latest Stable)
- Visual Studio Build Tools (C++)
构建步骤:
# 克隆仓库
git clone https://github.com/guchang233/VOICE2TYPE.git
cd VOICE2TYPE
# 开发模式运行
cargo run
# 发布模式编译 (自动优化体积)
cargo build --release- Q: 游戏内无法输入?
- A: 请尝试以管理员身份运行本程序,或切换到“注入模式”。
- Q: 提示 API Key 错误?
- A: 请检查 SiliconFlow 控制台的 Key 是否过期,并确保没有因请求频率过高而被暂时限制(如果您使用的不是免费模型则也有可能是余额用尽)
- Q: 状态为 聆听中>>>处理中>>>错误 如何解决
- A:首先请检查是否曾下载过低版本,若是,进入设置>>>配置>>>配置目录 备份你的apikey之后删除json文件后重启软件即可 /n 或是检查麦克风是否有声音。
更多问题 欢迎提交issue