IME Input System

语音输入与智能意图识别系统

功能特性

全局监听右侧 Ctrl 键，触发语音输入
智能语音转文字（基于智谱AI ASR）
意图识别与函数调用（基于GLM function calling）
可配置的角色和提示词
跨平台支持（Linux）

系统架构

C++ 核心模块

按键监听: 全局捕获按键事件
音频采集: 实时录制麦克风输入
IPC服务: 进程间通信

Python 业务逻辑

ASR客户端: 调用语音识别API
意图识别: 理解用户意图
功能执行: 执行系统命令和应用

快速开始

1. 一键安装和构建

# 克隆或下载项目后，运行：
./install_deps.sh  # 安装系统依赖
./build.sh        # 编译并运行

手动安装步骤

1. 安装系统依赖

# 自动检测Linux发行版并安装所需依赖
./install_deps.sh

# 支持的发行版：Ubuntu/Debian/CentOS/RHEL/Fedora/Arch Linux

2. 配置API密钥

编辑 config/config.yaml，填入您的智谱AI API密钥：

asr:
  api_key: "your_zhipu_api_key_here"

glm:
  api_key: "your_zhipu_api_key_here"

3. 编译和运行

# 编译并运行
./build.sh

# 或者分别执行
./build.sh --no-run  # 只编译
./run.sh start       # 运行系统

使用方法

系统控制

# 启动系统
./run.sh start

# 停止系统
./run.sh stop

# 查看状态
./run.sh status

# 查看日志
./run.sh logs

使用语音输入

按住右侧 Ctrl 键
说话
松开按键，系统自动识别并执行

配置说明

角色配置

在 config/config.yaml 中可以配置不同的AI角色：

roles:
  assistant:
    name: "智能助手"
    prompt: "你是一个专业的AI助手..."
    functions: ["search", "calculate", "translate"]

  programmer:
    name: "程序员"
    prompt: "你是一个资深程序员..."
    functions: ["code_review", "debug"]

意图配置

定义语音命令和对应的功能：

intents:
  open_app:
    keywords: ["打开", "启动", "运行"]
    function: "execute_command"

  search:
    keywords: ["搜索", "查找"]
    function: "web_search"

安全设置

security:
  allow_system_commands: true
  allowed_commands: ["ls", "cd", "cat"]  # 留空表示允许所有命令

支持的命令示例

"打开浏览器" - 启动默认浏览器
"搜索 Python 教程" - 打开搜索结果
"翻译 Hello 到中文" - 翻译文本
"计算 2+2*3" - 数学计算
"执行 ls -la" - 运行系统命令

故障排除

权限问题

确保当前用户有权限访问音频设备：

sudo usermod -a -G audio $USER

X11错误

确保X11服务器正在运行，或者使用xhost +允许本地连接。

音频设备

检查麦克风是否正常工作：

arecord -D plughw:0,0 -d 5 test.wav
aplay test.wav

开发计划

Phase 1: 基础架构
Phase 2: 核心功能
Phase 3: 优化完善
Phase 4: 打包发布

贡献指南

欢迎提交Issue和Pull Request！

许可证

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
config		config
docs		docs
src		src
tests		tests
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
CMakeLists.txt		CMakeLists.txt
README.md		README.md
build.sh		build.sh
init_env.sh		init_env.sh
install_deps.sh		install_deps.sh
requirements.txt		requirements.txt
run.sh		run.sh
setup_permissions.sh		setup_permissions.sh
test_audio.sh		test_audio.sh
test_text_input.sh		test_text_input.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IME Input System

功能特性

系统架构

C++ 核心模块

Python 业务逻辑

快速开始

1. 一键安装和构建

手动安装步骤

1. 安装系统依赖

2. 配置API密钥

3. 编译和运行

使用方法

系统控制

使用语音输入

配置说明

角色配置

意图配置

安全设置

支持的命令示例

故障排除

权限问题

X11错误

音频设备

开发计划

贡献指南

许可证

About

Uh oh!

Releases

Packages

Languages

justa-cai/autotyper

Folders and files

Latest commit

History

Repository files navigation

IME Input System

功能特性

系统架构

C++ 核心模块

Python 业务逻辑

快速开始

1. 一键安装和构建

手动安装步骤

1. 安装系统依赖

2. 配置API密钥

3. 编译和运行

使用方法

系统控制

使用语音输入

配置说明

角色配置

意图配置

安全设置

支持的命令示例

故障排除

权限问题

X11错误

音频设备

开发计划

贡献指南

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages