将强大的本地大语言模型(LLM)无缝集成到您的 ComfyUI 工作流中。无需 API Key,保护隐私,开箱即用。
- 🚀 零门槛,自动部署:内置国内镜像加速下载,只需选择模型,系统自动拉取。
- 🔒 100% 本地运行:完全在本地显卡运行,保护隐私,无 API 费用。
- 🇨🇳 全中文友好界面:参数、选项全汉化,专为中文用户优化。
- 🧠 支持前沿模型:支持 Qwen 2.5 全系列及最新的 Qwen 3 (4B)。
- 🎛️ 精细控制:支持随机种子、温度、Top_P 等专业参数调节。
该插件位于节点菜单的 Category: 💬 AI人工智能 下。
- 用途:提示词润色、多语言互译(中/英/日/韩等)。
- 特点:比翻译软件更懂 Stable Diffusion 的语境。
- 用途:创意文案生成、角色扮演、逻辑推理。
- 特点:支持 System Prompt(人设指令)和 Seed(随机种子)锁定,方便复现结果。
- 用途:基于官方微调的 9 位高质量预设角色(如 Vivian、Uncle_Fu)进行语音生成,适合稳定商用。
- 特点:稳定性极高,支持情感指令控制(如输入“用愤怒咆哮的语气”),支持多语言混合生成。
- 用途:无需参考音频,通过自然语言描述(Prompt)凭空创造独一无二的声音。
- 特点:真正的**“文本捏音”**,可自定义性别、年龄、音色和语气(如描述“一个稚嫩的五岁女孩,声音尖细且在撒娇”)。
- 用途:输入 5-10 秒参考音频,即可零样本复刻任意人物的声音。
- 特点:支持标准模式(高还原度,需输入参考文本)和极速模式(仅提取音色),支持批次输出和精细化声学参数控制。
- 插件初次创建,主要节点,🧠 LLM 智能翻译 (Qwen),💬 LLM 智能对话 (Qwen)
- 🔊 Qwen 语音合成 (CustomVoice)用于文生音频,支持9种人声,多国语言,支持 [pause:0.5] 停顿语法。
- 🔊 Qwen 语音设计 (VoiceDesign)用于文生音频,支持通过“声音设计描述”用自然语言定义声音。
- 🔊 Qwen 语音克隆 (VoiceClone)用于声音模仿,给它一段 5-10 秒的某人录音,它就能用那个人的声音说出任何话。
- 🧠 LLM 智能翻译 (Qwen)增加提示词润色功能。
- 打开您的 ComfyUI 目录,进入
custom_nodes文件夹。 - 在地址栏输入
cmd或右键打开终端/命令行。 - 输入以下命令克隆本项目:
git clone https://github.com/a63976659/ComfyUI-Artificial-Intelligence.git
- 进入插件文件夹并安装依赖:
cd 您的仓库名
pip install -r requirements.txt
- 重启 ComfyUI。
- 本插件的翻译和对话模型存放目录为:
ComfyUI/models/LLM - 本插件的语音模型模型存放目录为:
ComfyUI/models/TTS
- 在节点界面中,将 "自动下载模型" 开关设置为
True。 - 在 "模型名称" 列表中选择您想要的模型(例如
Qwen2.5-7B-Instruct)。 - 运行工作流(Queue Prompt)。
- 插件会自动检测本地是否存在该模型,若不存在,将通过国内镜像源自动下载并保存到
models/LLM或models/TTS目录中。
- 注意:首次下载可能需要一定时间,请关注控制台(Console)进度。
如果您希望手动管理模型,请按照以下步骤操作:
- 访问模型库:前往 HuggingFace 或 ModelScope 下载模型文件。
- Qwen2.5-7B-Instruct
- Qwen2.5-3B-Instruct
- Qwen3-4B-Instruct (注:请查找对应的Qwen仓库)
- 创建文件夹:
在
ComfyUI/models/LLM目录下创建一个与模型名称完全一致的文件夹。例如:
ComfyUI/models/LLM/Qwen2.5-7B-Instruct
- 放入文件:
将下载的所有模型文件(
.safetensors,config.json,tokenizer.json等)放入上述文件夹中。 - 目录结构示例: 确保您的文件结构如下所示:
ComfyUI/
├── models/
│ ├── LLM/
│ │ ├── Qwen2.5-7B-Instruct/
│ │ │ ├── model-00001-of-00004.safetensors
│ │ │ ├── config.json
│ │ │ ├── tokenizer.json
│ │ │ └── ... (其他文件)
- 刷新 ComfyUI:下载完成后, ComfyUI 界面,点击键盘刷新按钮的 "R" ,或重启 ComfyUI。
由于 Qwen-TTS 底层依赖于 SoX 和 FFmpeg 进行音频处理,这些不能通过 pip 安装,必须手动配置:
- 安装 SoX:
- 下载 sox-14.4.2-win32.zip。
- 解压后将
sox.exe所在的文件夹路径添加到系统的 环境变量 (Path) 中。 - 或者:直接将解压后的所有文件复制到 ComfyUI 整合包的
python_embeded/根目录下。
(https://sourceforge.net/projects/sox/files/sox/14.4.2/)
- 安装 FFmpeg:
- 确保你的电脑安装了 FFmpeg。若未安装,请前往 ffmpeg.org 下载并配置环境变量。
sudo apt-get update
sudo apt-get install sox ffmpeg libsox-fmt-all
- **报错
Out of Memory**:请尝试切换更小的模型(如 1.5B 或 3B 版本),或减小最大生成长度。 - 下载失败:请检查网络连接,或尝试使用“方法 B”手动下载模型。
如果这个插件帮你节省了大量时间,欢迎:
- ⭐ Star 项目让更多人看到
- 🐛 提交 Issue 帮助改进
- 📖 分享教程 帮助其他用户
- 💬 讨论社区:[QQ群202018000]
- ☕ 请作者喝咖啡
- 🔔 关注更新,获取最新功能和模型数据库
作者:a63976659
- [小红书:猪的飞行梦]
- [哔哩哔哩主页:https://space.bilibili.com/2114638644]
致谢:感谢所有测试用户和贡献者! 如果你觉得插件还不错可以点个收藏。

