IndexTTS-vLLM

项目简介

该项目在 index-tts 的基础上使用 vllm 库重新实现了 gpt 模型的推理，加速了 index-tts 的推理过程。

推理速度在单卡 RTX 4090 上的提升为：

单个请求的 RTF (Real-Time Factor)：≈0.3 -> ≈0.1
单个请求的 gpt 模型 decode 速度：≈90 token / s -> ≈280 token / s
并发量：gpu_memory_utilization设置为0.5（约12GB显存）的情况下，vllm 显示 Maximum concurrency for 608 tokens per request: 237.18x，两百多并发，man！当然考虑 TTFT 以及其他推理成本（bigvgan 等），实测 16 左右的并发无压力（测速脚本参考 simple_test.py）

新特性

支持多角色音频混合：可以传入多个参考音频，TTS 输出的角色声线为多个参考音频的混合版本（输入多个参考音频会导致输出的角色声线不稳定，可以抽卡抽到满意的声线再作为参考音频）

性能

Word Error Rate (WER) Results for IndexTTS and Baseline Models on the seed-test

model	zh	en
Human	1.254	2.143
index-tts (num_beams=3)	1.005	1.943
index-tts (num_beams=1)	1.107	2.032
index-tts-vllm	1.12	1.987

基本保持了原项目的性能

使用步骤

1. git 本项目

git clone https://github.com/Ksuriuri/index-tts-vllm.git
cd index-tts-vllm

2. 创建并激活 conda 环境

conda create -n index-tts-vllm python=3.12
conda activate index-tts-vllm

3. 安装 pytorch

优先建议安装 pytorch 2.7.0（对应 vllm 0.9.0），具体安装指令请参考：pytorch 官网

若显卡不支持，请安装 pytorch 2.5.1（对应 vllm 0.7.3），并将 requirements.txt 中 vllm==0.9.0 修改为 vllm==0.7.3

4. 安装依赖

pip install -r requirements.txt

5. 下载模型权重

此为官方权重文件，下载到本地任意路径即可，支持 IndexTTS-1.5 的权重

HuggingFace	ModelScope
IndexTTS	IndexTTS
😁IndexTTS-1.5	IndexTTS-1.5

6. 模型权重转换

bash convert_hf_format.sh /path/to/your/model_dir

此操作会将官方的模型权重转换为 transformers 库兼容的版本，保存在模型权重路径下的 vllm 文件夹中，方便后续 vllm 库加载模型权重

7. webui 启动！

将 webui.py 中的 model_dir 修改为模型权重下载路径，然后运行：

VLLM_USE_V1=0 python webui.py

第一次启动可能会久一些，因为要对 bigvgan 进行 cuda 核编译

注：一定要带上 VLLM_USE_V1=0 ，因为本项目没有对 vllm 的 v1 版本做兼容

API

使用 fastapi 封装了 api 接口，启动示例如下：

VLLM_USE_V1=0 python api_server.py --model_dir /your/path/to/Index-TTS --port 11996

注：一定要带上 VLLM_USE_V1=0 ，因为本项目没有对 vllm 的 v1 版本做兼容

启动参数

--model_dir: 模型权重下载路径
--host: 服务ip地址
--port: 服务端口
--gpu_memory_utilization: vllm 显存占用率，默认设置为 0.25

请求示例

import requests

url = "http://0.0.0.0:11996/tts_url"
data = {
    "text": "还是会想你，还是想登你",
    "audio_paths": [  # 支持多参考音频
        "audio1.wav",
        "audio2.wav"
    ]
}

response = requests.post(url, json=data)
with open("output.wav", "wb") as f:
    f.write(response.content)

并发测试

参考 simple_test.py，需先启动 API 服务

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
assets		assets
indextts		indextts
tests		tests
tools/i18n		tools/i18n
.dockerignore		.dockerignore
.gitignore		.gitignore
DISCLAIMER		DISCLAIMER
Dockerfile		Dockerfile
INDEX_MODEL_LICENSE		INDEX_MODEL_LICENSE
LICENSE		LICENSE
README.md		README.md
api_server.py		api_server.py
convert_hf_format.py		convert_hf_format.py
convert_hf_format.sh		convert_hf_format.sh
docker-compose.yaml		docker-compose.yaml
entrypoint.sh		entrypoint.sh
patch_vllm.py		patch_vllm.py
requirements.txt		requirements.txt
simple_test.py		simple_test.py
webui.py		webui.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IndexTTS-vLLM

项目简介

新特性

性能

使用步骤

1. git 本项目

2. 创建并激活 conda 环境

3. 安装 pytorch

4. 安装依赖

5. 下载模型权重

6. 模型权重转换

7. webui 启动！

API

启动参数

请求示例

并发测试

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

IndexTTS-vLLM

项目简介

新特性

性能

使用步骤

1. git 本项目

2. 创建并激活 conda 环境

3. 安装 pytorch

4. 安装依赖

5. 下载模型权重

6. 模型权重转换

7. webui 启动！

API

启动参数

请求示例

并发测试

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages