Skip to content

GuangChen2333/FindUrVoicesPJSK

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

36 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

FindUrVoicesPJSK

《世界计划 : 缤纷舞台》单角色语音数据集一键获取工具,基于 Sekai-World 数据库。
A one-click downloader for a single Project Sekai character’s voice dataset using the Sekai-World database.

特性 Features

  • 支持独唱、资料语音、卡片语音等多种内容,按角色一键批量下载。
  • 连接复用 + 小规模并发(可配)加速下载,HTTP/2 & 自定义 User-Agent。
  • 元数据 30 天本地缓存,启动更快。
  • tqdm 进度条展示(卡片总进度 + profile 单独进度)。
  • 自动生成文本清单 manifest.list,可用脚本重写为 GPT-SoVITS 格式。

快速开始 Quick Start

从源码运行 From Source

poetry install
poetry run python main.py

可选参数:

  • wait_time:请求间隔,默认 0.3(在 main.py 调整)。
  • download_workers:并发数,默认 5

Manifest 重写 GPT-SoVITS 格式

使用脚本将 manifest.list 转为 folder/filename|<id>|ja|content 格式:

python scripts/manifest_for_gpt_sovits.py <manifest_path> <target_folder> <character_id>

示例:

python scripts/manifest_for_gpt_sovits.py output/dataset_4/manifest.list output/normalized shiho_hinomori

脚本会复用原始文件名,并处理这些音频文件的位置,写 manifest.list(目标文件夹自动创建)。

支持的下载内容 Supported Content

  • 独唱 Solo songs
  • 纯音频 Pure voices
  • 角色资料音频 Profile voices
  • 角色卡片音频 Card voices

About

《世界计划 : 缤纷舞台》单角色语音数据集一键获取小工具 | 无需手动打标 | wav无压缩 | A simple tool for obtaining the voice datasets of a single character of the Project Sekai: Colorful Stage feat. Hatsune Miku, support annotation and wav format

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages