Replies: 1 comment 2 replies
-
感觉比起改代码,用户直接手动把原始数据集混合起来比较方便,比如 aishell3 + baker, 你可以把 baker 相关的数据当成 aishell3 里面的一个音色,文本和音频按同样的格式放 |
Beta Was this translation helpful? Give feedback.
2 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
除了已支持的数据集以外,如果需要加入新的数据集,或者需要混合多个数据集一起训练,是否可以改进一下preprocess的流程,以避免重复预处理呢?目前preprocess的问题是需要全部重新计算一遍,是否可以添加一些控制的参数如--input_data,然后输入某些数据集的名字,然后自动跳过已生成的pitch,energy,speech等信息,或者自动删除--input_data中不存在的数据集的信息(比如说上次预处理aishell3,这次不想要aishell3的数据就自动删除),这样可以快速的提高预处理的速度,对自定义数据集的处理更加方便。
Beta Was this translation helpful? Give feedback.
All reactions