Skip to content

在cosyvoice2强化学习,token2wav合成时,我发现prompt是随机挑选的,这样和LLM推理出的音色会不一致或者俩音色混淆,是不是应该prompt按照LLM推理的prompt对应的id来选。 #34

@carelessswhisper

Description

@carelessswhisper

在cosyvoice2强化学习,token2wav合成时,我发现prompt是随机挑选的,这样和LLM推理出的音色会不一致或者俩音色混淆,是不是应该prompt按照LLM推理的prompt对应的id来选。
https://github.com/nvidia-china-sae/mair-hub/blob/main/rl-tutorial/cosyvoice_llm/token2wav_asr_server.py
prompt_speech_list = [get_random_prompt_from_dataset(self.dataset)[1] for i in range(batch_size)]

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions