-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Description
这几天在测试粤语支持的效果时,发现代码貌似没有考虑一字多音的问题。
例如「长者」一词,正确读法该为zoeng2 ze2,但却读成coeng4 ze2。
在原GPT-SoVITS https://github.com/RVC-Boss/GPT-SoVITS/blob/main/GPT_SoVITS/text/cantonese.py 中使用了 https://github.com/CanCLID/ToJyutping 作判断粤语分词的读音,可是在ToJyutping找了一圈也没找到现版本的词语一字多音是如何运作,反而在其中一个pull request的修改纪录中找到词语/彦语的读音 https://raw.githubusercontent.com/rime/rime-cantonese/5b6d334/jyut6ping3.dict.yaml ,可以看一下这两个线索对于修补一字多音问题有没有帮助。
Metadata
Metadata
Assignees
Labels
No labels