Skip to content

粤语词语/彦语一字多音问题 #4

@i998979

Description

@i998979

这几天在测试粤语支持的效果时,发现代码貌似没有考虑一字多音的问题。
例如「长者」一词,正确读法该为zoeng2 ze2,但却读成coeng4 ze2。
在原GPT-SoVITS https://github.com/RVC-Boss/GPT-SoVITS/blob/main/GPT_SoVITS/text/cantonese.py 中使用了 https://github.com/CanCLID/ToJyutping 作判断粤语分词的读音,可是在ToJyutping找了一圈也没找到现版本的词语一字多音是如何运作,反而在其中一个pull request的修改纪录中找到词语/彦语的读音 https://raw.githubusercontent.com/rime/rime-cantonese/5b6d334/jyut6ping3.dict.yaml ,可以看一下这两个线索对于修补一字多音问题有没有帮助。

Metadata

Metadata

Assignees

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions