/net/projects/EduPo/tools/kveta/dicts/diphthongs.csv
Tady má Plecháč nějaký diftongy asi z korpusu.
Nevíme jestli to nějak používá anebo jak teď rozhoduje o dělení slov u "pouhý" versus "pousmát", ale v korpusu je zjevné že to nějak rozlišuje. To zkusí David ještě objevit jak to dělá.
Každopádně máme asi 20 000 asi správně určenejch doftongů v tom datasetu, tak se na tom můžem asi zkusit naučit do dělat automaticky. To může zkusit Tomáš.