這邊看到 g0v 有整理好的教育部重編國語辭典資料:https://github.com/g0v/moedict-data 想說要把重編辭典中的語詞整合到 `tsi.csv`,版權應該是沒問題,但是詞頻的部份還不確定要怎麼設定,想說先用一個固定值,之後再研究從語料統計詞頻