请问如何从数据集中构建词表呢? 以及构建完成的词表中如何解决类别分布不均的问题呢?  
请问如何从数据集中构建词表呢? 以及构建完成的词表中如何解决类别分布不均的问题呢?

