Skip to content

Commit 93ab3c8

Browse files
committed
update model README
1 parent 5d97a39 commit 93ab3c8

File tree

1 file changed

+10
-8
lines changed

1 file changed

+10
-8
lines changed

model/README.md

Lines changed: 10 additions & 8 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,19 @@
1-
# 模型说明
1+
## 模型说明
22

3-
# 新闻主题模型
3+
首期开放新闻领域主题模型,其他不同领域的模型会陆续开放。
4+
5+
### 新闻主题模型
46

57
使用百度新闻2016全年千万级新闻数据训练, 词表数294657, 主题数2000。
68
模型包括LDA、SentenceLDA(SLDA), Topical Word Embedding (TWE), 其中模型均存放于model/news目录中
79

810
* lda.conf # LDA模型inference所需配置文件
911
* slda.conf # Sentence-LDA模型inference所需配置文件
10-
* news_lda.model # LDA模型参数
11-
* news_slda.model # Sentence-LDA模型参数
12-
* news_twe_lda.model # TWE模型参数, 包括词向量与主题向量
13-
* vocab_info.txt # 词表文件中文编码采用UTF-8
12+
* news_lda.model # LDA模型参数, 存储格式为libSVM格式
13+
* news_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式
14+
* news_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量
15+
* vocab_info.txt # 词表文件, 中文编码采用UTF-8
1416

15-
# 网页主题模型
17+
### 网页主题模型
1618

17-
To Be Released
19+
To Be Released.

0 commit comments

Comments
 (0)