We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
1 parent 5d97a39 commit 93ab3c8Copy full SHA for 93ab3c8
model/README.md
@@ -1,17 +1,19 @@
1
-# 模型说明
+## 模型说明
2
3
-# 新闻主题模型
+首期开放新闻领域主题模型,其他不同领域的模型会陆续开放。
4
+
5
+### 新闻主题模型
6
7
使用百度新闻2016全年千万级新闻数据训练, 词表数294657, 主题数2000。
8
模型包括LDA、SentenceLDA(SLDA), Topical Word Embedding (TWE), 其中模型均存放于model/news目录中
9
10
* lda.conf # LDA模型inference所需配置文件
11
* slda.conf # Sentence-LDA模型inference所需配置文件
- * news_lda.model # LDA模型参数
- * news_slda.model # Sentence-LDA模型参数
12
- * news_twe_lda.model # TWE模型参数, 包括词向量与主题向量
13
- * vocab_info.txt # 词表文件,中文编码采用UTF-8
+ * news_lda.model # LDA模型参数, 存储格式为libSVM格式
+ * news_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式
14
+ * news_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量
15
+ * vocab_info.txt # 词表文件, 中文编码采用UTF-8
16
-# 网页主题模型
17
+### 网页主题模型
18
-To Be Released
19
+To Be Released.
0 commit comments