|
7 | 7 |
|
8 | 8 | ## 应用介绍 |
9 | 9 |
|
10 | | -**Familia**目前包含的三种主题模型,对应的论文介绍可以参考[相关论文](https://github.com/baidu/Familia/wiki/%E5%8F%82%E8%80%83%E6%96%87%E7%8C%AE)。 |
| 10 | +**Familia**目前包含的主题模型的对应论文介绍可以参考[相关论文](https://github.com/baidu/Familia/wiki/%E5%8F%82%E8%80%83%E6%96%87%E7%8C%AE)。 |
11 | 11 |
|
12 | 12 | 主题模型在工业界的应用范式可以抽象为两大类: 语义表示和语义匹配。 |
13 | 13 |
|
14 | | -- **语义表示** |
| 14 | +- **语义表示 (Semantic Representation)** |
15 | 15 |
|
16 | | - 对文档进行主题降维,以获得文档的语义表示,这些表示可以应用于文本分类、文本聚类、CTR预估等下游应用。 |
| 16 | + 对文档进行主题降维,获得文档的语义表示,这些语义表示可以应用于文本分类、文本内容分析、CTR预估等下游应用。 |
17 | 17 |
|
18 | | -- **语义匹配** |
| 18 | +- **语义匹配 (Semantic Matching)** |
19 | 19 |
|
20 | | - 计算文本间的语义匹配度,在代码中我们提供了两种文本类型的相似度计算方式: |
| 20 | + 计算文本间的语义匹配度,我们提供两种文本类型的相似度计算方式: |
21 | 21 |
|
22 | 22 | - 短文本-长文本相似度计算,使用场景包括文档关键词抽取、计算搜索引擎查询和网页的相似度等等。 |
23 | 23 | - 长文本-长文本相似度计算,使用场景包括计算两篇文档的相似度、计算用户画像和新闻的相似度等等。 |
24 | 24 |
|
25 | | -更详细的内容及应用案例可以参考[**Familia Wiki**](https://github.com/baidu/Familia/wiki) |
| 25 | +更详细的内容及工业界应用案例可以参考[**Familia Wiki**](https://github.com/baidu/Familia/wiki) |
26 | 26 |
|
27 | 27 | ## 代码编译 |
28 | 28 | 第三方依赖包括`gflags-2.0`,`glogs-0.3.4`,`protobuf-2.5.0`, 同时要求编译器支持C++11, `g++ >= 4.8`, 兼容Linux和Mac操作系统。 |
|
37 | 37 |
|
38 | 38 | * 关于模型的详细配置说明可以参考[模型说明](https://github.com/baidu/Familia/blob/master/model/README.md) |
39 | 39 |
|
40 | | -我们会陆续开放更多不同领域的多种主题模型,来满足更多不同的场景需求。 |
| 40 | +我们会陆续开放不同领域的多种主题模型,来满足更多不同的场景需求。 |
41 | 41 |
|
42 | 42 | ## DEMO |
43 | 43 |
|
|
48 | 48 |
|
49 | 49 | - **语义匹配计算** |
50 | 50 |
|
51 | | - 计算文件间相似度,包括短文本-长文本、长文本-长文本间的相似度计算。 |
| 51 | + 计算文本之间的相似度,包括短文本-长文本、长文本-长文本间的相似度计算。 |
52 | 52 |
|
53 | 53 | - **模型内容展现** |
54 | 54 |
|
55 | | - 对模型的主题词,近邻词进行展现,供用户对模型的主题有直观的理解。 |
| 55 | + 对模型的主题词,近邻词进行展现,方便用户对模型的主题有直观的理解。 |
56 | 56 |
|
57 | 57 | 具体的Demo使用说明可以参考[使用文档](https://github.com/baidu/Familia/wiki/Demo%E4%BD%BF%E7%94%A8%E6%96%87%E6%A1%A3) |
58 | 58 |
|
|
62 | 62 |
|
63 | 63 | `export LD_LIBRARY_PATH=./third_party/lib:$LD_LIBRARY_PATH` |
64 | 64 |
|
65 | | -* 代码中内置简易的FMM分词工具,只针对主题模型中出现的词表进行正向匹配。该工具仅用于Demo示例使用,若对分词和语义准确度有更高要求,建议使用商用分词工具,并使用自定义词表的功能导入主题模型中的词表。 |
| 65 | +* 代码中内置简易的FMM分词工具,只针对主题模型中出现的词表进行正向匹配。若对分词和语义准确度有更高要求,建议使用商用分词工具,并使用自定义词表的功能导入主题模型中的词表。 |
66 | 66 |
|
67 | 67 | ## 问题咨询 |
68 | 68 |
|
|
0 commit comments