We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent ab3257a commit 82f1396Copy full SHA for 82f1396
models/match/dssm/readme.md
@@ -107,7 +107,7 @@ bash run.sh #动态图训练并测试,最后得到指标
107
## 进阶使用
108
DSSM作为推荐系统中一种向量召回的方式,一般需要将doc侧的向量预先计算出来,灌入向量搜索引擎(例如milvus)中,同时保存的模型仅为query侧的模型。线上使用阶段,输入query侧的数据,计算出query侧向量后,直接通过向量搜索引擎召回对应的doc。
109
一般在训练的过程中,增加预测阶段,dump出全量的doc侧向量,需要做如下修改:
110
-1. 为了区分dump出的向量,预测阶段使用的数据需要增加insid和content两个字段,其中insid唯一标记样本,content指明对应的doc
+1. 为了区分dump出的向量,预测阶段使用的数据需要增加insid和content两个字段,其中insid唯一标记样本,content指明对应的doc。并在数据处理脚本中对这两个字段进行解析,详见bq_reader_train_insid.py脚本。
111
2. dataset选择InmemoryDataset,同时设置
112
```python
113
dataset.set_parse_ins_id(True)
0 commit comments