Skip to content

Commit 82f1396

Browse files
committed
dssm readme add dump
1 parent ab3257a commit 82f1396

File tree

1 file changed

+1
-1
lines changed

1 file changed

+1
-1
lines changed

models/match/dssm/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -107,7 +107,7 @@ bash run.sh #动态图训练并测试,最后得到指标
107107
## 进阶使用
108108
DSSM作为推荐系统中一种向量召回的方式,一般需要将doc侧的向量预先计算出来,灌入向量搜索引擎(例如milvus)中,同时保存的模型仅为query侧的模型。线上使用阶段,输入query侧的数据,计算出query侧向量后,直接通过向量搜索引擎召回对应的doc。
109109
一般在训练的过程中,增加预测阶段,dump出全量的doc侧向量,需要做如下修改:
110-
1. 为了区分dump出的向量,预测阶段使用的数据需要增加insid和content两个字段,其中insid唯一标记样本,content指明对应的doc
110+
1. 为了区分dump出的向量,预测阶段使用的数据需要增加insid和content两个字段,其中insid唯一标记样本,content指明对应的doc。并在数据处理脚本中对这两个字段进行解析,详见bq_reader_train_insid.py脚本。
111111
2. dataset选择InmemoryDataset,同时设置
112112
```python
113113
dataset.set_parse_ins_id(True)

0 commit comments

Comments
 (0)