-
Notifications
You must be signed in to change notification settings - Fork 653
Open
Description
for i in range(self.neg_num):
tmp.append(random.random())
neg_array = self.cs.searchsorted(tmp)
output.append(
np.array([int(i)
for i in neg_array]).astype('int64'))
yield output
负采样得到的 id 用的是采样 list (self.cs) 的 index 值,并且直接作为了输出,没有映射到单词的 word_id,这可能导致模型的负采样逻辑完全出错。
另外,在取 context 词的时候为什么要对 window_size 的大小做随机呢,是为了 demo 能快速运行吗?
Metadata
Metadata
Assignees
Labels
No labels