基于《信息检索导论》进行完善的信息检索(IR)系统
1. 实现倒排索引表,实现与或非三种查询
2. 实现将与或非查询得到的结果基于 df 进行排序
3. 实现基于 tf-idf 的向量编码,在向量空间上进行查询,可以基于编码后的向量计算余弦距离cosine(q,d)或累加和q*d进行排序,并按相关度返回的两种查询
4. 实现基于k-gram的通配符查询,构建k-gram索引结构,可以支持通配符与或非三种查询
5. 实现跳跃表结构,提升AND查询速度
6. 成功计算Jaccard系数并用于通配符查询
XMUAI2024小学期