要求用户搜素某个词的前几个字也可以得到结果。以“连衣裙”为例,maxword分词结果为“连 | 衣裙”。要求用户搜索“连”或“连衣”都要有结果。我看了下淘宝和京东目前能做到这一点。
这一点现在可以通过模糊查询实现,但担心对较短的中文字词进行频繁模糊查询会影响性能(这个究竟影响多少尚未实测),我希望用空间换时间。
我的解决方案如下:
1、先用mmsege4j进行正常分词
2、将上面正常分词中长度大于等于3的词的前缀也分出来,不管它是不是一个正常的词,比如是“连衣裙”就把“连衣”也分出来。
3、将整个句子分成单字
最后的结果是上面3个集合的和。
这种方案是否能解决我提到的问题?