-
Notifications
You must be signed in to change notification settings - Fork 138
Open
Description
你好,我使用的是mmseg4j-core-1.9.1,在介绍中,我看到了“1.6版在complex基础上实现了最多分词(max-word)。“很好听” -> "很好|好听"; “中华人民共和国” -> "中华|华人|共和|国"; “中国人民银行” -> "中国|人民|银行"。”
我使用了自定义的中文词库,总共有60多万个词条,但是我在Solr Admin中测试发现complex并没有实现最多分词。
比如我输入:“中华人民共和国",则分词的结果为:”中华人民共和国“,我输入”很好听的一首歌曲“,则分词的结果为:”很好听“,”一首“,”歌曲“。我想请问下是不是我需要配置什么filter之类吗,下面是我的配置:
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels