Skip to content

complex算法并没有实现最多分词 #17

@wangsheng23

Description

@wangsheng23

你好,我使用的是mmseg4j-core-1.9.1,在介绍中,我看到了“1.6版在complex基础上实现了最多分词(max-word)。“很好听” -> "很好|好听"; “中华人民共和国” -> "中华|华人|共和|国"; “中国人民银行” -> "中国|人民|银行"。”
我使用了自定义的中文词库,总共有60多万个词条,但是我在Solr Admin中测试发现complex并没有实现最多分词。
比如我输入:“中华人民共和国",则分词的结果为:”中华人民共和国“,我输入”很好听的一首歌曲“,则分词的结果为:”很好听“,”一首“,”歌曲“。我想请问下是不是我需要配置什么filter之类吗,下面是我的配置:





Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions