아래의 예시를 보면 Noun + 이 와 Noun 이 모두 명사로 추출되는 경우들이 있습니다.
그런데 score(Noun + 이) < score(Noun) 인 경우에는 Noun + 이가 잘못된 명사일 경우들이 많으며, 그 반대인 경우에는 Noun + 이 와 Noun 모두 명사인 경우들이 많습니다.
- 전자의 예시 :
상식이 vs 상식, 기억이 vs 기억
- 후자의 예시 :
고양이 vs 고양, 바둑이 vs 바둑
- 예외의 예시 :
천불이 vs 천불
위의 규칙기반 명사 추출 후처리 기능을 선택적으로 이용할 수 있으면 편리할 듯 합니다.
