eznlp/docs/entity-recognition.md at master · syuoni/eznlp

Named Entity Recognition

The experimental results reported here are informal. Please check our published papers for formal results.

English Datasets

Settings:

Models w/o PLMs
- Optimizer: SGD (lr=0.1) | Adadelta (lr=1.0)
- Batch size: 32 | 64
- Number of epochs: 100
- Word embeddings are initialized with GloVe
Models w/ PLMs
- Optimizer: AdamW (lr=1e-3/2e-3, ft_lr=1e-5)
- Batch size: 48
- Number of epochs: 50
- Scheduler: Learning rate warmup at the first 20% steps followed by linear decay
- PLMs are loaded with dropout rate of 0.2
Sequence tagging scheme: BIOES

♦ use both training and development splits for training (Biaffine). ♣️ use document-level (cross-sentence) context.

CoNLL 2003

Model	Paper	Reported F1	Our Imp. F1	Notes
CharLSTM + LSTM + CRF	Lample et al. (2016)	90.94	91.28	num_layers=1
CharCNN + LSTM + CRF	Ma and Hovy (2016)	91.21	90.70	num_layers=1
ELMo + Char + LSTM + CRF	Peters et al. (2018)	92.22 (0.10)	92.60	num_layers=1
Flair + Char + LSTM + CRF	Akbik et al. (2018)	93.09^♦ (0.12)	92.60	num_layers=1
ELMo + Flair + Char + LSTM + CRF	-	-	92.67	num_layers=1
BERT-base + Softmax	Devlin et al. (2018)	92.4	92.02
BERT-base + CRF	-	-	92.38
BERT-base + LSTM + CRF	-	-	92.40
BERT-large + Softmax	Devlin et al. (2018)	92.8	92.34
BERT-large + CRF	-	-	92.64
BERT-large + LSTM + CRF	-	-	92.80
RoBERTa-base + Softmax	Liu et al. (2019)	-	92.39
RoBERTa-base + CRF	-	-	92.59 (93.31^♣️)
RoBERTa-base + LSTM + CRF	-	-	92.71 (93.39^♣️)
RoBERTa-large + Softmax	Liu et al. (2019)	-	92.81
RoBERTa-large + CRF	-	-	93.20 (93.37^♣️)
RoBERTa-large + LSTM + CRF	-	-	93.26 (93.31^♣️)

Model	Paper	Reported F1	Our Imp. F1
BERT-large-wwm + CRF	Devlin et al. (2018)	-	92.60
BERT-large-wwm + LSTM + CRF	-	-	92.68
ALBERT-base + CRF	Lan et al. (2019)	-	90.19
ALBERT-base + LSTM + CRF	-	-	90.39
ALBERT-xxlarge + CRF	Lan et al. (2019)	-	92.30
ALBERT-xxlarge + LSTM + CRF	-	-	92.46
SpanBERT-base + CRF	Joshi et al. (2020)	-	92.29
SpanBERT-base + LSTM + CRF	-	-	92.27
SpanBERT-large + CRF	Joshi et al. (2020)	-	93.07
SpanBERT-large + LSTM + CRF	-	-	93.04

Model	Paper	Reported F1	Our Imp. F1	Notes
SpERT (with CharLSTM + LSTM)	-	-	91.22	num_layers=2
SpERT (with BERT-base)	Eberts and Ulges (2019)	-	91.97
SpERT (with BERT-base + LSTM)	-	-	92.62
SpERT (with RoBERTa-base)	-	-	92.36
SpERT (with RoBERTa-base + LSTM)	-	-	92.50

Model	Paper	Reported F1	Our Imp. F1	Notes
Biaffine (with CharLSTM + LSTM)	-	-	91.05	num_layers=2
Biaffine (with BERT-base)	-	-	92.47
Biaffine (with BERT-base + LSTM)	-	-	92.74
Biaffine (with BERT-large)	Yu et al. (2020)	93.5^♦♣️	92.67
Biaffine (with RoBERTa-base)	-	-	92.56
Biaffine (with RoBERTa-base + LSTM)	-	-	92.77
Biaffine (with RoBERTa-large)	-	-	93.26

OntoNotes v5

Model	Paper	Reported F1	Our Imp. F1	Notes
CharLSTM + LSTM + CRF	Lample et al. (2016)	-	87.68	num_layers=2
CharCNN + LSTM + CRF	Chiu and Nichols (2016)	86.17 (0.22)	87.43	num_layers=2
ELMo + Char + LSTM + CRF	Peters et al. (2018)	-	89.71	num_layers=2
Flair + Char + LSTM + CRF	Akbik et al. (2018)	89.3^♦	89.02	num_layers=2
ELMo + Flair + Char + LSTM + CRF	-	-	89.55	num_layers=2
BERT-base + Softmax	Devlin et al. (2018)	-	89.35
BERT-base + CRF	-	-	90.14
BERT-base + LSTM + CRF	-	-	89.89
Biaffine (with BERT-large)	Yu et al. (2020)	91.3^♦♣️	-
RoBERTa-base + Softmax	Liu et al. (2019)	-	90.22
RoBERTa-base + CRF	-	-	90.83
RoBERTa-base + LSTM + CRF	-	-	91.05

Chinese Datasets

Settings:

Models w/o PLMs
- Optimizer: AdamW (lr=1e-3)
- Batch size: 32
- Number of epochs: 100
Models w/ PLMs
- Optimizer: AdamW (lr=1e-3/2e-3, ft_lr=1e-5)
- Batch size: 48
- Number of epochs: 50
- Scheduler: Learning rate warmup at the first 20% steps followed by linear decay
- PLMs are loaded with dropout rate of 0.2
Sequence tagging scheme: BIOES

MSRA (SIGHAN 2006)

All experiments use testing split as development split (SoftLexicon).

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF	Zhang and Yang (2018)	88.81	89.49	num_layers=2
Bichar + LSTM + CRF	Zhang and Yang (2018)	91.87	92.02	num_layers=2
Lattice-LSTM + CRF	Zhang and Yang (2018)	93.18
FLAT + CRF	Li et al. (2019)	94.35
SoftLexicon + LSTM + CRF	Ma et al. (2020)	93.66	93.64	num_layers=2; Adamax (lr=1e-3)
BERT + CRF	Ma et al. (2020)	93.76	95.92
BERT + LSTM + CRF	Ma et al. (2020)	94.83	96.18
FLAT + BERT + CRF	Li et al. (2019)	96.09
SoftLexicon + BERT + CRF	Ma et al. (2020)	95.42
ERNIEv1 + CRF	Sun et al. (2019)	93.8*	95.87
ERNIEv1 + LSTM + CRF	Sun et al. (2019)	-	96.24
MacBERT-base + CRF	Cui et al. (2020)	-	95.72
MacBERT-base + LSTM + CRF	Cui et al. (2020)	-	96.13

WeiboNER v2

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF	Zhang and Yang (2018)	52.77	50.19	num_layers=2
Bichar + LSTM + CRF	Zhang and Yang (2018)	56.75	57.18	num_layers=2
Lattice-LSTM + CRF	Zhang and Yang (2018)	58.79
FLAT + CRF	Li et al. (2019)	63.42
SoftLexicon + LSTM + CRF	Ma et al. (2020)	61.42	61.17	num_layers=2; Adamax (lr=5e-3)
BERT + CRF	Ma et al. (2020)	63.80	68.79
BERT + LSTM + CRF	Ma et al. (2020)	67.33	70.48
FLAT + BERT + CRF	Li et al. (2019)	68.55
SoftLexicon + BERT + CRF	Ma et al. (2020)	70.50
ERNIEv1 + CRF	Sun et al. (2019)	-	66.59
ERNIEv1 + LSTM + CRF	Sun et al. (2019)	-	70.81
MacBERT-base + CRF	Cui et al. (2020)	-	67.73
MacBERT-base + LSTM + CRF	Cui et al. (2020)	-	70.71
MacBERT-large + CRF	Cui et al. (2020)	-	70.01
MacBERT-large + LSTM + CRF	Cui et al. (2020)	-	70.24

ResumeNER

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF	Zhang and Yang (2018)	93.48	94.93	num_layers=2
Bichar + LSTM + CRF	Zhang and Yang (2018)	94.41	94.51	num_layers=2
Lattice-LSTM + CRF	Zhang and Yang (2018)	94.46
FLAT + CRF	Li et al. (2019)	94.93
SoftLexicon + LSTM + CRF	Ma et al. (2020)	95.53	95.48	num_layers=2; Adamax (lr=2e-3)
BERT + CRF	Ma et al. (2020)	95.68	95.68
BERT + LSTM + CRF	Ma et al. (2020)	95.51	95.97
FLAT + BERT + CRF	Li et al. (2019)	95.86
SoftLexicon + BERT + CRF	Ma et al. (2020)	96.11
ERNIEv1 + CRF	Sun et al. (2019)	-	95.95
ERNIEv1 + LSTM + CRF	Sun et al. (2019)	-	96.25
MacBERT-base + CRF	Cui et al. (2020)	-	95.80
MacBERT-base + LSTM + CRF	Cui et al. (2020)	-	96.32
MacBERT-large + CRF	Cui et al. (2020)	-	95.60
MacBERT-large + LSTM + CRF	Cui et al. (2020)	-	95.63

OntoNotes v4

Data split following Che et al. (2013) and Zhang and Yang (2018).

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF	Zhang and Yang (2018)	64.30	65.92	num_layers=2
Bichar + LSTM + CRF	Zhang and Yang (2018)	71.89	70.40	num_layers=2
Lattice-LSTM + CRF	Zhang and Yang (2018)	73.88
FLAT + CRF	Li et al. (2019)	76.45
SoftLexicon + LSTM + CRF	Ma et al. (2020)	75.64	74.43	num_layers=2; Adamax (lr=1e-3)
BERT + CRF	Ma et al. (2020)	77.93	82.43
BERT + LSTM + CRF	Ma et al. (2020)	81.82	82.29
FLAT + BERT + CRF	Li et al. (2019)	81.82
SoftLexicon + BERT + CRF	Ma et al. (2020)	82.81
ERNIEv1 + CRF	Sun et al. (2019)	-	81.63
ERNIEv1 + LSTM + CRF	Sun et al. (2019)	-	82.04
MacBERT-base + CRF	Cui et al. (2020)	-	82.04
MacBERT-base + LSTM + CRF	Cui et al. (2020)	-	82.31

OntoNotes v5

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF		-	73.30	num_layers=2
Bichar + LSTM + CRF		-	75.36	num_layers=2
Lattice-LSTM + CRF	Jie and Lu (2019)	76.67
SoftLexicon + LSTM + CRF	Ma et al. (2020)	-	76.13	num_layers=2; Adamax (lr=2e-3)
BERT + CRF		-	80.34
BERT + LSTM + CRF		-	80.31

Yidu S4K (CCKS 2019)

Model	Paper	Reported F1	Our Imp. F1	Notes
LSTM + CRF		-	80.43	num_layers=2
Bichar + LSTM + CRF	DeepIE	81.76	81.04	num_layers=2
SoftLexicon + LSTM + CRF	DeepIE	82.76	82.70	num_layers=2; Adamax (lr=2e-3)
BERT + CRF	DeepIE	83.49	82.97
BERT + LSTM + CRF		-	82.94

References

Che, W., Wang, M., Manning, C. D., and Liu, T. (2013). Named Entity Recognition with Bilingual Constraints. NAACL-HLT 2013.
Lample, G., Ballesteros, M., Subramanian, S., Kawakami, K., and Dyer, C. (2016). Neural Architectures for Named Entity Recognition. NAACL-HLT 2016.
Ma, X., and Hovy, E. (2016). End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF. ACL 2016.
Chiu, J. P., and Nichols, E. (2016). Named Entity Recognition with Bidirectional LSTM-CNNs. TACL, 4:357-370.
Peters, M., Neumann, M., Iyyer, M., Gardner, M., Clark, C., Lee, K., and Zettlemoyer, L. (2018). Deep Contextualized Word Representations. NAACL-HLT 2018.
Akbik, A., Blythe, D., and Vollgraf, R. (2018). Contextual String Embeddings for Sequence Labeling. COLING 2018.
Akbik, A., Bergmann, T., and Vollgraf, R. (2019). Pooled Contextualized Embeddings for Named Entity Recognition. NAACL-HLT 2019.
Zhang, Y., and Yang, J. (2018). Chinese NER Using Lattice LSTM. ACL 2018.
Devlin, J., Chang, M. W., Lee, K., and Toutanova, K. (2018). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL-HLT 2019.
Liu, Y., Ott, M., Goyal, N., Du, J., Joshi, M., Chen, D., ... and Stoyanov, V. (2019). RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv preprint arXiv:1907.11692.
Lan, Z., Chen, M., Goodman, S., Gimpel, K., Sharma, P., and Soricut, R. (2019). ALBERT: A Lite BERT for Self-supervised Learning of Language Representations. arXiv preprint arXiv:1909.11942.
Jie, Z., and Lu, W. (2019). Dependency-Guided LSTM-CRF for Named Entity Recognition. EMNLP 2019.
Eberts, M., and Ulges, A. (2019). Span-based Joint Entity and Relation Extraction with Transformer Pre-training. ECAI 2020.
Sun, Y., Wang, S., Li, Y., Feng, S., Chen, X., Zhang, H., ... and Wu, H. (2019). ERNIE: Enhanced Representation through Knowledge Integration. arXiv preprint arXiv:1904.09223.
Cui, Y., Che, W., Liu, T., Qin, B., Yang, Z., Wang, S., and Hu, G. (2019). Pre-training with Whole Word Masking for Chinese BERT. arXiv preprint arXiv:1906.08101.
Cui, Y., Che, W., Liu, T., Qin, B., Wang, S., & Hu, G. (2020). Revisiting Pre-Trained Models for Chinese Natural Language Processing. EMNLP 2020.
Joshi, M., Chen, D., Liu, Y., Weld, D. S., Zettlemoyer, L., and Levy, O. (2020). SpanBERT: Improving Pre-training by Representing and Predicting Spans. TACL, 8:64-77.
Yu, J., Bohnet, B., and Poesio, M. (2020). Named Entity Recognition as Dependency Parsing. ACL 2020.
Li, X., Yan, H., Qiu, X., and Huang, X. J. (2020). FLAT: Chinese NER using Flat-Lattice Transformer. ACL 2020.
Ma, R., Peng, M., Zhang, Q., Wei, Z., and Huang, X. J. (2020). Simplify the Usage of Lexicon in Chinese NER. ACL 2020.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Named Entity Recognition

English Datasets

CoNLL 2003

OntoNotes v5

Chinese Datasets

MSRA (SIGHAN 2006)

WeiboNER v2

ResumeNER

OntoNotes v4

OntoNotes v5

Yidu S4K (CCKS 2019)

References

FilesExpand file tree

entity-recognition.md

Latest commit

History

entity-recognition.md

File metadata and controls

Named Entity Recognition

English Datasets

CoNLL 2003

OntoNotes v5

Chinese Datasets

MSRA (SIGHAN 2006)

WeiboNER v2

ResumeNER

OntoNotes v4

OntoNotes v5

Yidu S4K (CCKS 2019)

References