PaddleNLP v2.3.6
New Features
- 新增基于ERNIE 3.0的RocketQA召回模型,包含rocketqa-zh-base(12-layer, 768-hidden)、rocketqa-zh-medium(6-layer, 768-hidden)、rocketqa-zh-mini(6-layer, 384-hidden),rocketqa-zh-micro(4-layer, 384-hidden)和rocketqa-zh-nano(4-layer, 312-hidden)5个语义检索召回模型,在Dureader Retrieval数据集上达到中文最佳效果。 #3033
- 新增基于ERNIE 3.0的RocketQA排序模型。 包含rocketqa-base(12-layer, 768-hidden)、 rocketqa-medium(6-layer, 768-hidden)、rocketqa-mini(6-layer, 384-hidden)、rocketqa-micro(4-layer, 384-hidden)和rocketqa-nano(4-layer, 312-hidden)5个语义检索排序模型,在Dureader Retrieval数据集上达到中文最佳效果。 #3019
- 新增VI-LayoutXLM文档多模态模型,推理速度与精度超越LayoutXLM。#2935
- NLP流水线系统Pipelines新增RocketQA轻量化模型,端到端响应速度显著提升。 #3078
Unit Test
- 新增Ernie-Gram模型单测 #3059
- 新增TinyBert模型单测 #2992
- 新增Roformer模型单测 #2991
- 新增ERNIE-M模型单测 #2964
- 新增Skep模型单测 #2941
- 新增Electra和XLNet模型单测 #3031
- 新增RoBERTa、ALBERT 和 ERNIE模型的单测 #2972
Bug Fix
- 修复BART tokenizer获取
bos_token_id
出错问题 #3058 - 修复BART tokenizer无法设置
model_max_length
问题 #3018 - 修复Pipelines的随机问题生成按钮报错问题和搜索问题回退到上一个搜索结果的问题。 #2954
- 修复Pipelines在Python3.7上利用FAISS抽向量引起的问题。 #2965
- 修复Tokenizer
resize-token-embeddings
错误 #2763 - 修复OPT示例代码 #3064
- pointer_summarizer支持xpu和多卡 #2963 #3004
New Contributors
- @veyron95 made their first contribution in #2879
- @BasicCoder made their first contribution in #2977
- @dongfangshenzhu made their first contribution in #3046
- @Haibarayu made their first contribution in #2694
Full Changelog: v2.3.5...v2.3.7