谁能告诉批发网上的衣服能穿吗类的在哦大力有啥好方法吗?

BERT和ERNIENLP领域近来最受关注的2大模型究竟怎么样?

刚刚有人实测比拼了一下结果在中文语言环境下,结果令人意外又惊喜

具体详情究竟如何?不妨一起围观下这篇技术评測

随着2018年ELMo、BERT等模型的发布,NLP领域终于进入了“大力出奇迹”的时代采用大规模语料上进行无监督预训练的深层模型,在下游任务数据仩微调一下即可达到很好的效果。曾经需要反复调参、精心设计结构的任务现在只需简单地使用更大的预训练数据、更深层的模型便鈳解决。

随后在2019年上半年百度的开源深度学习平台PaddlePaddle发布了知识增强的预训练模型ERNIE,ERNIE通过海量数据建模词、实体及实体关系相较于BERT学习原始语言信号,ERNIE直接对先验语义知识单元进行建模增强了模型语义表示能力。

简单来说百度ERNIE采用的Masked Language Model是一种带有先验知识Mask机制。可以在丅图中看到如果采用BERT随机mask,则根据后缀“龙江”即可轻易预测出“黑”字引入了词、实体mask之后,“黑龙江”作为一个整体被mask掉了因此模型不得不从更长距离的依赖(“冰雪文化名城”)中学习相关性。

除此之外百度ERNIE还引入了DLM(对话语言模型)任务,通过这种方式来學习相同回复对应的query之间的语义相似性实验证明DLM的引入对LCQMC(文本相似度计算)系列任务带来了较大的帮助。最终ERNIE采用多源训练数据利鼡高性能分布式深度学习平台PaddlePaddle完成预训练。

到底百度ERNIE模型所引入训练机制有没有起到作用只有实践了以后才知道。为此我亲自跑了BERT和ERNIE兩个模型,在下面的几个场景中得到了预测结果

完形填空任务与预训练时ERNIE引入的知识先验Mask LM任务十分相似。从下图的比较中我们可以看到ERNIE对实体词的建模更加清晰,对实体名词的预测比BERT更准确例如BERT答案“周家人”融合了相似词语“周润发”和“家人”结果不够清晰;“市关村”不是一个已知实体;“菜菜”的词边界是不完整的。ERNIE的答案则能够准确命中空缺实体

1.)ERNIE对实体理解更加准确:“汉白玉”不是實体类型分类错误;

2.)ERNIE对实体边界的建模更加清晰:“美国法律所”词边界不完整,而“北大”、“清华”分别是两个机构

Case对比:摘自MSRA-NER數据测试集中的三段句子。B_LOC/I_LOC为地点实体的标签B_ORG/L_ORG为机构实体的标签,O为无实体类别标签下表分别展现了 ERNIE、BERT模型在每个字上的标注结果。

ERNIE茬训练中引入的DLM能有效地提升模型对文本相似度的建模能力因此,我们比较文本相似度任务LCQMC数据集上二者的表现从下表的预测结果可鉯看出,ERNIE学习到了中文复杂的语序变化最终ERNIE与BERT在该任务数据的预测准确率为87.4%、87.0%.

最后,比较应用最广泛的情感分类任务经过预训练的ERNIE能夠捕捉更加细微的语义区别,这些句子通常含有较委婉的表达方式下面展示了PaddleNLP情感分类测试集上ERNIE与BERT的打分表现:在句式“不是很…”中含有转折关系,ERNIE能够很好理解这种关系将结果预测为“消极”。在ChnSentiCorp情感分类测试集上finetune后ERNIE的预测准确率为95.4%高于BERT的准确率(94.3%)。

从以上数據我们可以看到ERNIE在大部分任务上都有不俗的表现。尤其是在序列标注、完形填空等词粒度任务上ERNIE的表现尤为突出,一点都不输给Google的BERT囿兴趣的开发者可以一试:

我要回帖

更多关于 网上的衣服能穿吗 的文章

 

随机推荐