预训练语言模型及其应用被引量：1

Pre-Trained Language Models and Their Applications

在线阅读下载PDF

导出

摘要预训练语言模型(pre-trained languages model,PTLM)在自然语言处理(natural language processing,NLP)领域取得了令人瞩目的成功,并由此引发了下游任务从监督学习到预训练-微调范式的转变。在此之后,一系列预训练模型的创新研究涌现出来。本文系统性、全面的回顾了自然语言处理的代表性工作和最新进展,并按照类别系统性的介绍了自然语言处理领域的预训练模型。首先我们简要介绍了预训练模型,以及不同的模型特点和框架。之后,我们介绍并分析了预训练模型的影响和挑战以及下游任务中的应用。最后,我们简要总结并阐述了预训练模型未来的研究方向。 Pre-trained language models have achieved striking success in natural language processing(NLP),leading to a paradigm shift from supervised learning to pre-training followed by fine-tuning.The NLP community has witnessed a surge of research interest in improving pre-trained models.This article presents a comprehensive review of representative work and recent progress in the NLP field and introduces the taxonomy of pre-trained models.We first give a brief introduction of pre-trained models,followed by characteristic methods and frameworks.We then introduce and analyze the impact and challenges of pre-trained models and their downstream applications.Finally,we briefly conclude and address future research directions in this field.

作者王海峰李纪为 Hua Wu Eduard Hovy Yu Sun Haifeng Wang;Jiwei Li;Hua Wu;Eduard Hovy;Yu Sun(Baidu Inc.,Beijing 100193,China;College of Computer Science and Technology,Zhejiang University,Hangzhou 310058,China;Language Technologies Institute,Carnegie Mellon University,Pittsburgh,PA 15213,USA)

机构地区 Baidu Inc. College of Computer Science and Technology Language Technologies Institute

出处《Engineering》 SCIE EI CAS CSCD 2023年第6期51-65,M0004,共16页 工程（英文）

关键词自然语言处理语言模型预训练影响和挑战范式的转变 Pre-trained models Natural language processing

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介 Corresponding author:Haifeng Wang,E-mail address:wanghaifeng@baidu.com。

引文网络
相关文献

同被引文献10

1苏龙翔,翁利,李文雄,隆云.大型语言模型在重症医学中的应用与挑战[J].中华医学杂志,2023,103(31):2361-2364. 被引量：6
2尚少梅,王翠,董旭,侯罗娅.对我国高等护理教育近20年发展的回顾与思考[J].中国护理管理,2021,21(9):1292-1295. 被引量：46
3王淑金,王丽萍,安聪,陈晨.虚拟现实技术在临床护理中的研究进展[J].中华现代护理杂志,2022,28(8):1116-1120. 被引量：18
4胡艳杰,李玲利,田亚丽,张凤英,刘洪红,邱晨,李卡.护理学一流学科建设引领一流人才培养[J].四川大学学报（医学版）,2023,54(1):102-107. 被引量：23
5李兆石.从大语言模型到通用人工智能:第四次产业革命的滥觞[J].华东科技,2023(4):18-21. 被引量：4
6张海波,杨兆山.ChatGPT的教育挑战与应答[J].四川师范大学学报（社会科学版）,2023,50(4):107-114. 被引量：26
7马武仁,弓孟春,戴辉,黄婧,王斌斌,史文钊.以ChatGPT为代表的大语言模型在临床医学中的应用综述[J].医学信息学杂志,2023,44(7):9-17. 被引量：30
8李梦娟,黄宜燕,付逗,欧阳艳琼.高仿真模拟教学中护生学习体验质性研究的Meta整合[J].中华现代护理杂志,2023,29(29):4025-4031. 被引量：2
9郭彩霞,郭彩旭,史晓宁,郭锦丽.ChatGPT赋能护理实践:前景、风险及对策[J].协和医学杂志,2023,14(6):1170-1174. 被引量：13
10钱鹏雁,陆道坤.ChatGPT冲击下教师的角色危机与重塑[J].继续教育研究,2024(1):25-31. 被引量：8

引证文献1

1李源,罗碧如,Rosemary Fu Mei,胡艳玲.以大语言模型为引擎的护理教育创新实践与前景展望[J].中华现代护理杂志,2025,31(6):830-835.

1杜娟.人工智能对会计教育工作者的影响和挑战[J].葡萄酒,2023(14):88-90.
2张红义,呼木吉乐图.电压跌落下的双馈风力发电机网侧变流器自适应变惯量控制方法[J].微电机,2023,56(10):49-54. 被引量：3
3田磊.金融科技对传统银行业务模式的冲击与转型[J].葡萄酒,2023(14):239-241. 被引量：1
4冉宝春,曹跃龙,支娜.基于SMES风电不对称故障穿越控制策略研究[J].电力电子技术,2023,57(10):89-92.
5毕军,杜宇佳,王永兴,左小龙.基于用户综合满意度的电动汽车充电诱导优化模型[J].清华大学学报（自然科学版）,2023,63(11):1750-1759. 被引量：1
6王文涛,奚雪峰,崔志明,徐川.地名实体识别研究与展望[J].计算机工程与应用,2023,59(21):66-82.
7彭美红,卢芳国.基于数据挖掘的非物理因素致急性肺损伤动物模型分析[J].中国实验方剂学杂志,2023,29(23):158-165. 被引量：2
8汪浩祥,曹光乔,闫子彤,陈聪.天气变化情形下基于动态时间窗的收获机应急调度技术[J].农业机械学报,2023,54(10):105-113.

Engineering

2023年第6期

浏览历史

内容加载中请稍等...

预训练语言模型及其应用被引量：1

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

预训练语言模型及其应用 被引量：1

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

预训练语言模型及其应用被引量：1