期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于深度学习的自然语言处理鲁棒性研究综述 被引量:20
1
作者 桂韬 奚志恒 +5 位作者 郑锐 刘勤 马若恬 伍婷 包容 张奇 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期90-112,共23页
近年来,基于深度神经网络的模型在几乎所有自然语言处理任务上都取得了非常好的效果,在很多任务上甚至超越了人类.展现了极强能力的大规模语言模型也为自然语言处理模型的发展与落地提供了新的机遇和方向.然而,这些在基准测试集合上取... 近年来,基于深度神经网络的模型在几乎所有自然语言处理任务上都取得了非常好的效果,在很多任务上甚至超越了人类.展现了极强能力的大规模语言模型也为自然语言处理模型的发展与落地提供了新的机遇和方向.然而,这些在基准测试集合上取得很好结果的模型在实际应用中的效果却经常大打折扣.近期的一些研究还发现,在测试数据上替换一个相似词语、增加一个标点符号,甚至只是修改一个字母都可能使得这些模型的预测结果发生改变,效果大幅度下降.即使是大型语言模型,也会因输入中的微小扰动而改变其预测结果.什么原因导致了这种现象的发生?深度神经网络模型真的如此脆弱吗?如何才能避免这种问题的出现?这些问题近年来受到了越来越多的关注,诸多有影响力的工作都不约而同地从不同方面讨论了自然语言处理的鲁棒性问题.在本文中,我们从自然语言处理任务的典型范式出发,从数据构建、模型表示、对抗攻防以及评估评价等四个方面对自然语言处理鲁棒性相关研究进行了总结和归纳,并对最新进展进行了介绍,最后探讨了未来的可能研究方向以及我们对自然语言处理鲁棒性问题的一些思考. 展开更多
关键词 自然语言处理 鲁棒性 深度学习 预训练语言模型 对抗攻防
在线阅读 下载PDF
GPT系列大语言模型在自然语言处理任务中的鲁棒性 被引量:18
2
作者 陈炫婷 叶俊杰 +3 位作者 祖璨 许诺 桂韬 张奇 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1128-1142,共15页
大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤... 大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤为重要.因此,使用涵盖了9个常见NLP任务的15个数据集(约147000个原始测试样本)和来自TextFlint的61种鲁棒的文本变形方法分析GPT-3和GPT-3.5系列模型在原始数据集上的性能,以及其在不同任务和文本变形级别(字符、词和句子)上的鲁棒性.研究结果表明,GPT模型虽然在情感分析、语义匹配等分类任务和阅读理解任务中表现出良好的性能,但其处理信息抽取任务的能力仍较为欠缺,比如其对关系抽取任务中各种关系类型存在严重混淆,甚至出现“幻觉”现象.在鲁棒性评估实验中,GPT模型在任务层面和变形层面的鲁棒性都较弱,其中,在分类任务和句子级别的变形中鲁棒性缺乏更为显著.此外,探究了模型迭代过程中性能和鲁棒性的变化,以及提示中的演示数量和演示内容对模型性能和鲁棒性的影响.结果表明,随着模型的迭代以及上下文学习的加入,模型的性能稳步提升,但是鲁棒性依然亟待提升.这些发现从任务类型、变形种类、提示内容等方面揭示了GPT模型还无法完全胜任常见的NLP任务,并且模型存在的鲁棒性问题难以通过提升模型性能或改变提示内容等方式解决.通过对gpt-3.5-turbo的更新版本、gpt-4模型,以及开源模型LLaMA2-7B和LLaMA2-13B的性能和鲁棒性表现进行对比,进一步验证了实验结论.鉴于此,未来的大模型研究应当提升模型在信息提取以及语义理解等方面的能力,并且应当在模型训练或微调阶段考虑提升其鲁棒性. 展开更多
关键词 鲁棒性 GPT模型 大语言模型 自然语言处理 可靠性
在线阅读 下载PDF
从《儿女英雄传》看一百四十年来常州话的演变
3
作者 黄河 郑子宁 《语言科学》 CSSCI 北大核心 2024年第5期524-534,共11页
文章分析了晚清小说《儿女英雄传》中的北京话和常州话的对音材料,并结合93个常州地区方言点的共时调查材料,拟测一百四十年前的常州话的面貌。然后和赵元任于1928年记载的常州话比较,梳理了1878年至1928年五十年间发生的诸多音韵变化,... 文章分析了晚清小说《儿女英雄传》中的北京话和常州话的对音材料,并结合93个常州地区方言点的共时调查材料,拟测一百四十年前的常州话的面貌。然后和赵元任于1928年记载的常州话比较,梳理了1878年至1928年五十年间发生的诸多音韵变化,并给出解释。通过本个案研究,文章揭示了明清小说中的方言语料对方言研究的重要性,同时强调把文献材料和共时调查得到的方言地理材料结合,对研究方言的区域性演变具有重要意义。 展开更多
关键词 常州话 《儿女英雄传》 古方言拟测 方言地理 历时演变
在线阅读 下载PDF
音类的音征与语音演变 被引量:5
4
作者 陈忠敏 《语言科学》 CSSCI 北大核心 2022年第6期561-579,共19页
本文提出音征概念和定义,认为音征是音类(音段)的下位单位。音征的提出是语音研究的深入,对于音变有很强的解释力,增加音征这一单位可以避免音段或音类命名的分歧。本文提出音征的多种分类视角和维度,用音征的变化来讨论卷舌音的音变问... 本文提出音征概念和定义,认为音征是音类(音段)的下位单位。音征的提出是语音研究的深入,对于音变有很强的解释力,增加音征这一单位可以避免音段或音类命名的分歧。本文提出音征的多种分类视角和维度,用音征的变化来讨论卷舌音的音变问题、浊辅音清化的进程,以及声调产生的机制。音征可以独立自主转移到邻近音段,使得邻近音段的性质发生变化。本文还提出音变是渐变的观点,音变肇始于音征的渐变,因此言语交际在几代人之间是连续性的、无障碍的。 展开更多
关键词 音征 主要音征 次要音征 内质音征 外依音征 气嗓音 正常发声
在线阅读 下载PDF
汉语方言u韵母前裂化音变的蕴含共性及初步解释
5
作者 施瑞峰 盛益民 《语言科学》 CSSCI 北大核心 2022年第5期467-482,共16页
从音变类型学的视角看,汉语方言中以*u为音变起点的中古模韵字,在不同声母后发生前裂化音变的难易程度,存在+P/+K<+T<+Ts<+n<+1这一等级序列。其中,+Grave<+Acute这一蕴含共性,可以从发音动作或者声学特征的角度找到合... 从音变类型学的视角看,汉语方言中以*u为音变起点的中古模韵字,在不同声母后发生前裂化音变的难易程度,存在+P/+K<+T<+Ts<+n<+1这一等级序列。其中,+Grave<+Acute这一蕴含共性,可以从发音动作或者声学特征的角度找到合理的解释。 展开更多
关键词 模韵 u韵母 前裂化 蕴含共性 语音学解释
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部