期刊文献+
共找到2,396篇文章
< 1 2 120 >
每页显示 20 50 100
自然语言处理的深度学习模型综述 被引量:3
1
作者 何雪锋 周洁 +1 位作者 陈德光 廖海 《计算机应用与软件》 北大核心 2025年第2期1-19,101,共20页
模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类... 模型作为自然语言处理的关键,直接关系到最终性能。该文介绍自然语言处理中涉及到的模型。按照规则与统计的方法从发布时间、特点、优缺点与适用范围等方面对传统自然语言处理模型进行介绍;重点将神经网络依据不同的技术划分为不同的类型,对每种类型进行介绍并总结其相应特性;对以BERT为基础的两大类改进模型进行具体介绍并对每种模型进行归纳;分析目前自然语言处理模型面临的挑战与对应的解决办法;对未来工作进行展望。 展开更多
关键词 自然语言处理 语言模型 人工智能
在线阅读 下载PDF
面向舆论情感识别的自然语言处理技术
2
作者 王敏 汪旭 《现代电子技术》 北大核心 2025年第12期115-119,共5页
为提高舆情风险预测的准确性和效率,提出一种基于注意力机制与双向长短期记忆(BiLSTM)网络相结合的舆情感知模型。该方法通过结合BiLSTM的双向建模能力与注意力机制的特征聚焦能力,精准捕捉舆论数据中的情感波动和上下文语义特征,从而... 为提高舆情风险预测的准确性和效率,提出一种基于注意力机制与双向长短期记忆(BiLSTM)网络相结合的舆情感知模型。该方法通过结合BiLSTM的双向建模能力与注意力机制的特征聚焦能力,精准捕捉舆论数据中的情感波动和上下文语义特征,从而提升舆情风险的预测精度。同时以“高考冒名顶替”事件为样本,展开网络舆论数据分析。通过与ELM、随机森林、决策树、LSTM、BiGRU和BiLSTM等多种主流算法进行对比实验,验证所提模型的有效性和优越性。在算法设计中,注意力机制的引入有效地提升了模型在长文本情感分类中的表现,能够精确捕捉情感变化的关键节点。实验结果表明,所提出的预测模型能够有效地识别出舆情风险,准确率达到94.87%,相比于表现最优的BiGRU算法提高了约5.75%。 展开更多
关键词 舆情风险预测 情感识别 自然语言处理 双向长短期记忆网络 注意力机制 文本分类
在线阅读 下载PDF
大模型时代下的汉语自然语言处理研究与探索 被引量:5
3
作者 黄施洋 奚雪峰 崔志明 《计算机工程与应用》 北大核心 2025年第1期80-97,共18页
自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然... 自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然而,相较于英语大模型,汉语大模型在逻辑推理和文本理解能力方面仍存在不足。介绍了图神经网络在特定CNLP任务中的优势,进行了量子机器学习在CNLP发展潜力的调查。总结了大模型的基本原理和技术架构,详细整理了大模型评测任务的典型数据集和模型评价指标,评估比较了当前主流的大模型在CNLP任务中的效果。分析了当前CNLP存在的挑战,并对CNLP任务的未来研究方向进行了展望,希望能帮助解决当前CNLP存在的挑战,同时为新方法的提出提供了一定的参考。 展开更多
关键词 汉语自然语言处理 图神经网络 量子机器学习 汉语大模型
在线阅读 下载PDF
基于自然语言处理(NLP)的生态环境准入清单政策内容分析 被引量:2
4
作者 魏泽洋 汪自书 +3 位作者 宫曼莉 谢丹 杨洋 刘毅 《环境工程技术学报》 北大核心 2025年第1期1-10,共10页
生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入... 生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入清单管控的对象、方式与力度是支撑生态环境分区管控政策实施的重要基础。本研究基于自然语言机器无监督学习技术对生态环境准入清单进行政策词汇模式挖掘并对政策文本设定多维定量化标签,应用自然语言深度学习模型对生态环境准入清单管控措施进行文本分类评估。河北省是我国产业门类最齐全、资源环境问题最复杂的省份之一,其生态环境准入管控具有典型性和代表性。以河北省生态环境准入清单的产业管控措施为例,识别了10类政策关键词特征、64项主要政策关键词,对全清单中对应关键词所在的语句覆盖率达95%;构造了24个管控措施-行业的分类标签,应用并比较了BERT、RoBERTa和ALBERT深度学习模型对政策文本的分类识别效果,预测精度、召回率和F1得分最高分别可达到0.95、0.79和0.86,训练模型可较好地识别准入清单政策内容。结果显示河北省准入清单在管控措施明确化、具体化、定量化方面仍存在不足,产业精细化管控、考核指标型以及时限型内容有待补充和细化。本研究提出的方法具有较好的适用前景,建议在此基础上结合前沿人工智能方法,进一步提高模型自动处理效率、动态分析以及提供精细化政策调整建议的能力。 展开更多
关键词 生态环境分区管控 生态环境准入清单 政策文本 自然语言处理(NLP)
在线阅读 下载PDF
基于用户生成数据与自然语言处理的园林植物感知偏好研究——以武汉城市公园为例
5
作者 苏畅 陈一秀 +1 位作者 殷利华 郭诗怡 《中国园林》 北大核心 2025年第1期125-132,共8页
城市公园是城市空间的重要部分,在生态、社会和经济等方面至关重要。园林植物作为主要物质空间要素,对公众身心健康有着积极的恢复和促进作用。但基于公众视角与用户生成数据对园林植物感知行为及偏好特征的深入研究较少。以武汉城市公... 城市公园是城市空间的重要部分,在生态、社会和经济等方面至关重要。园林植物作为主要物质空间要素,对公众身心健康有着积极的恢复和促进作用。但基于公众视角与用户生成数据对园林植物感知行为及偏好特征的深入研究较少。以武汉城市公园为对象,按照社交媒体平台优先推荐植物观赏类城市公园的原则筛选,挖掘并解译用户生成数据,借助自然语言处理算法揭示公众对园林植物的感知偏好特征及影响因素。研究表明,公众对植物的感知主要集中在植物种类、季相和植物印象3个方面。其中植物种类感知与季相、感官呈显著正相关,与公园情感得分呈负相关。平台推荐引导的植物感知重点和公众评论中的实际感知基本一致。最后,依据分析结果提出公园季相、观赏错峰、观赏种类创新、观赏植物科教4个方面的植物景观优化建议,为城市公园的园林植物配置优化、公众感知友好型城市公园规划设计等提供研究实证参考。 展开更多
关键词 园林植物 风景园林 城市公园 用户生成数据 自然语言处理 景观感知
在线阅读 下载PDF
基于自然语言处理的施工安全需求信息提取
6
作者 吴志江 刘梦瑶 马国丰 《中国安全科学学报》 北大核心 2025年第6期51-59,共9页
为解决潜藏在项目文档中的施工安全需求信息因欠缺关联性、语义模糊而难以被发掘的问题,开发一种结合自然语言处理(NLP)技术的2阶段集成框架,用于项目文档分析并进行需求信息的分类提取。首先,结合NLP的多元技术获取待评估工程的安全目... 为解决潜藏在项目文档中的施工安全需求信息因欠缺关联性、语义模糊而难以被发掘的问题,开发一种结合自然语言处理(NLP)技术的2阶段集成框架,用于项目文档分析并进行需求信息的分类提取。首先,结合NLP的多元技术获取待评估工程的安全目标,并基于主题模型建立关联模型以推荐合适的施工安全需求类型;然后,考虑3类要素的语义特征,分别采用关键词分析、情感分析以及依存关系分析对3类要素进行提取;最后,以2类建筑工程(民用和工业建筑)为例,开展施工安全需求的分类提取测试。结果表明:2阶段集成框架分别为民用建筑和工业建筑推荐到4种合适的需求类型,结合词性和词汇情感色彩能够有效提取到需求关键词和行为观点词,并且主体要素在补充建筑类型说明后的提取精度可达到88.6%;测试结果证实响应安全目标特征能够从繁杂的施工安全需求信息中推荐出适宜类型,而结合自然语言处理的需求信息分类提取可以避免主观偏好以提高信息提取精度。 展开更多
关键词 自然语言处理(NLP) 施工安全需求 需求信息 项目文档 需求类型
在线阅读 下载PDF
基于自然语言处理的郊野公园景观多维感知研究——以上海7个郊野公园为例
7
作者 俞丽娜 张璇 李健 《园林》 2025年第5期80-89,共10页
郊野公园在提供居民自然野趣环境的同时,赋予居民丰富多元的感官感知体验。以上海市7个郊野公园为研究对象,运用Word2Vec词向量模型和情感倾向分析识别景观元素与感官感知并计算情感值,通过对应分析将郊野公园、景观元素和感官感知联系... 郊野公园在提供居民自然野趣环境的同时,赋予居民丰富多元的感官感知体验。以上海市7个郊野公园为研究对象,运用Word2Vec词向量模型和情感倾向分析识别景观元素与感官感知并计算情感值,通过对应分析将郊野公园、景观元素和感官感知联系起来,探究景观的整体多维感知特征,并进行不同郊野公园的优势感官维度差异性分析。结果表明:在14种景观元素和5种感官维度中,访客对植物景观和视觉感知的感知程度最高;视觉与植物关联最紧密,听嗅感知来源于植物、动物和气象景观,触觉与动物、气象和设施类景观关联,味觉相对独立;7个郊野公园在5种感官维度上各有相对优势,访客对各郊野公园景观的优势感官感知与偏好存在明显的月际变化差异。以提高公园优势感官满意度、提升访客感知丰富度、打造四时景观为目标,提出郊野公园景观优化建议。 展开更多
关键词 景观感知 多维感知 自然语言处理 郊野公园 上海市
在线阅读 下载PDF
自然语言处理在失语症康复中的应用研究进展
8
作者 崔友名 姜晓睿 +1 位作者 陈怡帆(综述) 王大明(审校) 《医学研究与战创伤救治》 北大核心 2025年第3期327-331,共5页
失语症是大脑损伤导致的语言障碍,多由脑卒中引起。失语症患者在语言的所有方面均可能产生功能障碍,导致生活质量下降。自然语言处理(NLP)将计算语言学(基于规则的人类语言建模)与统计和机器学习模型相结合,使计算机和数字设备能够识别... 失语症是大脑损伤导致的语言障碍,多由脑卒中引起。失语症患者在语言的所有方面均可能产生功能障碍,导致生活质量下降。自然语言处理(NLP)将计算语言学(基于规则的人类语言建模)与统计和机器学习模型相结合,使计算机和数字设备能够识别、理解和生成文本和语音。因此,使用NLP来提供新的失语症康复评定及治疗方案是目前该康复领域的研究热点。文章主要就目前NLP在失语症康复过程的语言学基础、康复评估、康复治疗等方面的最新研究进展进行综述。 展开更多
关键词 自然语言处理 失语症 语言障碍 康复
在线阅读 下载PDF
YSSNLP2025注册开放|第二十二届自然语言处理青年学者研讨会全日程公开
9
作者 《中文信息学报》 北大核心 2025年第5期90-90,共1页
一年一度的自然语言处理青年学者研讨会即将召开。自2004年创立以来,自然语言处理青年学者研讨会(YSSNLP)已成为国内NLP领域产学融合的重要盛会之一,旨在促进NLP领域国内外青年学者间的学术互动,加强研究人员与企业界、政府相关部门的... 一年一度的自然语言处理青年学者研讨会即将召开。自2004年创立以来,自然语言处理青年学者研讨会(YSSNLP)已成为国内NLP领域产学融合的重要盛会之一,旨在促进NLP领域国内外青年学者间的学术互动,加强研究人员与企业界、政府相关部门的交流对话,共同促进整个NLP产业的繁荣发展。 展开更多
关键词 青年学者研讨会 自然语言处理 YSSNLP
在线阅读 下载PDF
基于自然语言处理的航行通告风险识别方法
10
作者 瞿也丰 辜汝桐 +2 位作者 黄文强 陈东玲 邓李明 《中国安全科学学报》 北大核心 2025年第S1期33-39,共7页
为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告... 为实现海量航行通告文本数据的高效精准风险识别,满足现代航班运行对航行通告风险解析的需求,提升民航领域风险识别能力,提出一种融合知识增强的语义表示(ERNIE)模型、卷积神经网络(CNN)以及双向长短期记忆神经网络(BiLSTM)的航行通告风险识别模型;借助ERNIE模型进行词向量的训练,利用CNN捕捉文本局部结构的特性,并结合BiLSTM理解文本的深层次上下文关联;并开展对比试验进行验证。结果表明:相较于其他同类模型,该方法对国内中文和国际英文航行通告的识别精度分别高达92.01%和93.85%。该成果可以为航空公司在航行情报的风险解析和安全管理提供一定的数据支撑。 展开更多
关键词 自然语言处理(NLP) 航行通告 风险识别 知识增强的语义表示(ERNIE) 卷积神经网络(CNN) 双向长短期记忆网络(BiLSTM)
在线阅读 下载PDF
自然语言处理在高等教育研究中的应用
11
作者 高媛 王雪纯 刘绪 《复旦教育论坛》 北大核心 2025年第1期5-15,共11页
作为以语言为研究对象的计算技术集合,自然语言处理技术凭借其在处理大规模文本信息、实现文本自动分类、自动化标签提取等领域的强大功能,正日益受到人文社科研究人员的关注。高等教育研究需要从庞大复杂的知识库中提取和分析数据,不... 作为以语言为研究对象的计算技术集合,自然语言处理技术凭借其在处理大规模文本信息、实现文本自动分类、自动化标签提取等领域的强大功能,正日益受到人文社科研究人员的关注。高等教育研究需要从庞大复杂的知识库中提取和分析数据,不断审视已有知识和知识生产过程。充分发挥自然语言处理技术的优势,可以优化高等教育研究。本文梳理了自然语言处理技术在文本分析中的应用和相关前沿研究,分析了自然语言处理技术如何助力高等教育研究的问题,指出了自然语言处理技术在高等教育研究领域的应用方向。研究指出,既有融合自然语言处理技术的高等教育研究,在数据分析深入程度、准确性及结果可靠性等方面表现出色。自然语言处理技术对提高高等教育研究效率、深化研究主题、拓展理论与实践边界、构建自主知识体系,具有重要意义和价值。 展开更多
关键词 知识生产 自然语言处理 高等教育研究 应用 价值
在线阅读 下载PDF
基于YOLO和自然语言处理的施工方案智能审核方法
12
作者 钱增志 孙玉龙 +3 位作者 张捷 夏侯遐迩 周大兴 康伟德 《图学学报》 北大核心 2025年第5期1113-1122,共10页
建筑施工方案的人工审核存在重复性高、耗时费力且占用专家资源等问题。为提升审核效率,促进企业智能建造发展,提出一种施工方案智能审核方法,通过审核规则编制、向量模型构建及图像文字识别技术结合,实现多类型方案智能审核。审核规则... 建筑施工方案的人工审核存在重复性高、耗时费力且占用专家资源等问题。为提升审核效率,促进企业智能建造发展,提出一种施工方案智能审核方法,通过审核规则编制、向量模型构建及图像文字识别技术结合,实现多类型方案智能审核。审核规则基于集团技术文件和历史审核意见样本,经历史高频审核意见筛选与专家研判后,采用正则表达式技术进行逐条编制。研究构建了基于语义相似度比对的审核模式,将方案文本内容嵌入向量空间,通过计算向量余弦相似度实现语义比对,从而提升审核灵活性与容错性。同时,引入基于YOLO的图像文字识别技术,处理文档图片中的文字内容,确保审核全覆盖。实验结果显示,系统平均审核准确率达90.4%,审核时间效率较人工提升87.9%,且能处理多种格式文本输入,具备良好鲁棒性,显著提高审核工作效率,对企业数字化转型与智能建造技术普及具有重要推动作用。目前,搭载此审核技术的平台已在集团多家分公司与项目应用测试,能生成准确的审核报告,实现审核效率显著提升。 展开更多
关键词 施工方案 智能审核 自然语言处理 语义相似度 图像文字识别
在线阅读 下载PDF
《自然语言处理:基于大语言模型的方法》
13
《中文信息学报》 北大核心 2025年第2期F0003-F0003,共1页
车万翔郭江崔一鸣著刘挺主审推荐人孙茂松清华大学人工智能研究院常务副院长廖湘科中国工程院院士,国防科学技术大学计算机学院教授尼玛扎西中国工程院院士,西藏大学信息科学技术学院教授李惠中国科学院院士,哈尔滨工业大学土木学院/计... 车万翔郭江崔一鸣著刘挺主审推荐人孙茂松清华大学人工智能研究院常务副院长廖湘科中国工程院院士,国防科学技术大学计算机学院教授尼玛扎西中国工程院院士,西藏大学信息科学技术学院教授李惠中国科学院院士,哈尔滨工业大学土木学院/计算学部教授2025年1月,DeepSeek(深度求索)公司开源的DeepSeek-R1模型引发全球关注——其通过纯强化学习架构创新实现的自主推理能力,在数学、代码及自然语言推理任务中性能比肩OpenAI o1模型,被《自然》杂志评价为“具有科研应用潜力的类人推理突破”。 展开更多
关键词 中国工程院院士 中国科学院院士 自然语言处理 西藏大学 语言模型 推荐人 人工智能 强化学习
在线阅读 下载PDF
基于自然语言处理的昆明市4A级风景区生态系统文化服务感知研究
14
作者 张媛媛 潘瑞 +1 位作者 陈嘉艺 王鹏伟 《广东园林》 2025年第1期73-80,共8页
风景区的生态系统文化服务(Cultural ecosystem services,CES)对促进生态环境保护、提升人类福祉具有重要作用,但由于其主观性和无形性的特征,难以对其进行客观量化研究。以昆明市的西山风景区、大观公园、翠湖公园、金殿名胜区为研究对... 风景区的生态系统文化服务(Cultural ecosystem services,CES)对促进生态环境保护、提升人类福祉具有重要作用,但由于其主观性和无形性的特征,难以对其进行客观量化研究。以昆明市的西山风景区、大观公园、翠湖公园、金殿名胜区为研究对象,获取社交媒体评论文本数据,运用自然语言处理技术构建CES感知框架,并结合社会网络分析法、百度AI情感倾向分析工具及重要性-满意度分析法,探讨游客对风景区CES的感知情况。结果表明:风景区的CES可分为6种,游客更易感知历史文化与基础设施,对其重视度和满意度较高;对社交互动的感知较少,重视度高但满意度较低;对休闲娱乐的感知程度、重视度及满意度均较低。此外,翠湖公园与大观公园CES感知高度相似,而西山风景区和金殿名胜区各具独特性。基于研究结果,提出强化历史文化传承与品牌建设、推进智慧风景区数字化建设、多感官视角优化审美与自然体验、基于承载力提升休闲娱乐品质4项策略。 展开更多
关键词 生态系统文化服务 风景区 文本挖掘 自然语言处理 IPA 感知评价
在线阅读 下载PDF
自然语言处理领域中的词嵌入方法综述 被引量:21
15
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 词向量 词嵌入方法 自然语言处理 语言模型 分词 词向量评估
在线阅读 下载PDF
GPT系列大语言模型在自然语言处理任务中的鲁棒性 被引量:17
16
作者 陈炫婷 叶俊杰 +3 位作者 祖璨 许诺 桂韬 张奇 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1128-1142,共15页
大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤... 大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤为重要.因此,使用涵盖了9个常见NLP任务的15个数据集(约147000个原始测试样本)和来自TextFlint的61种鲁棒的文本变形方法分析GPT-3和GPT-3.5系列模型在原始数据集上的性能,以及其在不同任务和文本变形级别(字符、词和句子)上的鲁棒性.研究结果表明,GPT模型虽然在情感分析、语义匹配等分类任务和阅读理解任务中表现出良好的性能,但其处理信息抽取任务的能力仍较为欠缺,比如其对关系抽取任务中各种关系类型存在严重混淆,甚至出现“幻觉”现象.在鲁棒性评估实验中,GPT模型在任务层面和变形层面的鲁棒性都较弱,其中,在分类任务和句子级别的变形中鲁棒性缺乏更为显著.此外,探究了模型迭代过程中性能和鲁棒性的变化,以及提示中的演示数量和演示内容对模型性能和鲁棒性的影响.结果表明,随着模型的迭代以及上下文学习的加入,模型的性能稳步提升,但是鲁棒性依然亟待提升.这些发现从任务类型、变形种类、提示内容等方面揭示了GPT模型还无法完全胜任常见的NLP任务,并且模型存在的鲁棒性问题难以通过提升模型性能或改变提示内容等方式解决.通过对gpt-3.5-turbo的更新版本、gpt-4模型,以及开源模型LLaMA2-7B和LLaMA2-13B的性能和鲁棒性表现进行对比,进一步验证了实验结论.鉴于此,未来的大模型研究应当提升模型在信息提取以及语义理解等方面的能力,并且应当在模型训练或微调阶段考虑提升其鲁棒性. 展开更多
关键词 鲁棒性 GPT模型 语言模型 自然语言处理 可靠性
在线阅读 下载PDF
基于深度学习的自然语言处理鲁棒性研究综述 被引量:20
17
作者 桂韬 奚志恒 +5 位作者 郑锐 刘勤 马若恬 伍婷 包容 张奇 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期90-112,共23页
近年来,基于深度神经网络的模型在几乎所有自然语言处理任务上都取得了非常好的效果,在很多任务上甚至超越了人类.展现了极强能力的大规模语言模型也为自然语言处理模型的发展与落地提供了新的机遇和方向.然而,这些在基准测试集合上取... 近年来,基于深度神经网络的模型在几乎所有自然语言处理任务上都取得了非常好的效果,在很多任务上甚至超越了人类.展现了极强能力的大规模语言模型也为自然语言处理模型的发展与落地提供了新的机遇和方向.然而,这些在基准测试集合上取得很好结果的模型在实际应用中的效果却经常大打折扣.近期的一些研究还发现,在测试数据上替换一个相似词语、增加一个标点符号,甚至只是修改一个字母都可能使得这些模型的预测结果发生改变,效果大幅度下降.即使是大型语言模型,也会因输入中的微小扰动而改变其预测结果.什么原因导致了这种现象的发生?深度神经网络模型真的如此脆弱吗?如何才能避免这种问题的出现?这些问题近年来受到了越来越多的关注,诸多有影响力的工作都不约而同地从不同方面讨论了自然语言处理的鲁棒性问题.在本文中,我们从自然语言处理任务的典型范式出发,从数据构建、模型表示、对抗攻防以及评估评价等四个方面对自然语言处理鲁棒性相关研究进行了总结和归纳,并对最新进展进行了介绍,最后探讨了未来的可能研究方向以及我们对自然语言处理鲁棒性问题的一些思考. 展开更多
关键词 自然语言处理 鲁棒性 深度学习 预训练语言模型 对抗攻防
在线阅读 下载PDF
面向国产深度学习平台的自然语言处理模型迁移研究 被引量:7
18
作者 葛慧斌 王德鑫 +2 位作者 郑涛 张婷 熊德意 《计算机科学》 CSCD 北大核心 2024年第1期50-59,共10页
深度学习平台在新一代人工智能的发展中扮演着重要的角色。近年来,以昇腾平台为代表的国产人工智能软硬件系统快速发展,为国产深度学习平台的发展开辟出了新的道路。与此同时,为了发现并解决昇腾系统存在的潜在漏洞,昇腾平台积极开展常... 深度学习平台在新一代人工智能的发展中扮演着重要的角色。近年来,以昇腾平台为代表的国产人工智能软硬件系统快速发展,为国产深度学习平台的发展开辟出了新的道路。与此同时,为了发现并解决昇腾系统存在的潜在漏洞,昇腾平台积极开展常用深度学习模型的迁移工作。从自然语言处理算法角度切入,针对机器阅读理解、神经机器翻译、序列标注和文本分类四大自然语言处理任务,以昇腾平台的高性能硬件芯片为基础,探究迁移ALBERT,RNNSearch,BERT-CRF和TextING这4类典型的自然语言处理模型。基于以上迁移研究,发现和整理了昇腾平台架构设计在自然语言处理研究与业务上的主要不足,即计算图节点动态空间的分配特性、资源算子下沉设备侧、图算融合以及混合精度训练4个方面的问题,并为以上问题提出了相应的解决方案,并进行了实验验证。最后,为国产深度学习平台的发展提出未来优化的方向和相关建议。 展开更多
关键词 自然语言处理 昇腾 深度学习 模型迁移 平台构架
在线阅读 下载PDF
什么类型的机构合作会产生更高的学术影响力?--以自然语言处理领域为例 被引量:4
19
作者 杨裕楷 赵毅 章成志 《图书馆论坛》 CSSCI 北大核心 2024年第5期40-53,共14页
研究特定领域中机构合作类型与学术影响力之间的关系,能深入了解不同合作类型所产生的学术影响力差异,以识别出哪种类型的合作可能更具生产力或效率。文章以自然语言处理(NLP)领域为例探究机构合作类型与学术影响力之间的关系。通过与... 研究特定领域中机构合作类型与学术影响力之间的关系,能深入了解不同合作类型所产生的学术影响力差异,以识别出哪种类型的合作可能更具生产力或效率。文章以自然语言处理(NLP)领域为例探究机构合作类型与学术影响力之间的关系。通过与工业界进行合作,可以将学术界的研究成果转化为实际应用,但不同合作模式对合作效果的影响有所不同,因此文章研究不同类型的机构合作与学术影响力之间的关系,从而帮助机构更好地规划合作策略,提高合作效果。首先,将机构分为学术界机构和工业界机构;然后,将合作类型分为学术界机构间合作、学术界机构内合作、学术界与工业界机构间合作、工业界机构间合作和工业界机构内合作;最后,从谷歌学术获取5种合作类型发表的论文被引频次信息,同时定义高被引论文,采用这两个指标衡量学术影响力,并将论文归属到NLP领域不同任务,发现学术界与工业界的机构间合作往往能产生更大的学术影响力,且在不同任务中学术影响力最高的机构合作类型存在差异。 展开更多
关键词 科学合作 机构合作类型 合作绩效 自然语言处理
在线阅读 下载PDF
自然语言处理中的探针可解释方法综述 被引量:9
20
作者 鞠天杰 刘功申 +1 位作者 张倬胜 张茹 《计算机学报》 EI CAS CSCD 北大核心 2024年第4期733-758,共26页
随着大规模预训练模型的广泛应用,自然语言处理的多个领域(如文本分类和机器翻译)取得了长足的发展.然而,受限于预训练模型的“黑盒”特性,其内部的决策模式以及编码的知识信息被认为是不透明的.以Open AI发布的Chat GPT和GPT-4为代表... 随着大规模预训练模型的广泛应用,自然语言处理的多个领域(如文本分类和机器翻译)取得了长足的发展.然而,受限于预训练模型的“黑盒”特性,其内部的决策模式以及编码的知识信息被认为是不透明的.以Open AI发布的Chat GPT和GPT-4为代表的先进预训练模型为例,它们在多个领域取得重大性能突破的同时,由于无法获知其内部是否真正编码了人们期望的知识或语言属性,以及是否潜藏一些不期望的歧视或偏见,因此仍然无法将其应用于重视安全性和公平性的领域.近年来,一种新颖的可解释性方法“探针任务”有望提升人们对预训练模型各层编码的语言属性的理解.探针任务通过在模型的某一区域训练辅助语言任务,来检验该区域是否编码了感兴趣的语言属性.例如,现有研究通过冻结模型参数并在不同层训练探针任务,已经证明预训练模型在低层编码了更多词性属性而在高层编码了更多语义属性,但由于预训练数据的毒性,很有可能在参数中编码了大量有害内容.该文首先介绍了探针任务的基本框架,包括任务的定义和基本流程;然后对自然语言处理中现有的探针任务方法进行了系统性的归纳与总结,包括最常用的诊断分类器以及由此衍生出的其他探针方法,为读者提供设计合理探针任务的思路;接着从对比和控制的角度介绍如何解释探针任务的实验结果,以说明探测位置编码感兴趣属性的程度;最后对探针任务的主要应用和未来的关键研究方向进行展望,并讨论了当前探针任务亟待解决的问题与挑战. 展开更多
关键词 探针任务 可解释 自然语言处理 预训练模型 深度学习 人工智能安全
在线阅读 下载PDF
上一页 1 2 120 下一页 到第
使用帮助 返回顶部