期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
大语言模型综述与展望 被引量:11
1
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
DeepCom-GCN:融入控制流结构信息的代码注释生成模型
2
作者 钟茂生 刘会珠 +1 位作者 匡江玲 严婷 《江西师范大学学报(自然科学版)》 北大核心 2025年第1期27-36,共10页
代码注释生成是指给定一个代码片段,通过模型自动生成一段关于代码片段功能的概括性自然语言描述.不同于自然语言,程序语言具有复杂语法和强结构性.部分研究工作只利用了源代码的序列信息或抽象语法树信息,未能充分利用源代码的逻辑结... 代码注释生成是指给定一个代码片段,通过模型自动生成一段关于代码片段功能的概括性自然语言描述.不同于自然语言,程序语言具有复杂语法和强结构性.部分研究工作只利用了源代码的序列信息或抽象语法树信息,未能充分利用源代码的逻辑结构信息.针对这一问题,该文提出一种融入程序控制流结构信息的代码注释生成方法,将源代码序列和结构信息作为单独的输入进行处理,允许模型学习代码的语义和结构.在2个公开数据集上进行验证,实验结果表明:和其他基线方法相比,DeepCom-GCN在BLEU-4、METEOR和ROUGE-L指标上的性能分别提升了2.79%、1.67%和1.21%,验证了该方法的有效性. 展开更多
关键词 代码注释生成 抽象语法树 控制流图 图卷积神经网络 软件工程 程序理解 自然语言处理
在线阅读 下载PDF
基于大语言模型的智能问答系统研究综述 被引量:19
3
作者 任海玉 刘建平 +4 位作者 王健 顾勋勋 陈曦 张越 赵昌顼 《计算机工程与应用》 北大核心 2025年第7期1-24,共24页
智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥... 智能问答是自然语言处理中的一个核心的子领域,旨在理解并回答用户提出的自然语言问题的系统。传统的问答系统通常依赖于预定义的规则和有限的语料库,无法处理复杂的多轮对话。大语言模型是一种基于深度学习技术的自然语言处理模型,拥有数十亿甚至上千亿个参数,不仅能够理解和生成自然语言,还能显著提升问答系统的准确性和效率,推动智能问答技术的发展。近年来,基于大模型技术的智能问答逐渐成为研究热点,但对该领域的系统性综述仍然较为欠缺。因此,针对大模型的智能问答系统进行系统综述,介绍了问答系统的基本概念和数据集及其评价指标;介绍了基于大模型的问答系统,其中包括基于提示学习的问答系统、基于知识图谱的问答系统、基于检索增强生成的问答系统和基于智能代理的问答系统以及微调在问答任务中的技术路线,并对比了五种方法在问答系统中的优缺点和应用场景;对于当前基于大语言模型的问答系统面临的研究挑战和未来发展趋势进行了总结。 展开更多
关键词 大语言模型 智能问答 自然语言处理 检索增强生成 提示学习 知识图谱
在线阅读 下载PDF
大语言模型在土木工程领域中的研究现状、挑战及趋势
4
作者 许娜 陈曦 +2 位作者 杨建平 张博 陈伟 《科学技术与工程》 北大核心 2025年第21期8773-8783,共11页
土木工程行业在信息化转型中面临着大量的非结构化的文本信息,大语言模型(large language models,LLMs)由于其强大的自然语言处理能力,为行业领域的智能化变革提供了新的机遇。采用系统性文献回顾的方法,在梳理LLMs的技术架构及在垂直... 土木工程行业在信息化转型中面临着大量的非结构化的文本信息,大语言模型(large language models,LLMs)由于其强大的自然语言处理能力,为行业领域的智能化变革提供了新的机遇。采用系统性文献回顾的方法,在梳理LLMs的技术架构及在垂直领域研究现状的基础上,提出了LLMs在土木工程领域的四大应用场景及技术路线、面临的挑战及研究趋势。研究发现,LLMs已在土木工程领域有探索性的研究与应用,目前主要集中在内容生成类、智能问答类、文本摘要类及分析推理类四大应用场景,覆盖土木工程项目全生命周期阶段,并具有跨学科、跨模态融合的特性。然而,LLMs的应用仍面临知识专业性低、信息时效性差、数据质量及交互性低等挑战。基于此,提出了一系列未来研究机遇,在模型优化方面,利用参数高效微调技术注入专业知识,增强LLMs在土木工程领域应用的广度和深度;与知识图谱结合,提升LLMs在回答中的精准性、可解释性与时效性;融合多模态的数据类型,扩展LLMs在土木工程领域的应用场景;开发适用的模型评估方法,量化LLMs在土木工程领域应用的价值及性能表现。在应用场景方面,结合LLMs和土木工程领域特点,可以拓展LLMs在文档生成、问答系统、信息抽取、合规性审查等复杂任务中的应用,提高从业者与数据间的交互效率。研究旨在为学术界和企业界进一步将LLMs应用于土木工程领域提供借鉴与参考。 展开更多
关键词 土木工程 大语言模型 自然语言生成 生成式人工智能
在线阅读 下载PDF
突破与隐忧:AIGC在档案领域的应用展望 被引量:2
5
作者 祝洁 《档案管理》 北大核心 2025年第2期8-12,共5页
以ChatGPT为代表的生成式人工智能应用的出现与广泛应用,为档案领域提供了新的发展思路。文章在剖析人工智能生成内容(AIGC)概念、内涵与技术特征的基础上,结合其智能数字内容孪生、编辑和创作三大功能,探讨AIGC嵌入档案收集、管理、保... 以ChatGPT为代表的生成式人工智能应用的出现与广泛应用,为档案领域提供了新的发展思路。文章在剖析人工智能生成内容(AIGC)概念、内涵与技术特征的基础上,结合其智能数字内容孪生、编辑和创作三大功能,探讨AIGC嵌入档案收集、管理、保护和开发利用等领域的场景化应用,思考可能面临的法律、内容和伦理等潜在风险,从法律、机制、伦理、技术等方面提出规避策略。 展开更多
关键词 人工智能生成内容 档案管理 应用场景 自然语言处理 个性化定制 跨模态 认知交互 机器伦理
在线阅读 下载PDF
文本风格迁移综述
6
作者 刘浦胜 吴连伟 +2 位作者 饶元 高超 王震 《中文信息学报》 北大核心 2025年第4期1-29,共29页
近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑... 近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑战,从应用场景、目的需求两个视角详细阐述了该领域四大类型任务,并从数据来源、标签及数据规模三方面介绍了该领域常用平行数据集及非平行数据集。此外,该文从数据增强、词汇约束解码、解纠缠、非解缠、交叉投影、伪平行语料、其他特殊策略等七个层面对现有研究方法进行了对比并重点分析了各类方法的实现机制、优缺点及其性能,随后从风格迁移准确率、内容保留度及语言困惑度三个视角归纳了文本风格迁移领域的评价指标并剖析了其评价实现原理。最后,该文展望了文本风格迁移领域的未来发展趋势并进行了总结。 展开更多
关键词 文本风格迁移 可控文本生成 自然语言生成
在线阅读 下载PDF
基于可控性解释的混合数据增强框架
7
作者 孙泽辰 肖义胜 +2 位作者 李俊涛 张民 周国栋 《软件学报》 北大核心 2025年第4期1604-1619,共16页
先前的预训练语言模型已在众多自然语言理解任务中展现了其卓越的性能.然而,它们常表现出捷径学习的问题,即学习了非鲁棒性特征与标签之间的虚假关联,导致模型在不同于训练分布的测试场景中的泛化能力不佳.近期,生成式预训练大模型在理... 先前的预训练语言模型已在众多自然语言理解任务中展现了其卓越的性能.然而,它们常表现出捷径学习的问题,即学习了非鲁棒性特征与标签之间的虚假关联,导致模型在不同于训练分布的测试场景中的泛化能力不佳.近期,生成式预训练大模型在理解任务中的出色表现引起了广泛的关注,但它们是否受到捷径学习的影响尚未被充分研究.以LLaMA系列模型与FLAN-T5模型为代表,探究生成式预训练大模型在多个自然语言理解任务中的捷径学习现象.研究结果表明,近期流行的生成式大模型仍然存在捷径学习的问题.进而,提出针对生成式预训练大模型的捷径学习问题的缓解策略——基于可控性解释的混合数据增强框架.该框架以数据为中心,基于模型生成的可控性解释数据与部分原始提示性数据构造小规模混合数据集,开展模型微调.在3个具有代表性的自然语言理解任务中的大量实验结果表明,使用该框架所构造的数据集训练模型能够有效缓解模型的捷径学习问题,提升模型在分布外测试场景中的鲁棒性与泛化能力,同时不牺牲甚至提升模型在分布内测试场景中的性能.代码已公开发布在https://github.com/Mint9996/HEDA. 展开更多
关键词 捷径学习 生成式预训练语言模型 自然语言理解
在线阅读 下载PDF
生成式人工智能在外语教材编写中的应用 被引量:3
8
作者 贾蕃 马颖 《外语研究》 北大核心 2025年第2期55-61,F0003,共8页
生成式人工智能为新时代外语教育提供了新路径。教材作为外语教育的重要组成部分,其内容编写也将受到生成式人工智能的深刻影响。生成式人工智能以自然语言处理和语料库语言学为基础,能自动生成高质量教学内容。本文通过具体案例,探讨... 生成式人工智能为新时代外语教育提供了新路径。教材作为外语教育的重要组成部分,其内容编写也将受到生成式人工智能的深刻影响。生成式人工智能以自然语言处理和语料库语言学为基础,能自动生成高质量教学内容。本文通过具体案例,探讨生成式人工智能在外语教材的语篇选择、练习设计和补充材料中的应用,以期提升外语教材编写中语篇间的匹配度、活动设计的有效性和教学资源的丰富性。不过,生成式人工智能在应用过程中也面临社会文化敏感性和知识产权保护等挑战,需要通过严格审核和法律咨询加以应对与化解。本研究可为生成式人工智能在外语教育改革和教材编写等方面的应用提供参考。 展开更多
关键词 生成式人工智能 外语教材编写 自然语言处理 语料库语言学
在线阅读 下载PDF
C^3I系统仿真中基于NLG技术的文电自动生成 被引量:2
9
作者 郭忠伟 周献中 徐延勇 《系统仿真学报》 CAS CSCD 2003年第12期1712-1714,1728,共4页
文电拟制是C3I系统仿真中的重要工作,普遍采用“模板”式的生成,提出的基于自然语言生成技术设计文电自动生成系统的方法,可实现文电“智能”式的生成,系统包括内容规划、句子规划和表层实现三个部分,利用改进的Schema方法在内容规划器... 文电拟制是C3I系统仿真中的重要工作,普遍采用“模板”式的生成,提出的基于自然语言生成技术设计文电自动生成系统的方法,可实现文电“智能”式的生成,系统包括内容规划、句子规划和表层实现三个部分,利用改进的Schema方法在内容规划器中规划出生成信息的深层语义,然后经过在句子规划中优化处理使其结构更加合理,最后在表层实现器中利用合一算法生成合乎习惯的表层句子。 展开更多
关键词 丈电 自然语言生成 内容规划 句子规划 表层实现
在线阅读 下载PDF
基于用户生成数据与自然语言处理的园林植物感知偏好研究——以武汉城市公园为例
10
作者 苏畅 陈一秀 +1 位作者 殷利华 郭诗怡 《中国园林》 北大核心 2025年第1期125-132,共8页
城市公园是城市空间的重要部分,在生态、社会和经济等方面至关重要。园林植物作为主要物质空间要素,对公众身心健康有着积极的恢复和促进作用。但基于公众视角与用户生成数据对园林植物感知行为及偏好特征的深入研究较少。以武汉城市公... 城市公园是城市空间的重要部分,在生态、社会和经济等方面至关重要。园林植物作为主要物质空间要素,对公众身心健康有着积极的恢复和促进作用。但基于公众视角与用户生成数据对园林植物感知行为及偏好特征的深入研究较少。以武汉城市公园为对象,按照社交媒体平台优先推荐植物观赏类城市公园的原则筛选,挖掘并解译用户生成数据,借助自然语言处理算法揭示公众对园林植物的感知偏好特征及影响因素。研究表明,公众对植物的感知主要集中在植物种类、季相和植物印象3个方面。其中植物种类感知与季相、感官呈显著正相关,与公园情感得分呈负相关。平台推荐引导的植物感知重点和公众评论中的实际感知基本一致。最后,依据分析结果提出公园季相、观赏错峰、观赏种类创新、观赏植物科教4个方面的植物景观优化建议,为城市公园的园林植物配置优化、公众感知友好型城市公园规划设计等提供研究实证参考。 展开更多
关键词 园林植物 风景园林 城市公园 用户生成数据 自然语言处理 景观感知
在线阅读 下载PDF
基于结构拆分的议论文生成方法
11
作者 刘田澍 赵铁军 宋雨辰 《中文信息学报》 北大核心 2025年第6期157-167,共11页
自然语言生成是自然语言处理的重要研究方向。该文研究如何使用题目及首尾段关键词生成议论文,并根据议论文特点将该任务进一步转化为基于题目及关键词的议论文首尾段生成、基于题目的论据匹配及论证生成的任务。前者对应议论文的引论... 自然语言生成是自然语言处理的重要研究方向。该文研究如何使用题目及首尾段关键词生成议论文,并根据议论文特点将该任务进一步转化为基于题目及关键词的议论文首尾段生成、基于题目的论据匹配及论证生成的任务。前者对应议论文的引论及结论,后者对应本论。该文提出了使用基于预训练模型并引入句子语义相似度预测任务的方法进行首尾段生成,提出了引入指示编码及软模板匹配度预测任务的重写方法进行论证生成,最后按照“一段引论,三段本论,一段结论”的结构生成完整议论文。实验结果表明,该方法可以生成可读性较好的议论文。 展开更多
关键词 自然语言生成 预训练模型 议论文
在线阅读 下载PDF
基于有监督学习的问题生成综述
12
作者 李玉娥 董黎刚 +1 位作者 黄欣 蒋献 《计算机应用与软件》 北大核心 2025年第5期6-18,共13页
问题生成(Question Generation,QG)研究是自然语言处理(Natural Language Processing,NLP)中文本生成的一个研究方向,该研究旨在给机器输入一段文本和答案,机器据此进行处理,输出一个或多个与当前文本和答案有关的问题。目前,该研究可... 问题生成(Question Generation,QG)研究是自然语言处理(Natural Language Processing,NLP)中文本生成的一个研究方向,该研究旨在给机器输入一段文本和答案,机器据此进行处理,输出一个或多个与当前文本和答案有关的问题。目前,该研究可以应用于教育、医学、自动问答等多个领域中。然而,研究表明当前基于有监督学习的问题生成策略仍然存在很多缺陷。该文首先介绍问题生成的发展过程、求解及处理过程,然后对当前的研究现状进行分析,将问题生成方法分为四类,对每一类方法中具有代表性的模型架构进行分析与对比,最后总结问题生成技术面临的技术难题以及未来的发展方向。 展开更多
关键词 深度学习 自然语言处理 有监督学习 问题生成
在线阅读 下载PDF
面向知识推理的位置编码标题生成模型
13
作者 王雅伦 张仰森 朱思文 《计算机应用》 北大核心 2025年第2期345-353,共9页
义原作为最小的语义单位对于标题生成任务至关重要。尽管义原驱动的神经语言模型(SDLM)是主流模型之一,但它在处理长文本序列时编码能力有限,未充分考虑位置关系,易引入噪声知识进而影响生成标题的质量。针对上述问题,提出一种基于Trans... 义原作为最小的语义单位对于标题生成任务至关重要。尽管义原驱动的神经语言模型(SDLM)是主流模型之一,但它在处理长文本序列时编码能力有限,未充分考虑位置关系,易引入噪声知识进而影响生成标题的质量。针对上述问题,提出一种基于Transformer的生成式标题模型Tran-A-SDLM(Transformer Adaption based Sememe-Driven Language Model with positional embedding and knowledge reasoning)。该模型充分结合自适应位置编码和知识推理机制的优势。首先,引入Transformer模型以增强模型对文本序列的编码能力;其次,利用自适应位置编码机制增强模型的位置感知能力,从而增强对上下文义原知识的学习;此外,引入知识推理模块,用于表示义原知识,并指导模型生成准确标题;最后,为验证Tran-A-SDLM的优越性,在大规模中文短文本摘要(LCSTS)数据集上进行实验。实验结果表明,与RNN-context-SDLM相比,Tran-A-SDLM在ROUGE-1、ROUGE-2和ROUGE-L值上分别提升了0.2、0.7和0.5个百分点。消融实验结果进一步验证了所提模型的有效性。 展开更多
关键词 生成式标题 自适应位置编码 TRANSFORMER 知识推理 自然语言处理
在线阅读 下载PDF
自适应的流水线式无监督问题生成方法
14
作者 李昆泽 张宇 《计算机研究与发展》 北大核心 2025年第4期905-914,共10页
在传统的问答任务中,模型一般需要大量的数据进行训练,而标注这些数据需要较多的时间和人力成本.无监督问题生成是解决问答任务训练数据匮乏的一种有效方法,但是目前使用该方法生成的问题存在难以回答、种类单一、语义不明等问题.针对... 在传统的问答任务中,模型一般需要大量的数据进行训练,而标注这些数据需要较多的时间和人力成本.无监督问题生成是解决问答任务训练数据匮乏的一种有效方法,但是目前使用该方法生成的问题存在难以回答、种类单一、语义不明等问题.针对这些问题,提出了一个自适应的多模块流水线式模型ADVICE,多个模块分别从问题可回答性、问题多样性和语法规范性对现有方法进行改进.在问题可回答性模块中,使用了共指消解和命名实体识别技术来提升问题的可回答性.在问题多样性模块中,针对不同提问方式的问题设计了不同的规则来提升问题类型多样性与答案类型多样性.在语法规范性模块中,基于T5训练了一个针对问句的语法错误纠正模型,并设计了一个筛选模块对纠正后的问答数据进行过滤.最后,训练了一个分类器自动选择所需要的模块.实验表明,使用改进后的问题生成方法,下游的问答模型在SQuAD数据集上的EM值平均提升了2.9个百分点,F1值平均提升了4.4个百分点. 展开更多
关键词 无监督学习 问题生成 预训练模型 深度学习 自然语言处理
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
15
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 Text-to-SQL数据集
在线阅读 下载PDF
生成式人工智能是否能替代人类生成语言?——从梅洛庞蒂的语言生成观探讨
16
作者 崔中良 《西安交通大学学报(社会科学版)》 北大核心 2025年第3期182-190,共9页
生成式人工智能对于人类的巨大挑战在于,语言是否属于人类独有的能力。通过分析语言的纵向和横向生成观,探讨生成式人工智能在人类生存维度上的语言生成特征和真实性问题。从语言生成的目的角度分析,人类语言的生成是主体间关联和维持... 生成式人工智能对于人类的巨大挑战在于,语言是否属于人类独有的能力。通过分析语言的纵向和横向生成观,探讨生成式人工智能在人类生存维度上的语言生成特征和真实性问题。从语言生成的目的角度分析,人类语言的生成是主体间关联和维持的中介,人类通过语言获得知识并不断生成新知识和多元意义;生成式人工智能对语言的生成偏向于知识性呈现,缺少互动性的生成过程和对意义的追求。从语言生成的基础分析,人类语言的生成单位是句子,生成方式具有非规则性并以身体经验为支撑;生成式人工智能对语言的生成是以单词为基础,依赖对词语规则的预测能力。在此基础上,进一步指出语言生成不等于语言构造,生成式人工智能所生成的语言是一个透明系统和意义茧房,不能通过沉默的形式拒绝交互;在内容上,无法生成自我指称、使用语言思考和创造新的意义,因此生成式人工智能并不能替代人类真正地生成语言。 展开更多
关键词 生成式人工智能 语言生成 语言观 身体现象学 大语言模型 自然语言处理
在线阅读 下载PDF
自适应知识增强的可控故事生成模型
17
作者 孟祥仲 夏鸿斌 刘渊 《计算机工程与应用》 北大核心 2025年第12期129-140,共12页
可控故事生成是近年来自然语言处理领域内的热点方向。目前的研究通过交叉注意力机制已经能够有效地融合文本特征和事件特征,但其缺乏对于常识化知识的高效应用,仍然采用在公共的常识化知识语料库上后训练的方式,尽管这能够在一定程度... 可控故事生成是近年来自然语言处理领域内的热点方向。目前的研究通过交叉注意力机制已经能够有效地融合文本特征和事件特征,但其缺乏对于常识化知识的高效应用,仍然采用在公共的常识化知识语料库上后训练的方式,尽管这能够在一定程度上提升模型的性能,但在自适应性的方面仍然有很大的提升空间。为了解决此问题,提出自适应知识增强(adaptive knowledge enhancement,AKE)的可控故事生成模型,其中的常识化知识构建模块能够针对精调时的训练用数据集自适应地构建匹配的常识化知识语料库,确保为模型提供更相关的额外信息。此外,模型中加入了使用辅助函数进行训练的多任务学习组件,确保其能够学习到更具有判别性的特征表示,从而提升模型的泛化能力。实验结果表明,AKE在自动评测指标和人工评测指标上相较于其他基线模型均有显著提升,验证了此模型在利用常识化知识方面的优越性。 展开更多
关键词 自然语言处理 可控故事生成 交叉注意力机制 多任务学习 知识增强
在线阅读 下载PDF
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集 被引量:2
18
作者 张谧 潘旭东 杨珉 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1113-1127,共15页
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十... 提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制.根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过70%,测试问题均可同时触发多款模型违规生成.这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质. 展开更多
关键词 生成式人工智能安全 大语言模型 大语言模型安全评测 人工智能安全 自然语言处理
在线阅读 下载PDF
大语言模型在护理领域的应用进展 被引量:4
19
作者 吴金玉 陈曦 +1 位作者 黎慧 李鹏程 《护理学杂志》 CSCD 北大核心 2024年第17期26-29,共4页
简要介绍大语言模型技术并总结其在护理领域(如临床实践、护理教育和护理研究方面)的应用及面临的挑战,旨在促进护理人员对大语言模型的认识,激发大语言模型在护理领域的研究和探索,为进一步优化患者护理,提高工作效率,提升护理教育赋... 简要介绍大语言模型技术并总结其在护理领域(如临床实践、护理教育和护理研究方面)的应用及面临的挑战,旨在促进护理人员对大语言模型的认识,激发大语言模型在护理领域的研究和探索,为进一步优化患者护理,提高工作效率,提升护理教育赋能助力。 展开更多
关键词 人工智能 自然语言处理 大语言模型 生成式人工智能 护理 综述文献
在线阅读 下载PDF
面向大语言模型的越狱攻击综述 被引量:12
20
作者 李南 丁益东 +2 位作者 江浩宇 牛佳飞 易平 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1156-1181,共26页
近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对... 近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对齐的影响,诱使经过对齐的大语言模型产生有害输出.越狱攻击带来的滥用、劫持、泄露等问题已对基于大语言模型的对话系统与应用程序造成了严重威胁.对近年的越狱攻击研究进行了系统梳理,并基于攻击原理将其分为基于人工设计的攻击、基于模型生成的攻击与基于对抗性优化的攻击3类.详细总结了相关研究的基本原理、实施方法与研究结论,全面回顾了大语言模型越狱攻击的发展历程,为后续的研究提供了有效参考.对现有的安全措施进行了简略回顾,从内部防御与外部防御2个角度介绍了能够缓解越狱攻击并提高大语言模型生成内容安全性的相关技术,并对不同方法的利弊进行了罗列与比较.在上述工作的基础上,对大语言模型越狱攻击领域的现存问题与前沿方向进行探讨,并结合多模态、模型编辑、多智能体等方向进行研究展望. 展开更多
关键词 生成式人工智能 越狱攻击 大语言模型 自然语言处理 网络空间安全
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部