期刊文献+
共找到923篇文章
< 1 2 47 >
每页显示 20 50 100
Self-Guide:一种基于自我规划的大语言模型推理增强方法
1
作者 刘艺彬 刘正皓 +6 位作者 闫宇坤 于是 王硕 杨麟儿 陈慧敏 谷峪 于戈 《中文信息学报》 北大核心 2025年第4期55-66,共12页
尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认... 尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认知过载,是一个亟待解决的问题。对此该文提出了Self-Guide方法,用于增强语言模型的推理能力。该方法通过指引大语言模型生成常识知识和推理指导,让大语言模型基于自我规划来增强其推理能力,并通过与推理链结合的方式对模型的推理过程进行校准。与现有方法不同的是,该文在不对大语言模型进行微调或使用外部工具的情况下,显著提升了大语言模型的推理性能。实验结果表明,Self-Guide方法在四种常见推理任务上性能显著优于基线方法,同时相比传统的推理链模型,Self-Guide方法在推理能力较弱的模型上也具有良好的泛化性能。通过结合大语言模型的自我规划和推理能力,Self-Guide方法为提升语言模型的推理能力提供了一种新的有效途径。 展开更多
关键词 大语言模型 自我引导 推理增强 认知负荷
在线阅读 下载PDF
ChatModeler:基于大语言模型的人机协作迭代式需求获取和建模方法 被引量:13
2
作者 靳东明 金芝 +1 位作者 陈小红 王春晖 《计算机研究与发展》 EI CSCD 北大核心 2024年第2期338-350,共13页
需求获取和建模是需求工程中的关键步骤,影响后续系统设计与实现.传统的需求获取和建模方法通常由需求提供者、需求分析师等多类干系人共同协作、反复迭代完成,需要耗费大量的人力.如何减轻需求提供者与需求分析师的负担、提高获取和建... 需求获取和建模是需求工程中的关键步骤,影响后续系统设计与实现.传统的需求获取和建模方法通常由需求提供者、需求分析师等多类干系人共同协作、反复迭代完成,需要耗费大量的人力.如何减轻需求提供者与需求分析师的负担、提高获取和建模的效率有着重要意义.现有工作中有的使用知识库来提供更多知识,以辅助获取或者建模,有的利用自然语言处理等技术对获取或者建模过程进行自动化,但是它们并没有减轻需求提供者的负担.利用大语言模型(large language models,LLMs)的生成能力,提供了一种人机协作的迭代式需求获取和建模框架ChatModeler.具体来说,根据真实世界中需求团队的分工及协作关系,将部分需求提供者、需求分析师等角色的工作由大语言模型承担,而需求提供者只需要进行确认.为大语言模型扮演的各种角色进行了提示词设计,该提示词会随需求的元模型而变化.ChatModeler在7个需求案例上与3种需求模型的自动建模方法进行了14组对比实验,证明了ChatModeler在降低需求提供者的负担和生成高质量需求模型2个方面上的优越性. 展开更多
关键词 需求工程 需求诱导 大语言模型 人机协作 提示工程
在线阅读 下载PDF
大语言模型综述与展望 被引量:17
3
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
人工智能的语言优势和不足:基于大语言模型与真实学生语文能力的比较 被引量:3
4
作者 高承海 党宝宝 +1 位作者 王冰洁 吴胜涛 《心理学报》 北大核心 2025年第6期947-966,I0004-I0010,共27页
采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-... 采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-4规范性得分与真实学生相当,情感性和创造性超过及格水平、但低于真实学生,且前者最优个体的规范性、情感性得分与真实学生最高分持平。研究2基于文心ERNIE-4重复验证了上述结果,且ERNIE-4的规范性得分高于真实学生。研究揭示了人工智能在现代文知识、规范领域的优势和古代诗文知识的不足,以及情感性与创造性方面的潜力。这些发现有助于理解和提升人工智能的文化适应性和人性化、个性化生成能力,也对反思和培养人类的独特优势具有重要启发。 展开更多
关键词 大语言模型 语文能力 准确性 情感性 创造性
在线阅读 下载PDF
大模型驱动的矿产资源智能预测超级智能体构建方法探索 被引量:2
5
作者 王永志 温世博 +7 位作者 李博文 陈星宇 董宇浩 田江涛 王斌 Muhammed Atif BILAL 纪政 孙丰月 《地学前缘》 北大核心 2025年第4期38-45,共8页
矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了... 矿产资源预测是数学地球科学领域的一项重要研究内容,需使用多种软件处理跨专业地学数据,面临处理过程复杂、工作量巨大、语义难对齐等诸多问题,给研究人员带来巨大挑战。随着新一代生成式人工智能的大模型、智能体等出现,极大地推动了各行业的变革性发展,亦赋能矿产资源预测向智能预测跨越。本文提出一种大模型驱动的矿产资源智能预测超级智能体方法,以多模态大模型(如DeepSeek、通义千问)为基础底座,依托通用智能体技术创建由管理智能体和智能体群构成的超级智能体。智能体群包括地质智能体群、地球物理智能体群、地球化学智能体群、遥感智能体群等,每个智能体群含有多个单一智能体或小型智能体群,每个智能体访问具体的工具(本地自定义、网络及自动生成)、数据等。智能预测超级智能体自动感知外界发送的预测要求,由管理智能体串行或并行调用多个智能体群、单一智能体(如生成二维图)、工具(如插值)、访问数据等完成矿产资源智能化预测任务。以地球化学图生成为例,深度剖析通过智能体与大模型交互完成任务的内部运行机制,一键式智能生成一种或多种地球化学图,证明智能计算方法的有效性。通过将大模型、智能体与矿产资源预测业务三者深度融合,在输入为文字或语音时即可完成零代码的预测任务,为创建矿产资源智能预测新范式提供有益探索。 展开更多
关键词 矿产资源预测 智能预测 大模型 大语言模型 智能体 超级智能体
在线阅读 下载PDF
从“负能”到“赋能”:基于LLMs的思维链提示设计与教研AI智能体构建——以课堂教学智能分析为例 被引量:12
6
作者 王冬青 陈自力 +3 位作者 邵文豪 张粤芳 李赞坚 任光杰 《中国电化教育》 北大核心 2025年第3期111-117,125,共8页
课堂教学智能分析是人工智能技术赋能循证教研的新趋势,通常以报告的形式呈现给一线教师,但其往往包含巨大认知负荷且数据呈现复杂,使得一线教师难以把握问题关键点并用于教学改进,以数据“赋能”为出发点,却反而给教师带去了数据“负... 课堂教学智能分析是人工智能技术赋能循证教研的新趋势,通常以报告的形式呈现给一线教师,但其往往包含巨大认知负荷且数据呈现复杂,使得一线教师难以把握问题关键点并用于教学改进,以数据“赋能”为出发点,却反而给教师带去了数据“负能”。该文基于思维链提示逻辑,提出了教研AI智能体赋能课堂教学分析报告解读的构建框架,实现从数据解析到反馈生成的循环,并以此为导向模块化构建了基于开源大语言模型(LLMs)的智能体框架,个性化开发教研AI智能体。通过63份真实报告数据,验证了“基于思维链提示的回复”相较于“基于LLM的普通回复”的有效性,结果表明前者在多项评价维度上均表现出更高的评分,尤其是在准确性、逻辑性和专业性方面具有显著提升。该文通过聚焦智能体在教研中的垂直应用,探索从数据负能到赋能转变的新路径。 展开更多
关键词 大语言模型 智能体 思维链提示 课堂教学智能分析 循证教研
在线阅读 下载PDF
基于大型语言模型的AI招生咨询助理设计与实现 被引量:3
7
作者 阮昆 杨璟轩 +3 位作者 殷旭 储雯 罗婷婷 黄容 《实验室研究与探索》 北大核心 2025年第2期110-116,共7页
针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立... 针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立本地权威招生知识库,对政策咨询类问题直接在本地向量知识库检索,对数据查询类问题转化为SQL数据查询,将检索或查询结果送至大模型推理生成回复,提升提问方式的自由度以及问题回复的权威性和实时性,降低大模型幻觉,实现全天候为考生和家长提供精准化、智能化、个性化的咨询服务。在2024年高考招生咨询中,大幅度减轻学校招生咨询工作压力,有效提升招生咨询效率,促进公平获取招生信息。 展开更多
关键词 大型语言模型 检索增强生成技术 提示词工程 招生咨询
在线阅读 下载PDF
大语言模型赋能图书馆参考咨询服务:逻辑、场景与体系 被引量:23
8
作者 郭亚军 寇旭颍 +1 位作者 冯思倩 李帅 《图书馆论坛》 北大核心 2025年第1期118-127,共10页
文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流... 文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流程构建参考咨询服务体系。建议图书馆从加强多种技术的深层次嵌入、推行“引导+反馈”的交互服务模式、实现机器与馆员的协同合作、完善用户数据收集和分析机制等方面,推进大语言模型赋能图书馆参考咨询服务的发展。 展开更多
关键词 大语言模型 ChatGPT 智慧图书馆 参考咨询 AIGC
在线阅读 下载PDF
在线协作知识建构情境下多智能体促进观点涌现的机制研究 被引量:6
9
作者 朱珂 卞茗慧 张瑾 《远程教育杂志》 北大核心 2025年第2期74-84,共11页
在线协作知识建构作为一种社会性学习形式,以观点涌现作为核心驱动,能够促进学习者之间的深度互动与知识建构。然而,观点涌现的质量与深度并非自然生成,而是受到学习者背景知识、团队协作频率、任务复杂性,以及技术支持环境等多重因素... 在线协作知识建构作为一种社会性学习形式,以观点涌现作为核心驱动,能够促进学习者之间的深度互动与知识建构。然而,观点涌现的质量与深度并非自然生成,而是受到学习者背景知识、团队协作频率、任务复杂性,以及技术支持环境等多重因素的影响。基于大语言模型技术的多智能体(LLM-MA)在协作过程中凭借其实时引导与反馈机制,展现出优化观点涌现过程的显著潜力。现有关于LLM-MA促进观点涌现的研究多聚焦于静态结果分析,较少关注观点生成的动态过程及其质量提升。因此,本研究以“社会知识建构互动分析模型”为理论基础,采用“共享信息、发现冲突、意义协商、知识构建、应用反思”五阶段协作流程,并结合过程挖掘分析与内容分析,系统探讨了基于大语言模型的多智能体在学习者在线协作知识建构中对观点涌现的作用效果。研究结果表明,基于大语言模型的多智能体不仅能够优化观点涌现的过程结构与效率,还能显著提升观点的深度与清晰度,而传统协作方式在观点涌现的广度上更具优势,表现出较强的探索性与创造力。最后,本研究针对教师介入、技术开发及学习者的社会性参与提出具体建议,旨在通过提供更加智能化的支持,优化在线协作知识建构中的观点涌现,推动大语言模型与教育实践的深度融合,全面提升学习者的协作效率与知识建构质量。 展开更多
关键词 在线协作知识建构 大语言模型 多智能体 观点涌现
在线阅读 下载PDF
生成式人工智能的法律规制——从技术与人机关系出发 被引量:6
10
作者 姜沣格 于海防 《求是学刊》 北大核心 2025年第2期123-137,共15页
生成式人工智能在智能水平、自主性等方面获得巨大提升,基于对其技术与人机关系特性以及法律问题成因的分析可以发现,生成式人工智能在承继以往人工智能宏观、微观法律问题之外,又在技术层面、事实层面、价值层面产生大量新问题。生成... 生成式人工智能在智能水平、自主性等方面获得巨大提升,基于对其技术与人机关系特性以及法律问题成因的分析可以发现,生成式人工智能在承继以往人工智能宏观、微观法律问题之外,又在技术层面、事实层面、价值层面产生大量新问题。生成式人工智能法律规制应当确立局部替代人类、整体增强人类的价值理念,以监管机制为中心,分阶段采取强度不同的监管模式,并将人类价值观做技术嵌入。沿用《数据安全法》上的重要程度、危害程度作为人工智能分类分级的标准,建立分类分级机制以及技术标准机制。在此基础上,根据生成式人工智能的技术流程,建立针对起始阶段的研发机制、针对中间阶段的应用机制以及针对最终阶段的责任机制,并配以强制责任保险与社会救助基金机制。 展开更多
关键词 大语言模型 生成式人工智能 人机关系 法律规制 人工智能法
在线阅读 下载PDF
基于大语言模型的智能汽车仿真测试 被引量:2
11
作者 朱冰 汤瑞 +4 位作者 赵健 张培兴 李文旭 李嘉胜 徐雪峰 《汽车工程》 北大核心 2025年第4期587-597,共11页
针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语... 针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语言模型的智能汽车仿真测试流程,针对知识问答型任务设计了知识挖掘、模型微调与知识库增强检索应用流程,针对场景生成任务设计了场景类型分析、场景要素生成、场景工具链调用的应用路径,针对测试评价型任务,设计了测试场景解析、评价体系构建与仿真测试执行综合应用框架;最后,对各任务进行了测试。结果证明,本文所提出的测试方法可以有效解决不同类型的测试任务,提升测试效率。 展开更多
关键词 智能汽车 仿真测试 大语言模型 场景生成 自动测试
在线阅读 下载PDF
基于大语言模型的气象数据语义智能识别算法研究 被引量:1
12
作者 酆薇 肖文名 +2 位作者 田征 梁中军 姜滨 《信息网络安全》 北大核心 2025年第7期1163-1171,共9页
气象数据作为典型的时空大数据,在赋能经济社会发展的同时面临严峻的数据安全挑战。针对当前气象数据安全监测中存在的语义理解不足、数据特征识别准确率低和泛化能力差等问题,文章提出一种基于大语言模型的气象数据语义智能识别算法。... 气象数据作为典型的时空大数据,在赋能经济社会发展的同时面临严峻的数据安全挑战。针对当前气象数据安全监测中存在的语义理解不足、数据特征识别准确率低和泛化能力差等问题,文章提出一种基于大语言模型的气象数据语义智能识别算法。该算法通过构建高质量的训练数据集和领域知识库,融合检索增强生成(RAG)与低秩适应(LoRA)轻量化模型技术,应用思维链(CoT)进行微调,选择近端策略优化(PPO)算法作为强化学习算法,持续优化气象数据识别大模型的识别性能。实验结果表明,文章所提算法能有效提高气象数据特征识别的准确率。 展开更多
关键词 大语言模型 数据安全 语义智能识别 RAG COT
在线阅读 下载PDF
从单智能体到多智能体:大模型智能体支持下的激励型学习活动设计与实证研究 被引量:16
13
作者 黄昌勤 钟益华 +2 位作者 王希哲 韩中美 魏同权 《华东师范大学学报(教育科学版)》 北大核心 2025年第5期44-56,共13页
大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交... 大模型与智能代理技术的不断进步,使得大模型智能体成为教育领域中实现教与学提质增效的重要新工具。基于大模型智能体的功能定位差异,单一智能体虽然已能够针对各类教与学任务提供诸如内容生成、智能反馈与评估等支持,但单智能体的交互特点、功能属性具有较高同质性,在促进深层次认知发展方面存在一定局限。相比之下,多智能体能够通过模拟多种教育主体角色,提升学习互动的多样性和深度,进而实现更为个性化和深度的学习体验。鉴于智能体在学习过程中的应用主要依靠学习者自发性,为了保障学习活动的有效开展,本研究基于ARCS动机模型分别设计基于单智能体与多智能体的激励型学习活动方案,并面向英语阅读场景开展了准实验研究。实验结果发现:基于多智能体的激励型学习活动相较单智能体能够显著提升学生在推理、评价与应用方面的学习成绩,具有更强的学习动机,且有效促进了其深层次认知发展,尤其是抽象与概括能力。研究证明了多智能体在支持学生深度学习中的价值,为未来进一步探讨多智能体在教育中的应用提供了借鉴。 展开更多
关键词 大语言模型 多智能体 ARCS动机模型 激励型学习活动 深度学习
在线阅读 下载PDF
基于大模型检索增强生成的气象数据库问答模型实现 被引量:7
14
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计 被引量:5
15
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
在线阅读 下载PDF
大语言模型安全性:分类、评估、归因、缓解、展望 被引量:7
16
作者 黄河燕 李思霖 +7 位作者 兰天伟 邱昱力 柳泽明 姚嘉树 曾理 单赢宇 施晓明 郭宇航 《智能系统学报》 北大核心 2025年第1期2-32,共31页
大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的... 大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的内容存在违法、泄密、仇恨、偏见、错误等问题。并且在实际应用中,大语言模型可能被滥用,生成的内容可能引起国家、人群和领域等多个层面的困扰。本文旨在深入探讨大语言模型面临的安全性风险并进行分类,回顾现有的评估方法,研究安全性风险背后的因果机制,并总结现有的解决措施。具体而言,本文明确了大语言模型面临的10种安全性风险,并将其归类为模型自身安全性风险与生成内容的安全性风险两个方面,并对每种风险进行了详细的分析和讲解。此外,本文还从生命周期和危害程度两个角度对大语言模型的安全风险进行了系统化的分析,并介绍了现有的大语言模型安全风险评估方法、大语言模型安全风险的出现原因以及相应的缓解措施。大语言模型的安全风险是亟待解决的重要问题。 展开更多
关键词 大语言模型 模型自身安全性 生成内容安全性 安全性分类 安全性风险评估 安全性风险归因 安全性风险缓解措施 安全性研究展望
在线阅读 下载PDF
基于大语言模型技术的古籍限定域关系抽取及应用研究 被引量:4
17
作者 刘畅 张琪 +4 位作者 王东波 沈思 吴梦成 刘浏 苏雨诗 《情报学报》 北大核心 2025年第2期200-219,共20页
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟... 古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟待生成式人工智能技术的赋能。本研究探索了基于大语言模型的古籍领域限定域关系抽取方法和高质量训练语料自动生成方法。通过比较不同提示模板对模型抽取性能的影响,证明了微调方法对模型性能提升具有显著价值。基于ChatGPT4的API服务,结合自指令、思维链与人类反馈合成古籍限定域关系抽取数据集,在数据增强后于两种古籍关系抽取数据集上分别取得56.07%和30.50%的F1值,迁移能力较两种使用全部数据训练的模型均取得了显著提升。本研究还探索了协同使用自指令模型和自动评价模型合成训练语料和评价信息,并基于合成数据训练模型,有效缓解了训练数据不足的问题。研究结果表明,使用大语言模型抽取关系三元组与合成训练数据,能够显著降低过往限定域关系抽取的人力成本,有助于提升古籍领域知识图谱的构建效率。 展开更多
关键词 大语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文
在线阅读 下载PDF
多模态大语言模型的安全性研究综述 被引量:5
18
作者 陈晋音 席昌坤 +2 位作者 郑海斌 高铭 张甜馨 《计算机科学》 北大核心 2025年第7期315-341,共27页
随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模... 随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模型由于更接近于多资源的现实世界应用以及多模态处理的复杂性而具有巨大的潜力和挑战。然而,多模态大语言模型的脆弱性研究相对较少,这些模型在实际应用中面临着诸多安全性挑战。为此,对多模态大语言模型尤其是大型视觉-语言模型的安全性进行了全面调查。首先,概述了多模态大语言模型的基本结构和发展历程;其次,讨论了多模态大语言模型在使用全周期的安全风险成因,分析了模型结构与安全风险之间的关联性;再次,系统总结了当前在多模态大语言模型图像和文本安全性的评估方面所做的工作,包括模型幻觉、隐私安全、偏见和鲁棒性4个方面,并将针对多模态大语言模型的攻击分为越狱攻击、对抗攻击、后门攻击和中毒攻击;然后,综合概述了一系列针对多模态大语言模型幻觉、隐私泄露和偏见等威胁的可信增强方法以及针对模型恶意攻击的防御措施;最后,讨论了多模态大语言模型安全性研究的主要机遇与挑战,为研究人员在多模态大语言模型的复杂应用和研究领域提供了指导建议。 展开更多
关键词 模态大语言模型 安全 幻觉 对抗 越狱 防御
在线阅读 下载PDF
医疗领域的大型语言模型综述 被引量:1
19
作者 肖建力 许东舟 +4 位作者 王浩 刘敏 周雷 朱林 顾松 《智能系统学报》 北大核心 2025年第3期530-547,共18页
深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言... 深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。 展开更多
关键词 人工智能 深度学习 TRANSFORMER 大型语言模型 智慧医疗 数据分析 图像处理 计算机视觉
在线阅读 下载PDF
大模型教育应用展望:基于技术预见的方法 被引量:4
20
作者 陈向东 靳旭莹 《苏州大学学报(教育科学版)》 北大核心 2025年第1期13-24,共12页
作为一种公认的颠覆性技术,大模型在教育领域的应用亟须全面地审视,以评估可能出现的复杂场景及其后果。本研究从聚焦未来导向、鼓励广泛的多元参与、关注多重并发路径、承认不确定性、挖掘技术应用的深层因素等角度,分析技术预见对于... 作为一种公认的颠覆性技术,大模型在教育领域的应用亟须全面地审视,以评估可能出现的复杂场景及其后果。本研究从聚焦未来导向、鼓励广泛的多元参与、关注多重并发路径、承认不确定性、挖掘技术应用的深层因素等角度,分析技术预见对于探讨大模型教育应用的适用性,以中国人工智能学会的系列研究报告«大型语言模型的教育应用»为例,展示如何通过技术预见活动和相应的工具GPT-EDU4SIGHT,从大模型对教育不同方面的影响、典型应用场景、背后的心理机制、应用的伦理挑战以及基于大模型人工智能基础教育等五个维度进行大模型教育应用的前瞻性探索。技术预见在塑造未来教育中扮演重要的角色,为教育政策制定者、技术开发者和教育实践者提供了一种全新的思考和行动的框架。相应的技术工具也为大模型应用于教育决策和教育治理提供了示范案例。 展开更多
关键词 大模型 技术预见 应用场景 GPT-EDU4SIGHT
在线阅读 下载PDF
上一页 1 2 47 下一页 到第
使用帮助 返回顶部