期刊文献+
共找到792篇文章
< 1 2 40 >
每页显示 20 50 100
大语言模型推理中的存储优化技术综述 被引量:3
1
作者 葛旭冉 欧洋 +5 位作者 王博 赵宇 吴利舟 王子聪 陈志广 肖侬 《计算机研究与发展》 北大核心 2025年第3期545-562,共18页
近年来,大语言模型在多个领域展现出卓越的性能,显著改变了人类的生活方式.然而,随着模型规模的不断增长和用户对长上下文推理需求的增加,大语言模型推理系统在存储方面面临诸多问题.首先,庞大的模型参数和键值缓存导致GPU显存资源不足... 近年来,大语言模型在多个领域展现出卓越的性能,显著改变了人类的生活方式.然而,随着模型规模的不断增长和用户对长上下文推理需求的增加,大语言模型推理系统在存储方面面临诸多问题.首先,庞大的模型参数和键值缓存导致GPU显存资源不足;其次,分布式大语言模型推理系统难以充分利用GPU集群的存储资源,存在资源过度配置和存储容错的问题.因此,从显存优化、异构存储和分布式存储3方面入手,归纳总结了现有研究在解决GPU显存容量不足和资源利用率低下方面的努力.基于显存优化的大语言模型推理系统通过高效的键值缓存管理、压缩以及注意力算子优化,提高了GPU显存利用率,降低了显存占用.基于异构存储的大语言模型推理系统利用多种类别的存储资源扩展存储容量,通过张量放置策略、异步数据传输以及智能显存分配与预取技术,降低了异构存储带来的I/O开销.基于分布式存储的大语言模型推理系统通过批处理、多级调度、冗余复制等策略,优化了多机存储和计算资源的利用,提高了大语言模型推理任务的执行效率和容错能力.最后,总结了现有研究,并对未来的研究方向进行了展望. 展开更多
关键词 大语言模型推理系统 显存管理 异构存储 分布式存储 故障恢复 无服务大语言模型推理
在线阅读 下载PDF
大语言模型综述与展望 被引量:12
2
作者 秦小林 古徐 +1 位作者 李弟诚 徐海文 《计算机应用》 北大核心 2025年第3期685-696,共12页
大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参... 大语言模型(LLM)是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练,是当前生成式人工智能(AI)技术的核心。与传统语言模型相比,LLM通过大量的算力、参数和数据支持,展现出更强的语言理解与生成能力,广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法,对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此,在介绍LLM的基础架构、训练技术及发展历程的基础上,分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究,进一步阐述LLM在实际应用中面临的挑战,包括数据偏差、模型幻觉和计算资源消耗等问题,并对LLM的持续发展趋势进行展望。 展开更多
关键词 大语言模型 智能体 自然语言处理 检索增强生成 模型幻觉
在线阅读 下载PDF
基于大语言模型的财会知识图谱构建及应用展望 被引量:8
3
作者 陈宋生 王明 《会计之友》 北大核心 2025年第5期152-160,F0003,共10页
生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会... 生成式人工智能(AIGC)的快速崛起,掀起“人工智能+”赋能各行各业的浪潮,对会计领域的研究提供了新思路。由于财会行业要求高精确性与可解释性,而大语言模型存在着模型幻觉与决策黑箱,使得大模型应用于财会领域仍存在较大阻碍,构建财会知识图谱成为弥补大语言模型不足的有力工具。基于此,文章调用GPT-4o mini API,利用提示词工程(Prompt)与智能体(Agent)思路方法进行自动化知识抽取,构建中国会计准则知识图谱,从模式层提取财会实体与实体间复杂的勾稽关系,为大模型优化微调提供数据层支持。图谱构建结果表明,GPT-4o mini能够成功从大量财务数据中提取丰富的知识五元组,并基于此构建财会知识图谱。最终,通过Neo4j技术实现知识图谱的可视化和查询功能。本研究证明大语言模型构建财会知识图谱具备可行性,能够显著提高知识图谱构建效率,为知识图谱的优化构建提供新思路,也为未来知识图谱融入大模型、优化模型性能提供基底数据支撑。 展开更多
关键词 大语言模型 知识图谱 智能化构建 财会知识
在线阅读 下载PDF
大语言模型安全性:分类、评估、归因、缓解、展望 被引量:6
4
作者 黄河燕 李思霖 +7 位作者 兰天伟 邱昱力 柳泽明 姚嘉树 曾理 单赢宇 施晓明 郭宇航 《智能系统学报》 北大核心 2025年第1期2-32,共31页
大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的... 大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的内容存在违法、泄密、仇恨、偏见、错误等问题。并且在实际应用中,大语言模型可能被滥用,生成的内容可能引起国家、人群和领域等多个层面的困扰。本文旨在深入探讨大语言模型面临的安全性风险并进行分类,回顾现有的评估方法,研究安全性风险背后的因果机制,并总结现有的解决措施。具体而言,本文明确了大语言模型面临的10种安全性风险,并将其归类为模型自身安全性风险与生成内容的安全性风险两个方面,并对每种风险进行了详细的分析和讲解。此外,本文还从生命周期和危害程度两个角度对大语言模型的安全风险进行了系统化的分析,并介绍了现有的大语言模型安全风险评估方法、大语言模型安全风险的出现原因以及相应的缓解措施。大语言模型的安全风险是亟待解决的重要问题。 展开更多
关键词 大语言模型 模型自身安全性 生成内容安全性 安全性分类 安全性风险评估 安全性风险归因 安全性风险缓解措施 安全性研究展望
在线阅读 下载PDF
人工智能的语言优势和不足:基于大语言模型与真实学生语文能力的比较 被引量:3
5
作者 高承海 党宝宝 +1 位作者 王冰洁 吴胜涛 《心理学报》 北大核心 2025年第6期947-966,I0004-I0010,共27页
采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-... 采用定量和定性相结合的混合研究方法,从准确性、规范性、情感性和创造性四个维度评估了人工智能的语言优势和不足。研究1发现,相对于真实学生,GPT-4现代文知识(尤其概念知识)的准确性较高,但其古代诗文和语言文字运用的准确性较低;GPT-4规范性得分与真实学生相当,情感性和创造性超过及格水平、但低于真实学生,且前者最优个体的规范性、情感性得分与真实学生最高分持平。研究2基于文心ERNIE-4重复验证了上述结果,且ERNIE-4的规范性得分高于真实学生。研究揭示了人工智能在现代文知识、规范领域的优势和古代诗文知识的不足,以及情感性与创造性方面的潜力。这些发现有助于理解和提升人工智能的文化适应性和人性化、个性化生成能力,也对反思和培养人类的独特优势具有重要启发。 展开更多
关键词 大语言模型 语文能力 准确性 情感性 创造性
在线阅读 下载PDF
大语言模型赋能图书馆参考咨询服务:逻辑、场景与体系 被引量:17
6
作者 郭亚军 寇旭颍 +1 位作者 冯思倩 李帅 《图书馆论坛》 北大核心 2025年第1期118-127,共10页
文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流... 文章分析大语言模型的生成机理及应用模式,探讨其赋能图书馆参考咨询服务的适配性。在此基础上,梳理大语言模型赋能图书馆参考咨询服务的理论逻辑,探索大语言模型赋能下图书馆参考咨询服务的应用场景,并根据咨询前期、中期、后期三个流程构建参考咨询服务体系。建议图书馆从加强多种技术的深层次嵌入、推行“引导+反馈”的交互服务模式、实现机器与馆员的协同合作、完善用户数据收集和分析机制等方面,推进大语言模型赋能图书馆参考咨询服务的发展。 展开更多
关键词 大语言模型 ChatGPT 智慧图书馆 参考咨询 AIGC
在线阅读 下载PDF
基于大语言模型技术的古籍限定域关系抽取及应用研究 被引量:2
7
作者 刘畅 张琪 +4 位作者 王东波 沈思 吴梦成 刘浏 苏雨诗 《情报学报》 北大核心 2025年第2期200-219,共20页
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟... 古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟待生成式人工智能技术的赋能。本研究探索了基于大语言模型的古籍领域限定域关系抽取方法和高质量训练语料自动生成方法。通过比较不同提示模板对模型抽取性能的影响,证明了微调方法对模型性能提升具有显著价值。基于ChatGPT4的API服务,结合自指令、思维链与人类反馈合成古籍限定域关系抽取数据集,在数据增强后于两种古籍关系抽取数据集上分别取得56.07%和30.50%的F1值,迁移能力较两种使用全部数据训练的模型均取得了显著提升。本研究还探索了协同使用自指令模型和自动评价模型合成训练语料和评价信息,并基于合成数据训练模型,有效缓解了训练数据不足的问题。研究结果表明,使用大语言模型抽取关系三元组与合成训练数据,能够显著降低过往限定域关系抽取的人力成本,有助于提升古籍领域知识图谱的构建效率。 展开更多
关键词 大语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文
在线阅读 下载PDF
基于大语言模型的智能汽车仿真测试 被引量:1
8
作者 朱冰 汤瑞 +4 位作者 赵健 张培兴 李文旭 李嘉胜 徐雪峰 《汽车工程》 北大核心 2025年第4期587-597,共11页
针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语... 针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语言模型的智能汽车仿真测试流程,针对知识问答型任务设计了知识挖掘、模型微调与知识库增强检索应用流程,针对场景生成任务设计了场景类型分析、场景要素生成、场景工具链调用的应用路径,针对测试评价型任务,设计了测试场景解析、评价体系构建与仿真测试执行综合应用框架;最后,对各任务进行了测试。结果证明,本文所提出的测试方法可以有效解决不同类型的测试任务,提升测试效率。 展开更多
关键词 智能汽车 仿真测试 大语言模型 场景生成 自动测试
在线阅读 下载PDF
基于大语言模型的重大慢病健康管理信息系统构建 被引量:1
9
作者 吴天星 曹旭东 +5 位作者 毕胜 陈亚 蔡平强 沙航宇 漆桂林 王昊奋 《计算机研究与发展》 北大核心 2025年第7期1653-1667,共15页
随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定... 随着全球人口老龄化和生活方式的变化,慢性病(慢病)的管理和治疗变得日益重要.慢病包括心血管疾病、糖尿病、慢性呼吸系统疾病等,它们通常需要长期甚至终身的健康管理,其核心在于制定和执行长期的健康计划,包括合理饮食、适量运动、定期检查和用药管理等.近年来,大语言模型在医疗领域取得了一定的进展,但并未关注慢病健康管理领域,因此在个性化健康管理建议方面缺乏对中国特定饮食习惯和文化背景的深入理解,在处理数字信息方面的能力有限.为解决这些问题,构建了基于大语言模型的重大慢病健康管理信息系统.其中,通过整合慢病基础知识、健康管理指导原则以及实际的健康管理计划作为领域数据,训练蜻蜓大模型作为系统的核心,用于健康相关问题的有效回答.此外,系统引入了工具增强策略,通过调用工具增强蜻蜓大模型对健康数据中数字信息的处理能力.同时,系统采用了基于不确定性知识图谱的检索增强生成技术,进一步提升蜻蜓大模型在答复慢病管理相关问题时的精确性和可信度.对基于大语言模型的重大慢病健康管理信息系统的测试实验显示,蜻蜓大模型在健康管理对话中的表现明显优于其他大语言模型,并验证了工具增强与检索增强方法的有效性. 展开更多
关键词 信息系统 大语言模型 健康管理 慢病 检索增强生成 蜻蜓
在线阅读 下载PDF
大语言模型安全的技术治理:对抗测试与评估审计 被引量:4
10
作者 周辉 郭烘佑 《西安交通大学学报(社会科学版)》 北大核心 2025年第2期78-88,共11页
人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风... 人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风险,为大语言模型的安全应用提供了关键保障。但是,目前缺少充足的算力保障、技术治理流程和标准缺乏统一性、平台技术治理易受商业利益影响等困境影响了技术治理方案的稳步实施。从优化技术治理框架、鼓励安全治理技术创新、明确流程与标准、构建多方参与的监督机制等方面提出完善安全技术治理机制的建议,以确保大语言模型的稳定与安全运行。 展开更多
关键词 人工智能 大语言模型 安全风险 技术治理 对抗测试 评估审计
在线阅读 下载PDF
基于智能插件和大语言模型的电力电子实验教学辅助设计方法 被引量:1
11
作者 陈宇 陈汉文 +1 位作者 祝之森 张蓉 《实验技术与管理》 北大核心 2025年第4期205-212,共8页
大语言模型(large language model,LLM)在一般性教学辅助、文科课程和计算机课程中得到成功应用,但应用于电力电子实验教学时存在电路拓扑图识别不准、关键信息缺失等问题。为此,该文提出基于智能插件和LLM的教学辅助设计方法:首先通过... 大语言模型(large language model,LLM)在一般性教学辅助、文科课程和计算机课程中得到成功应用,但应用于电力电子实验教学时存在电路拓扑图识别不准、关键信息缺失等问题。为此,该文提出基于智能插件和LLM的教学辅助设计方法:首先通过深度学习模型实现电路拓扑图识别,并将其转换为电路网表文本;然后向LLM提供网表文本及不同提示词,引导LLM实现网表检查、电路分析、文档生成、知识问答等教学功能,为教师提供高质量的教学设计起点。该方法有望减轻教师负担,提高实验教学的时效性和教学质量,为电力电子实验教学设计提供一种有用工具。 展开更多
关键词 新工科 电力电子技术 实验教学 大语言模型 电路拓扑图识别
在线阅读 下载PDF
网络媒体监督与企业环境责任行为的“多言寡行”——基于大语言模型的人工智能技术分类测度 被引量:1
12
作者 习明明 李婷 张卢千漪 《兰州大学学报(社会科学版)》 北大核心 2025年第3期159-176,共18页
在中国经济转型和绿色发展的背景下,企业是否履行环境责任日益受到关注。网络新闻媒体作为监督力量,在推动企业履行环境责任方面发挥了重要作用。基于2014—2023年中国沪深A股上市公司数据,研究网络新闻媒体监督对企业环境责任行为的影... 在中国经济转型和绿色发展的背景下,企业是否履行环境责任日益受到关注。网络新闻媒体作为监督力量,在推动企业履行环境责任方面发挥了重要作用。基于2014—2023年中国沪深A股上市公司数据,研究网络新闻媒体监督对企业环境责任行为的影响与作用机制。研究结果显示:网络新闻媒体监督能够促进企业履行环境责任,这一结论经过一系列稳健性检验后仍然成立。机制分析表明,网络新闻媒体主要通过加剧融资约束和提高企业环境关注度将企业的环境外部性内部化,从而实现对企业环境责任行为的促进效应。异质性分析发现,网络新闻媒体的监督作用在规模较大、位于东部地区、产权性质为国有的企业中表现更明显。进一步分析发现,网络新闻媒体监督促使企业在环境责任行为上表现出“多言寡行”的特征,而政府外部规制可以有效缓解企业环境责任的“敷衍”行为,纠正企业生产的负外部性,推动企业实现“言行一致”。 展开更多
关键词 网络新闻媒体 环境责任行为 政府环境规制 大语言模型
在线阅读 下载PDF
融合大语言模型的情报智库政策内容问答服务研究——以粮食安全政策为例 被引量:1
13
作者 刘彦辉 张海涛 +1 位作者 周红磊 庞宇飞 《图书与情报》 北大核心 2025年第1期9-20,共12页
2025年初,我国发布的DeepSeek-R1推理模型,促进了普惠化AI时代的到来,如何将智能技术有效融入情报智库以提升其服务响应能力,并基于特定领域数据进行服务场景的验证,实现理论到实践的有效衔接,已成为情报智库实践中亟待解决的关键问题... 2025年初,我国发布的DeepSeek-R1推理模型,促进了普惠化AI时代的到来,如何将智能技术有效融入情报智库以提升其服务响应能力,并基于特定领域数据进行服务场景的验证,实现理论到实践的有效衔接,已成为情报智库实践中亟待解决的关键问题。文章聚焦于以大语言模型赋能情报智库政策内容问答服务,首先分析了情报智库的政策内容问答服务任务,探讨了大语言模型在该场景下的可行性;其次设计了融合大语言模型的情报智库粮食安全政策内容问答服务方案;最后以粮食安全政策文本为核心数据源,对方案进行了实证研究。通过从政策文本提取要素与要素关系构建数据集,采用LoRA方法微调DeepSeek模型,将其接入LangChain框架,同时挂载本地知识库,形成完整的服务方案。结果表明,该方案具有较高的可行性和专业性,为情报智库在特定领域实现政策内容问答的场景服务提供了重要的理论依据与实践支持。 展开更多
关键词 大语言模型 粮食安全 政策内容问答 情报智库服务 知识库
在线阅读 下载PDF
多模态大语言模型的安全性研究综述 被引量:2
14
作者 陈晋音 席昌坤 +2 位作者 郑海斌 高铭 张甜馨 《计算机科学》 北大核心 2025年第7期315-341,共27页
随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模... 随着大型语言模型的快速发展,多模态大语言模型因其在语言、图像等多种模态上的卓越表现而备受瞩目。其不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域。与传统的大型语言模型相比,多模态大语言模型由于更接近于多资源的现实世界应用以及多模态处理的复杂性而具有巨大的潜力和挑战。然而,多模态大语言模型的脆弱性研究相对较少,这些模型在实际应用中面临着诸多安全性挑战。为此,对多模态大语言模型尤其是大型视觉-语言模型的安全性进行了全面调查。首先,概述了多模态大语言模型的基本结构和发展历程;其次,讨论了多模态大语言模型在使用全周期的安全风险成因,分析了模型结构与安全风险之间的关联性;再次,系统总结了当前在多模态大语言模型图像和文本安全性的评估方面所做的工作,包括模型幻觉、隐私安全、偏见和鲁棒性4个方面,并将针对多模态大语言模型的攻击分为越狱攻击、对抗攻击、后门攻击和中毒攻击;然后,综合概述了一系列针对多模态大语言模型幻觉、隐私泄露和偏见等威胁的可信增强方法以及针对模型恶意攻击的防御措施;最后,讨论了多模态大语言模型安全性研究的主要机遇与挑战,为研究人员在多模态大语言模型的复杂应用和研究领域提供了指导建议。 展开更多
关键词 模态大语言模型 安全 幻觉 对抗 越狱 防御
在线阅读 下载PDF
知识冲突:大语言模型教育应用的挑战与应对 被引量:2
15
作者 陈向东 周春红 +1 位作者 刘泽民 张靖沅 《中国电化教育》 北大核心 2025年第3期1-10,共10页
大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突... 大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突的技术成因,包括训练数据中的噪声、参数化知识表示的局限、推理机制的缺陷、模型架构的先天不足以及外部知识的偏差,并探讨了这些因素对大语言模型教育应用的深层影响。针对这一挑战,论文提出了多维度的解决路径:通过数据增强优化知识表示,利用提示强化上下文的连贯,开发量规完善模型评估。同时,研究从社会文化的宏观视角进一步剖析了知识冲突的外部驱动因素,探讨如何在多元异质、动态演进的社会建构语境中,构建开放进取、兼容融通的智能教育应用体系。知识冲突的有效化解不仅可以显著提升大语言模型在教育场景中的应用价值,更将为人工智能在更广泛领域的可持续发展奠定坚实基础。研究旨在为解决这一问题提供理论洞见与实践指引,促进教育人工智能技术的可靠性、适应性和普及性的不断提升。 展开更多
关键词 大语言模型 知识冲突 教育应用 训练数据 社会建构
在线阅读 下载PDF
大语言模型应用中的司法偏误与认知干预 被引量:2
16
作者 李学尧 《政治与法律》 北大核心 2025年第5期65-76,共12页
近期的实验研究和司法实践都表明,单纯依赖简单的人机协作,难以有效遏制法官在自我确认偏误与大语言模型“强化输出”之间的共振效应。为避免大语言模型在司法实践中沦为单向度的技术支配,在挖掘传统法学方法论中关于多元价值论证的基础... 近期的实验研究和司法实践都表明,单纯依赖简单的人机协作,难以有效遏制法官在自我确认偏误与大语言模型“强化输出”之间的共振效应。为避免大语言模型在司法实践中沦为单向度的技术支配,在挖掘传统法学方法论中关于多元价值论证的基础上,可结合认知科学的防偏误机制,提出“认知协同司法决策模型(六步法)”。该模型通过在确立争点、规范检索、事实认定、裁判形成、价值审查与最终公开说理的全流程中引入对立论证、逆向思维、强制反驳清单等操作环节,帮助法官保持深度审查与反思能力,抵消大语言模型单一输出的强化效应。案例模拟表明,这一模型在提升信息搜索效率的同时,能够强化裁判对社会多元价值的考量,确保法官主体地位与裁判公正性。 展开更多
关键词 大语言模型 机器权威 法学方法论 认知科学 认知协同决策
在线阅读 下载PDF
基于大语言模型的自动代码修复综述
17
作者 许鹏宇 况博裕 +1 位作者 苏铓 付安民 《计算机研究与发展》 北大核心 2025年第8期2040-2057,共18页
软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件... 软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向. 展开更多
关键词 自动代码修复 大语言模型 代码大语言模型 软件缺陷 补丁生成
在线阅读 下载PDF
大语言模型的偏见挑战:识别、评估与去除 被引量:1
18
作者 徐月梅 叶宇齐 何雪怡 《计算机应用》 北大核心 2025年第3期697-708,共12页
针对大语言模型(LLM)输出内容存在偏见而导致LLM不安全和不可控的问题,从偏见识别、偏见评估和偏见去除3个角度出发深入梳理和分析现有LLM偏见的研究现状、技术与局限。首先,概述LLM的三大关键技术,从中分析LLM不可避免存在内隐偏见(Int... 针对大语言模型(LLM)输出内容存在偏见而导致LLM不安全和不可控的问题,从偏见识别、偏见评估和偏见去除3个角度出发深入梳理和分析现有LLM偏见的研究现状、技术与局限。首先,概述LLM的三大关键技术,从中分析LLM不可避免存在内隐偏见(Intrinsic Bias)的根本原因;其次,总结现有LLM存在的语言偏见、人口偏见和评估偏见三类偏见类型,并分析这些偏见的特点和原因;再次,系统性回顾现有LLM偏见的评估基准,并探讨这些通用型评估基准、特定语言评估基准以及特定任务评估基准的优点及局限;最后,从模型去偏和数据去偏2个角度出发深入分析现有LLM去偏技术,并指出它们的改进方向,同时,分析指出LLM偏见研究的3个方向:偏见的多文化属性评估、轻量级的偏见去除技术以及偏见可解释性的增强。 展开更多
关键词 大语言模型 偏见溯源 偏见识别 偏见评估 偏见去除
在线阅读 下载PDF
文化冲突:大语言模型教育应用中的张力与调适 被引量:1
19
作者 陈向东 卢淑怡 易乐湘 《远程教育杂志》 北大核心 2025年第3期3-15,43,共14页
凭借其卓越的知识处理能力和个性化学习支持,大语言模型正逐步重塑教育生态。然而,这一技术创新同样伴随着深层次的文化冲突,尤其在跨文化或多元文化的教育环境中,神经网络和大模型固有的文化偏差与多样化教育需求之间的错位,已成为制... 凭借其卓越的知识处理能力和个性化学习支持,大语言模型正逐步重塑教育生态。然而,这一技术创新同样伴随着深层次的文化冲突,尤其在跨文化或多元文化的教育环境中,神经网络和大模型固有的文化偏差与多样化教育需求之间的错位,已成为制约其教育效能的重要因素。研究通过对大语言模型在教育应用中的多维度分析,从技术与文化的双重视角,系统探讨了三类典型的文化冲突:内容层面的“教什么”,过程层面的“怎么教”,以及技术层面的“用什么教”。基于此分析,研究提出了一系列缓解文化冲突的策略:充分发掘大语言模型的“世界知识”、有效利用模型的参数化知识特征、汲取不同文化和群体的语料、构建跨文化评估和检测机制以及规范大语言模型教育应用的伦理。在此基础上,研究进一步探讨了目前应对文化冲突的一种截然不同的策略——主权AI,以反映大模型教育推进过程中全球化与本土化之间的复杂纠结。文化冲突是大语言模型教育应用中不可回避的挑战,亟须在全球教育实践中得到有效应对。通过应对这一挑战,大语言模型有望为全球教育提供更加包容、有效的支持,在推动技术创新的同时,促进文化共融与理解。 展开更多
关键词 大语言模型 教育应用 文化冲突 教育公平 主权人工智能
在线阅读 下载PDF
知识图谱与大语言模型协同共生模式及其教育应用综述 被引量:1
20
作者 李晓理 刘春芳 耿劭坤 《计算机工程与应用》 北大核心 2025年第15期1-13,共13页
近年,人工智能技术,特别是大语言模型、知识图谱技术的迅速发展,为教育的数字化、智能化转型提供了重要的技术条件。分别分析了大语言模型与知识图谱两技术在智能教育领域的应用优势、现状以及存在的问题。在此基础上,深入探讨了知识图... 近年,人工智能技术,特别是大语言模型、知识图谱技术的迅速发展,为教育的数字化、智能化转型提供了重要的技术条件。分别分析了大语言模型与知识图谱两技术在智能教育领域的应用优势、现状以及存在的问题。在此基础上,深入探讨了知识图谱与大语言模型的协同共生模式,包括两者相互增强的方式方法,并对协同技术研究现状进行了归纳分析,总结了近年来在教育领域的相关应用。最后,对知识图谱与大语言模型技术联合应用于教育领域的发展趋势进行了总结与展望。 展开更多
关键词 知识图谱(KG) 大语言模型(LLM) 智能教育
在线阅读 下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部