期刊文献+
共找到1,103篇文章
< 1 2 56 >
每页显示 20 50 100
大语言模型赋能区块链服务安全研究综述:现状、挑战与机遇(特邀)
1
作者 林丹 卢顺峰 +5 位作者 刘姿妍 张博昭 何龙 蒋子规 吴嘉婧 郑子彬 《计算机工程》 北大核心 2026年第1期1-21,共21页
区块链已逐渐发展成支撑数字经济的重要基础设施,但其匿名性、跨链互操作性、多方参与等特征,导致诈骗、洗钱与攻击等安全事件频发,严重威胁生态系统的稳定与合规。尽管现有分析工具与方法在区块链服务安全领域取得了一定进展,但仍普遍... 区块链已逐渐发展成支撑数字经济的重要基础设施,但其匿名性、跨链互操作性、多方参与等特征,导致诈骗、洗钱与攻击等安全事件频发,严重威胁生态系统的稳定与合规。尽管现有分析工具与方法在区块链服务安全领域取得了一定进展,但仍普遍存在泛化能力不足、推理能力有限、难以适应复杂业务逻辑演化等问题。与此同时,生成式大语言模型(LLM)的快速发展正在深刻重塑服务计算范式,其在自然语言理解、知识推理与多模态融合等方面的优势,为区块链服务安全研究提供了新的思路与技术路径。系统梳理LLM在事前智能合约审计、事中异常行为检测、事后多链行为关联任务中的应用进展,归纳其优势与局限,总结LLM赋能区块链服务安全的典型实践。最后,展望LLM赋能区块链服务安全面临的开放科学问题与未来研究方向,为构建可信、可解释、高效的区块链服务计算与治理体系提供参考。 展开更多
关键词 区块链 大语言模型 服务安全 智能合约审计 异常行为检测 多链行为关联
在线阅读 下载PDF
基于协同专家系统的建筑施工大语言模型问答系统
2
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 大语言模型 本地知识库
在线阅读 下载PDF
大语言模型的外部审计应用:影响效应与伦理风险
3
作者 吴勇 丁晓月 +1 位作者 郭秋梦 朱卫东 《财会月刊》 北大核心 2026年第1期79-86,共8页
大语言模型(LLMs)正颠覆外部审计运作模式与职业实践,厘清其影响效应与伦理风险是推动审计行业数字化转型、保障审计质量的关键。本研究通过整合动态能力理论与社会存在理论,构建LLMs外部审计应用影响效应的集成理论分析框架,揭示其正... 大语言模型(LLMs)正颠覆外部审计运作模式与职业实践,厘清其影响效应与伦理风险是推动审计行业数字化转型、保障审计质量的关键。本研究通过整合动态能力理论与社会存在理论,构建LLMs外部审计应用影响效应的集成理论分析框架,揭示其正反双面影响特征以完善对LLMs的价值认知体系;结合LLMs技术特性,聚焦外部审计典型场景,诠释其功能适配性与应用路径;从客观性、保密性、问责机制三个维度,深入剖析LLMs审计应用面临的伦理风险,并从制度、技术和人员三个层面提出针对性应对策略。研究结果可为审计监管机构制定针对性监管政策与应用指南提供依据,亦可为会计师事务所高效应用AI技术赋能审计工作提供实践指导。 展开更多
关键词 大语言模型 外部审计 影响效应 伦理风险
在线阅读 下载PDF
基于大语言模型的SQL注入漏洞检测载荷生成方法
4
作者 顾兆军 李丽 隋翯 《信息网络安全》 北大核心 2026年第2期274-290,共17页
针对现有SQL注入漏洞检测方法存在鲁棒性不足以及测试用例缺乏针对性等问题,文章提出一种基于大语言模型的SQL注入漏洞检测载荷生成方法。该方法通过生成针对性的检测载荷实现SQL注入漏洞检测,借助提示工程与DeepSeek-V3模型自动提取和... 针对现有SQL注入漏洞检测方法存在鲁棒性不足以及测试用例缺乏针对性等问题,文章提出一种基于大语言模型的SQL注入漏洞检测载荷生成方法。该方法通过生成针对性的检测载荷实现SQL注入漏洞检测,借助提示工程与DeepSeek-V3模型自动提取和统一构建漏洞特征;利用贡献度对漏洞特征进行分析和选择,构建模型的核心输入;通过将关键特征组织成思维链的形式促进多维度漏洞表征融合,并采用低秩适配技术对Qwen模型进行领域自适应监督微调。实验在多个公开漏洞靶场中验证Qwen模型与SqliGPT、GPT-2-web和SQLMap等模型的性能差异和生成质量,并深入分析DeepSeek-V3模型在复杂SQL注入漏洞数据中的特征提取能力。实验结果表明,Qwen模型的平均检测准确率达到75%以上,比SqliGPT、GPT-2-web和SQLMap模型分别提升49.18%、59.64%和15.19%,且载荷生成质量显著优于现有模型,证明了基于大语言模型生成检测载荷,实现SQL注入漏洞检测方法的有效性与优越性。 展开更多
关键词 大语言模型 SQL注入漏洞 代码生成 检测载荷
在线阅读 下载PDF
元语言、思想语法及大语言模型语法的哲学评论
5
作者 赵汀阳 《语言战略研究》 北大核心 2026年第1期5-15,共11页
语言的系统性质需要通过元语言来反思。数理逻辑虽能反思任何语句的真值关系,但因语义域狭窄而无法成为思想所有值域的元语言;维特根斯坦的“语言游戏”是一种将语义转换为用法集合的元语言,优势是为语义提供了确定可查询的外部参照,但... 语言的系统性质需要通过元语言来反思。数理逻辑虽能反思任何语句的真值关系,但因语义域狭窄而无法成为思想所有值域的元语言;维特根斯坦的“语言游戏”是一种将语义转换为用法集合的元语言,优势是为语义提供了确定可查询的外部参照,但只反思了规则的性质,没有能力反思语言的思想性;人工智能的大语言模型开发了一种另类元语言,以相关性(标识之间在概率上的最优链接)和演化性(以贝叶斯方法持续微调相关性的可信度)发展出一种经验主义的标识语法。虽然大语言模型能够处理一切关系,但标识系统与语言之间的一一对应映射仍然不能表达事物的整体性,缺乏对事物及世界的理解。思想的本质是去“选择”某种“未来”,据此本文设想了另一种思想语法和元语言,以“否定词”与“动词”作为反思和解释任何语义的根据,以否定词来保证“选择”功能,由动词来建构“未来”,因此有望将映射升级为理解整体性的“态射”,或可能是可用于实现新一代人工智能的“世界模型”的一个方法论,其思想能力的优势在于既敞开无穷可能性也能够解释因果性,而且可在自然语言内部实现对任何语言的反思,因此是一种更优的元语言。 展开更多
关键词 语言 思想语法 动词思维 否定词 大语言模型
在线阅读 下载PDF
谁更像“人”?模型类型与人格设定对大语言模型复刻传播学实验准确率的影响
6
作者 曾秀芹 陈珂璐 《新闻与传播评论》 北大核心 2026年第1期25-39,共15页
以ChatGPT-4o、DeepSeek-R1、豆包-1.5、Kimi-K1.5四种主流大语言模型为对象,采用2(有vs.无大五人格设定)×4(模型类型)实验设计,构建虚拟被试资料以复刻新闻传播学实验。结果显示,各模型拟合表现存在差异:DeepSeek-R1在模拟真人平... 以ChatGPT-4o、DeepSeek-R1、豆包-1.5、Kimi-K1.5四种主流大语言模型为对象,采用2(有vs.无大五人格设定)×4(模型类型)实验设计,构建虚拟被试资料以复刻新闻传播学实验。结果显示,各模型拟合表现存在差异:DeepSeek-R1在模拟真人平均趋势与行为变异性方面最优;ChatGPT-4o的总体方差拟合偏差较大,但主效应、间接效应复刻的准确性与稳定性较为突出。人格设定的影响方面,无大五人格组描述性统计更贴近真人,而有大五人格组因果效应复刻更稳定,唯一完整复刻两个主效应的模型即来自该组。中介效应复刻成功率偏低,但人格设定可在一定程度上缓解模型输出的方向与效应偏离趋势。此外,研究基于ChatGPT-4o进一步发现,实验对象类型(真人组vs.无大五人格组vs.有部分大五人格组vs.有全部大五人格组)对主效应与中介机制部分产生显著调节作用,其中大五人格设定可一定程度抑制模型极端响应。研究实现多模型横向比较与人格设定控制下的复刻实验,验证了大五人格设定对提升模型模拟精度的积极作用,同时指出模型复刻复杂心理机制的局限性,推动传播学实验向“人机共演”的新范式转变,也拓展“媒介即延伸”在智能传播语境下的现实外延。 展开更多
关键词 大语言模型 大五人格 复刻研究 硅基被试
在线阅读 下载PDF
“零样本语言学习”:大语言模型能“像人一样”习得语境中的情感吗?
7
作者 吴诗玉 王亦赟 《心理学报》 北大核心 2026年第2期308-322,共15页
本研究旨在检验大语言模型(LLMs)能否在“零样本”条件下通过阅读附带习得单词所出现的语境情感,并评估情感效价与语境变异性对词汇学习的影响。研究采用跨模型-人类对比,4种LLMs与3组学习者在统一材料中学习嵌入不同情感(积极/中性/消... 本研究旨在检验大语言模型(LLMs)能否在“零样本”条件下通过阅读附带习得单词所出现的语境情感,并评估情感效价与语境变异性对词汇学习的影响。研究采用跨模型-人类对比,4种LLMs与3组学习者在统一材料中学习嵌入不同情感(积极/中性/消极)与重复/变化语境的目标词,并以多项测试衡量情感迁移及词形、词义习得效果。结果显示,LLMs与人类模式一致,能将语境情感迁移至目标词,并在语言生成中保持情感一致;而且也呈现“积极情感优势”“语境变异优势”,且在定义生成中出现语境情感与语境变异的交互效应。文章提出“双重机制框架”,认为LLMs在功能层面具备类人的情感语义学习能力,但其机制基于统计共现与向量优化,异于人类的具身与社会加工。本研究为情感计算、人机交互伦理与词汇教学提供启示。 展开更多
关键词 大语言模型 零样本学习 情感学习
在线阅读 下载PDF
基于大语言模型的多智能体系统异常综述(特邀)
8
作者 张珑耀 温东新 +4 位作者 马庄宇 舒燕君 李庆 刘明义 左德承 《计算机工程》 北大核心 2026年第1期22-32,共11页
基于大语言模型(LLM)的多智能体系统(MAS)虽在处理复杂任务方面展现出巨大潜力,但其分布式特性与交互不确定性易引发多样化异常,威胁系统可靠性。为系统化识别并分类此种异常,进行全面综述。研究选取7个代表性MAS及相应数据集,收集1341... 基于大语言模型(LLM)的多智能体系统(MAS)虽在处理复杂任务方面展现出巨大潜力,但其分布式特性与交互不确定性易引发多样化异常,威胁系统可靠性。为系统化识别并分类此种异常,进行全面综述。研究选取7个代表性MAS及相应数据集,收集13418段运行轨迹,采用LLM初步分析与专家人工校验相结合的方法进行数据分析。构建一个涵盖模型理解感知异常、智能体交互异常、任务执行异常和外部环境异常4个层级的细粒度异常分类框架,并结合典型案例揭示各类异常产生的内在逻辑与外部诱因。统计分析显示:模型理解感知异常占比最高,其中“上下文幻觉”和“任务指令误解”是主要问题;智能体交互异常占16.8%,“信息隐瞒”是主因;任务执行异常占27.1%,主要表现为“决策重复出错”;外部环境异常占18.3%,以“记忆冲突”为主。此外,模型理解感知异常作为根源性诱因,引发其他层级的异常,凸显了提升模型基础能力的重要性。此分类和根源分析旨在为构建高可靠的基于LLM的MAS提供理论支撑与实践参考。 展开更多
关键词 大语言模型 智能体 多智能体系统 异常统计 异常分类
在线阅读 下载PDF
大语言模型智能体操作系统研究综述
9
作者 郭陆祥 王越余 +4 位作者 李芊玥 李莎莎 刘晓东 纪斌 余杰 《计算机科学》 北大核心 2026年第1期1-11,共11页
大语言模型智能体操作系统,也叫智能体操作系统,是整合大模型、工具资源以及多智能体协同的核心平台,目前正逐渐成为推动通用人工智能发展的一个关键研究方向。对智能体操作系统领域的研究进展进行了系统梳理,首先从基础理论着手,回顾... 大语言模型智能体操作系统,也叫智能体操作系统,是整合大模型、工具资源以及多智能体协同的核心平台,目前正逐渐成为推动通用人工智能发展的一个关键研究方向。对智能体操作系统领域的研究进展进行了系统梳理,首先从基础理论着手,回顾了多种大模型的演进情况以及智能体和传统操作系统领域的进展;接着,围绕典型体系结构,如AIOS等,阐述了其分层架构与模块化设计是怎样达成资源管理与智能调度的。进一步地,明确了当前智能体操作系统在上下文整合、扩展性以及安全性等方面面临的技术挑战,同时也提出了未来借助轻量化设计、自监督学习机制以及动态调度算法来提升多智能体协作效率。该研究的主要贡献为,将那些分散的研究给予整合,促使技术框架变得更为明晰,并指出了智能体操作系统对新兴体系以及行业定制化实践覆盖不全面的情况。未来的研究需要侧重推动跨域智能体操作系统自我进化的能力,并且加快其在各个领域的落地等。 展开更多
关键词 大语言模型 智能体操作系统 通用人工智能 智能体 传统操作系统
在线阅读 下载PDF
护理科研中应用大语言模型的伦理风险与应对策略
10
作者 金孔军 孙一勤 +1 位作者 徐水琴 李辞 《护理研究》 北大核心 2026年第1期102-107,共6页
系统概述大语言模型在护理学术科研中的应用现状,分析其可能会对科研过程带来的伦理风险,从技术、制度和使用者3个层面列举伦理风险出现的影响因素,并从技术研发者角度、使用者角度、管理者角度、社会角度4个层面提出伦理应对策略,从而... 系统概述大语言模型在护理学术科研中的应用现状,分析其可能会对科研过程带来的伦理风险,从技术、制度和使用者3个层面列举伦理风险出现的影响因素,并从技术研发者角度、使用者角度、管理者角度、社会角度4个层面提出伦理应对策略,从而促进大语言模型在护理科研中规范化应用。 展开更多
关键词 大语言模型 护理 伦理 护理科研 应对策略
在线阅读 下载PDF
大语言模型在肿瘤诊断中的文字报告与医学影像应用研究进展
11
作者 程浩然 严鸿斌 +3 位作者 袁子云 庄泽鸿 孙学刚 姚学清 《南方医科大学学报》 北大核心 2026年第1期231-238,共8页
大语言模型(LLMs)作为新兴人工智能技术,凭借其优异的文字与图像处理能力,为医疗领域智能化变革提供核心支撑,显著提升临床工作效率与质量。本文系统梳理LLMs在癌症诊断领域的应用现状、技术特点及发展方向,重点聚焦两大核心场景:一是... 大语言模型(LLMs)作为新兴人工智能技术,凭借其优异的文字与图像处理能力,为医疗领域智能化变革提供核心支撑,显著提升临床工作效率与质量。本文系统梳理LLMs在癌症诊断领域的应用现状、技术特点及发展方向,重点聚焦两大核心场景:一是影像报告、病理报告、综合病例报告等文字报告的自动化分析与解读;二是融合文本与医学影像的多模态数据诊断。研究发现,LLMs在癌症诊断中的综合能力已可媲美普通住院医师,但在专业化诊断与精准化判断方面仍存在明显短板;同时,LLMs展现出“小参数模型适配基层场景”“多语言报告分析泛用性差异”等应用层面特征。未来需进一步开发专业化、实用化的医疗专用LLMs,通过优化微调策略、构建高质量中文医疗数据集、整合视觉语言模型等方式,推动其临床落地并弥合医疗资源差距。 展开更多
关键词 大语言模型 人工智能 肿瘤诊断 病理学 影像学
在线阅读 下载PDF
大语言模型幻觉检测方法综述
12
作者 李自拓 孙建彬 +5 位作者 陈广州 方馨悦 崔瑞靖 田植良 黄震 杨克巍 《计算机研究与发展》 北大核心 2026年第1期123-146,共24页
近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucinati... 近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。 展开更多
关键词 幻觉检测 大语言模型 事实一致性 文本生成 自然语言处理
在线阅读 下载PDF
基于检索增强生成技术的脾胃病大语言模型问答研究
13
作者 吴恙 于彤 +6 位作者 于琦 芦煜 张谢华 霍赛楠 陈靖耀 张竹绿 李敬华 《世界中医药》 北大核心 2025年第19期3516-3523,共8页
目的:开展基于检索增强生成(RAG)技术的脾胃病大语言模型研究,以促进中医药垂直领域大语言模型问答的发展。方法:应用开源平台FastGPT构建脾胃病的知识库,运用大语言模型、RAG技术提供脾胃病的相关的知识问答。结果:形成RAG技术大语言... 目的:开展基于检索增强生成(RAG)技术的脾胃病大语言模型研究,以促进中医药垂直领域大语言模型问答的发展。方法:应用开源平台FastGPT构建脾胃病的知识库,运用大语言模型、RAG技术提供脾胃病的相关的知识问答。结果:形成RAG技术大语言模型问答,选择智谱大语言模型(GLM4)、中文微调聊天大语言模型(Llama3-8B-Chinese-Chat)、通义千问大语言模型(Qwen32b)为基座模型,并分别联合RAG技术进行了客观题、主观题方面问答的对比,结果表明基座模型联合RAG技术在脾胃病问答的客观题、主观题方面的效果均有显著提升。结论:基于RAG技术的脾胃病大语言模型问答可向用户提供较为准确、完整、相关的脾胃病知识。 展开更多
关键词 大语言模型 检索增强生成 脾胃病 知识库 知识问答 智谱大语言模型 中文微调聊天大语言模型 通义千问大语言模型
在线阅读 下载PDF
大语言模型混合量化压缩与加速推理技术
14
作者 尹经纬 李志强 刘裕彤 《计算机工程与设计》 北大核心 2026年第1期187-194,共8页
大语言模型已广泛应用于日常学习、工作和生活中,但由于其参数规模庞大、资源消耗高,且推理高度依赖GPU,这严重制约其推广。针对上述问题,论文在CPU环境下提出基于离群特征优化的混合INT8量化方法,充分发挥其在模型压缩中的优势;同时,... 大语言模型已广泛应用于日常学习、工作和生活中,但由于其参数规模庞大、资源消耗高,且推理高度依赖GPU,这严重制约其推广。针对上述问题,论文在CPU环境下提出基于离群特征优化的混合INT8量化方法,充分发挥其在模型压缩中的优势;同时,基于注意力机制在文本首尾集中分布的规律,设计高效的参数快速读取机制。两种方法的有机结合显著减少模型内存消耗和提升推理效率,为解决大语言模型在边缘计算环境中的应用瓶颈提供新的技术方案。在I7-13700 CPU环境下,基于LLaMA2、GPT-J和FSEQ大模型,使用C4、Wikitext和PG19数据集进行全面验证,结果充分验证了所提方法的优越性与实用价值。 展开更多
关键词 大语言模型 离群参数 混合量化 注意力机制 参数快速读取 模型推理 边缘计算
在线阅读 下载PDF
饮茶对胃肠道疾病风险的双重作用:基于可解释机器学习与大语言模型的联合预测辅助模型
15
作者 陈君尧 陈泽宇 +5 位作者 林钊杰 方梦浩 沈超英 许琦 张晓怡 卢鲁 《南方医科大学学报》 北大核心 2026年第2期353-361,共9页
目的探究饮茶、饮酒等生活习惯对胃肠疾病的影响与关联关系,并以此建立胃肠疾病早期风险预测和辅助问诊大模型,实现早期胃肠道疾病高风险识别与智能诊疗推荐。方法对安溪县中医院消化内镜中心同时进行胃镜检查与13C尿素呼气试验的患者... 目的探究饮茶、饮酒等生活习惯对胃肠疾病的影响与关联关系,并以此建立胃肠疾病早期风险预测和辅助问诊大模型,实现早期胃肠道疾病高风险识别与智能诊疗推荐。方法对安溪县中医院消化内镜中心同时进行胃镜检查与13C尿素呼气试验的患者进行调查研究。先对数据进行标量分析,以确定特征选取是否合适。将数据按7∶3随机分为训练集和测试集,应用人工智能和机器学习方法:支持向量机、K近邻、逻辑回归、随机森林极限梯度提升和深度神经网络(DNN),以寻找最佳分类器用于预测胃肠道高风险病症。使用贝叶斯优化算法,获取6种模型的最优超参数组合,进行模型拟合,并应用Shapley加法解释方法对最佳模型进行可解释性分析。选用DeepSeek-R1为基础语言模型,利用胃肠病与中文医疗在线问诊数据集进行参数微调,构建更契合临床实际需求的胃肠疾病问诊大语言模型。结果本次调查纳入502人,所选取特征与肠胃疾病均具有一定关联性,但仅有年龄特征与胃肠道疾病呈线性相关性(β=0.023,SE=0.008,t=2.942,P=0.003)。最佳模型为DNN模型,其准确率为0.68、精确性为0.68、召回率为0.85、F1值为0.75、AUC为0.74。基于DNN模型进行特征重要性排序,前3名为年龄、DOB值和烟龄;构建大语言模型与实际专业医师根据胃镜检查结果所提供的建议高度一致。结论基于DNN机器学习方法构建的胃肠疾病风险预测模型最佳,可为临床胃肠道疾病进行风险预测并对是否进行胃肠镜检查提供可靠依据,同时表明预防胃肠道疾病发生需禁烟少酒、合理饮茶。构建的肠胃问诊大语言模型可为患者提供更为专业的医学指导,具有较强的临床实用价值。 展开更多
关键词 胃肠道疾病 幽门螺旋杆菌 机器学习 风险预测 大语言模型
在线阅读 下载PDF
基于大语言模型的世界鱼类拉汉对偶翻译
16
作者 钱建硕 丁刘勇 +3 位作者 李雁羽 陈晋南 王环珊 何德奎 《湖泊科学》 北大核心 2026年第1期425-434,I0054-I0059,共16页
物种名是生物分类学的核心概念,是认识和描述生物多样性的前提。拉丁种名的命名具有语言独立性、规范性和唯一性,不受地域和语言差异影响,确保跨语言、跨学科交流的准确性;但物种地方名(俗名)缺少命名规则,融合了历史与文化传统,往往存... 物种名是生物分类学的核心概念,是认识和描述生物多样性的前提。拉丁种名的命名具有语言独立性、规范性和唯一性,不受地域和语言差异影响,确保跨语言、跨学科交流的准确性;但物种地方名(俗名)缺少命名规则,融合了历史与文化传统,往往存在误用、混乱甚至是缺失的情况,特别是在鱼类中,约20%的物种缺少中文名,严重制约了生物多样性认知、跨语言交流、科学传播和数据共享与利用等。为应对这一问题,本研究整合《拉汉世界鱼类系统名典》等多个权威数据源,构建了60564条高质量拉丁学名与中文名双语平行语料库。基于多语言大模型mT5(multilingual text-to-text transfer transformer,包含small、base、large三种参数规模),引入对偶学习框架与命名规则约束,实现鱼类中文名的自动生成与校正。结果显示,微调后的mT5-large模型在独立测试集上获得的BLEURT和COMET的对偶译质评分分别为0.90和0.93,较DeepSeek-R1等通用大语言模型提升38%~159%,并将低频属名与新描述种名的翻译错误率降低25%~80%。所有生成的鱼类中文名均由分类学专家逐条审定,以确保命名的科学性和规范性。本研究首次系统性地补全了全球鱼类的中文名系统,打通了物种学名与俗名之间的信息壁垒;并开发配套微信小程序面向所有用户开放,实时更新种名信息和分类变动。研究方法为其他生物类群的多语言俗名翻译提供了可复制、可推广的技术范式,助力全球生物多样性与文化多样性保护实践。 展开更多
关键词 双命名法 鱼类命名编目 对偶学习 mT5大语言模型
在线阅读 下载PDF
基于大语言模型的用户行为特征识别可解释性方法研究
17
作者 王振宇 平一方 +1 位作者 肖桐 王建民 《情报杂志》 北大核心 2026年第1期118-127,共10页
[目的]当前用户行为分析多聚焦于结果预测,缺乏对行为特征的深度解释与研判路径,难以满足信息资源管理中对数据透明性与决策可控性的需求。为此,本文提出一种融合大语言模型与可解释性机制的用户行为特征识别方法,以实现行为特征的精确... [目的]当前用户行为分析多聚焦于结果预测,缺乏对行为特征的深度解释与研判路径,难以满足信息资源管理中对数据透明性与决策可控性的需求。为此,本文提出一种融合大语言模型与可解释性机制的用户行为特征识别方法,以实现行为特征的精确识别与影响因素的可解释分析。[方法]以MOOC在线学习平台的用户行为数据为研究对象,采集9000名学习者的多模态数据,构建融合文本语义与情感特征的用户行为特征体系。采用BERT模型进行语义特征提取,结合LightGBM模型实现用户行为分类,并引入SHAP方法对特征贡献进行可解释性分析,从而揭示影响行为识别的重要因素。[结果/结论]实验结果表明,该方法在用户行为识别任务中表现优异,准确率、召回率和F1值分别达到99.52%、99.98%和99.27%。可解释性分析结果显示,用户完成率与情感特征在行为识别与模式分类中具有显著影响。研究表明,该方法可有效提升用户行为分析的透明度与可解释性,为智能教育系统、用户画像构建及行为预测提供新的方法支持与技术路径。 展开更多
关键词 大语言模型 用户行为识别 可解释性人工智能 信息资源管理 行为数据挖掘
在线阅读 下载PDF
大语言模型压缩综述
18
作者 郭晋阳 贺昌义 +1 位作者 杨戈 刘祥龙 《计算机科学与探索》 北大核心 2026年第1期1-20,共20页
大语言模型由于强大的认知能力,在多个领域得到了广泛应用,成为人工智能领域的研究热点。然而,大语言模型对计算、存储资源的巨大需求,使其难以在资源受限的情境下使用。模型压缩与加速技术成为解决这一问题的关键手段,旨在保持模型性... 大语言模型由于强大的认知能力,在多个领域得到了广泛应用,成为人工智能领域的研究热点。然而,大语言模型对计算、存储资源的巨大需求,使其难以在资源受限的情境下使用。模型压缩与加速技术成为解决这一问题的关键手段,旨在保持模型性能的前提下,降低计算复杂度和存储成本。基于此,对大语言模型压缩与加速技术的前沿研究进行了全面的综述,旨在把握整个领域的发展现状与未来趋势,推动大语言模型压缩与加速技术的发展,助力其在工业界和学术界的应用落地。系统阐述了大语言模型在计算资源和存储成本方面面临的挑战;从模型剪枝、模型量化、知识蒸馏、低秩分解四个关键技术路径出发,梳理了各类方法的基本原理、典型方法和最新进展,并对主流技术进行了系统对比与总结。从推理效率、精度保持、部署难度等多个维度构建了评价体系,深入探讨了大语言模型压缩的评估指标和实验基准。最后,结合当前技术瓶颈,展望了大语言模型压缩的未来研究方向,为后续相关研究与工程实践提供了系统性参考。 展开更多
关键词 人工智能 大语言模型 模型压缩与加速
在线阅读 下载PDF
基于大语言模型的业务流程长尾变化应变方法
19
作者 邵欣怡 朱经纬 张亮 《计算机科学》 北大核心 2026年第1期29-38,共10页
业务流程应变是业务流程管理的重要任务,旨在通过调整流程模型和实例行为来响应不断变化的环境,从而提高其柔韧性并实现业务目标。建模时,残留不确定性导致的长尾变化无法避免,给传统的业务流程应变技术带来了挑战。目前针对长尾变化最... 业务流程应变是业务流程管理的重要任务,旨在通过调整流程模型和实例行为来响应不断变化的环境,从而提高其柔韧性并实现业务目标。建模时,残留不确定性导致的长尾变化无法避免,给传统的业务流程应变技术带来了挑战。目前针对长尾变化最有效的应变方法基于一种三方协作框架,即由负责感知长尾变化和提出应变策略的前端业务人员、负责提供服务接口和合规性要求的后端技术人员和管理层,以及辅助应变实施的工具系统共同协作来应对长尾变化,保障业务目标达成。然而,长尾变化在不同时空条件下的多样性、复杂性和应变的迫切性,极有可能超出前端业务人员在应变时对当前情境的理解能力、依据情境制定应变策略的专业水平,以及将应变策略采用领域专用语言有效表达的熟练程度。为弥补这一缺憾并进一步拓展上述框架,提出了一种基于大语言模型的业务流程长尾变化应变方法LLM-Adapt,充分利用大语言模型的泛化能力、强大的内容生成能力,以及嵌入的事件与对策知识库,形成一种更高效、灵活的应变机制。首先,以基于长尾变化特征的提示词工程为媒介,使前端业务人员能够通过自然语言与大语言模型进行交互并获得应变方案。其次,结合后端管理层制定的业务基线目标约束对应变方案进行功能性约束验证,提出的SSDT-Lane算法基于流程结构相似性对应变方案进行筛选,消除了大语言模型在流程调整、业务和组织架构匹配等方面面临的幻觉风险。基于合成数据和真实开源数据集的典型案例分析实验显示,LLM-Adapt相比现有方法,在应变准确性、效率、适用性等方面都表现出显著优势。 展开更多
关键词 业务流程应变 长尾变化 大语言模型 业务流程合规性检查 流程结构相似性
在线阅读 下载PDF
大语言模型生成摘要可靠性评测研究
20
作者 王伟正 陈晗睿 +1 位作者 丁晓燕 乔鸿 《情报杂志》 北大核心 2026年第1期153-160,127,共9页
[目的]摘要是学术论文主旨的精简概括,直接影响论文的可见性与传播效果。以大语言模型生成摘要文本为例,为生成文本的可靠性研究提供参考。[方法]筛选图书情报领域992篇高被引论文作为数据集,优化提示词使ChatGPT3.5生成摘要,构建包含RO... [目的]摘要是学术论文主旨的精简概括,直接影响论文的可见性与传播效果。以大语言模型生成摘要文本为例,为生成文本的可靠性研究提供参考。[方法]筛选图书情报领域992篇高被引论文作为数据集,优化提示词使ChatGPT3.5生成摘要,构建包含ROUGE指标评测、人工评测和智能评测的多维度评估方法,结合具体案例,分析生成摘要的可靠性。[结果/结论]ROUGE评分整体较低,人工评测和智能评测结果表明大语言模型生成摘要在逻辑结构上表现较好,但在内容准确性、信息完整性和学术规范性等方面与学者撰写摘要差距明显。生成摘要虽能提高撰写摘要的效率,但无法完全替代人工撰写学术摘要,还需结合人工校验与智能优化来提升学术严谨性。 展开更多
关键词 摘要生成 大语言模型 可靠性 ChatGPT 摘要测评 评测框架
在线阅读 下载PDF
上一页 1 2 56 下一页 到第
使用帮助 返回顶部