期刊文献+
共找到149篇文章
< 1 2 8 >
每页显示 20 50 100
大语言模型推理中的存储优化技术综述 被引量:2
1
作者 葛旭冉 欧洋 +5 位作者 王博 赵宇 吴利舟 王子聪 陈志广 肖侬 《计算机研究与发展》 北大核心 2025年第3期545-562,共18页
近年来,大语言模型在多个领域展现出卓越的性能,显著改变了人类的生活方式.然而,随着模型规模的不断增长和用户对长上下文推理需求的增加,大语言模型推理系统在存储方面面临诸多问题.首先,庞大的模型参数和键值缓存导致GPU显存资源不足... 近年来,大语言模型在多个领域展现出卓越的性能,显著改变了人类的生活方式.然而,随着模型规模的不断增长和用户对长上下文推理需求的增加,大语言模型推理系统在存储方面面临诸多问题.首先,庞大的模型参数和键值缓存导致GPU显存资源不足;其次,分布式大语言模型推理系统难以充分利用GPU集群的存储资源,存在资源过度配置和存储容错的问题.因此,从显存优化、异构存储和分布式存储3方面入手,归纳总结了现有研究在解决GPU显存容量不足和资源利用率低下方面的努力.基于显存优化的大语言模型推理系统通过高效的键值缓存管理、压缩以及注意力算子优化,提高了GPU显存利用率,降低了显存占用.基于异构存储的大语言模型推理系统利用多种类别的存储资源扩展存储容量,通过张量放置策略、异步数据传输以及智能显存分配与预取技术,降低了异构存储带来的I/O开销.基于分布式存储的大语言模型推理系统通过批处理、多级调度、冗余复制等策略,优化了多机存储和计算资源的利用,提高了大语言模型推理任务的执行效率和容错能力.最后,总结了现有研究,并对未来的研究方向进行了展望. 展开更多
关键词 大语言模型推理系统 显存管理 异构存储 分布式存储 故障恢复 无服务大语言模型推理
在线阅读 下载PDF
融合大语言模型的情报智库政策内容问答服务研究——以粮食安全政策为例
2
作者 刘彦辉 张海涛 +1 位作者 周红磊 庞宇飞 《图书与情报》 北大核心 2025年第1期9-20,共12页
2025年初,我国发布的DeepSeek-R1推理模型,促进了普惠化AI时代的到来,如何将智能技术有效融入情报智库以提升其服务响应能力,并基于特定领域数据进行服务场景的验证,实现理论到实践的有效衔接,已成为情报智库实践中亟待解决的关键问题... 2025年初,我国发布的DeepSeek-R1推理模型,促进了普惠化AI时代的到来,如何将智能技术有效融入情报智库以提升其服务响应能力,并基于特定领域数据进行服务场景的验证,实现理论到实践的有效衔接,已成为情报智库实践中亟待解决的关键问题。文章聚焦于以大语言模型赋能情报智库政策内容问答服务,首先分析了情报智库的政策内容问答服务任务,探讨了大语言模型在该场景下的可行性;其次设计了融合大语言模型的情报智库粮食安全政策内容问答服务方案;最后以粮食安全政策文本为核心数据源,对方案进行了实证研究。通过从政策文本提取要素与要素关系构建数据集,采用LoRA方法微调DeepSeek模型,将其接入LangChain框架,同时挂载本地知识库,形成完整的服务方案。结果表明,该方案具有较高的可行性和专业性,为情报智库在特定领域实现政策内容问答的场景服务提供了重要的理论依据与实践支持。 展开更多
关键词 大语言模型 粮食安全 政策内容问答 情报智库服务 知识库
在线阅读 下载PDF
人工智能大语言模型在基层医疗卫生服务中的应用与挑战 被引量:13
3
作者 闫温馨 胡健 +2 位作者 曾华堂 刘民 梁万年 《中国全科医学》 CAS 北大核心 2025年第1期1-6,共6页
基层医疗系统是实现健康公平的关键。我国面临医疗资源分布不平衡、基层医生数量短缺以及慢性病防治形势不容乐观的严峻挑战。人工智能大语言模型在医疗系统中发挥出了强大优势,本文深入探讨了大模型在基层医疗系统中的应用及其面临的挑... 基层医疗系统是实现健康公平的关键。我国面临医疗资源分布不平衡、基层医生数量短缺以及慢性病防治形势不容乐观的严峻挑战。人工智能大语言模型在医疗系统中发挥出了强大优势,本文深入探讨了大模型在基层医疗系统中的应用及其面临的挑战,提出应进一步深化大模型的应用,以辅助基层医生常见病诊疗,推动智能化健康教育和慢性病管理,托底“老少边穷”地区基层卫生服务,激发全科医学的飞跃性发展,并推进大模型在全科诊疗与基层卫生服务中的产业化,为健康中国建设提供重要支撑。 展开更多
关键词 大语言模型 全科医学 基层医疗卫生服务 健康公平 健康教育 慢性病管理
在线阅读 下载PDF
SbSER:基于外部子图生成的大语言模型分步增强推理框架
4
作者 冯拓宇 王刚亮 +3 位作者 乔子剑 李伟平 张雨松 郭庆浪 《计算机科学与探索》 北大核心 2025年第2期367-373,共7页
大语言模型(LLM)自问世以来在各种任务中取得了显著的成功,尤其是在机器翻译、文本生成、问答系统等任务中的卓越表现,它们的应用也迅速扩展到了更多复杂的任务中。尽管LLM在多种任务中展现了强大的能力,但在需要深入推理和逻辑推导的... 大语言模型(LLM)自问世以来在各种任务中取得了显著的成功,尤其是在机器翻译、文本生成、问答系统等任务中的卓越表现,它们的应用也迅速扩展到了更多复杂的任务中。尽管LLM在多种任务中展现了强大的能力,但在需要深入推理和逻辑推导的任务场景中,它们仍然面临显著的挑战。由于模型训练过程中依赖大量的文本数据,往往难以全面涵盖所有领域的专业知识,导致LLM在处理特定领域问题时容易产生“幻觉”问题,即输出不准确或与实际知识不符的答案。该问题可以通过在大语言模型推理中引入外部知识图谱(KG)来辅助解决。提出基于外部子图生成的大模型分步增强推理框架(SbSER)。通过生成清晰的子图Schema引导大模型完成准确的语义解析以完成问题到逻辑查询语句的转换,将知识三元组导入图数据库中以完成准确的知识查询,通过采用直接查询推理和联合推理两种推理方式实现问题的最终增强推理输出。实验表明,提出的SbSER在多个数据集上取得优异结果,显著提升了LLM在解决复杂问题上的能力。 展开更多
关键词 大语言模型 子图生成 分步推理
在线阅读 下载PDF
基于秘密分享的大语言模型密态推理
5
作者 程珂 夏昱珩 +3 位作者 代川云 付家瑄 祝幸辉 沈玉龙 《通信学报》 北大核心 2025年第6期168-184,共17页
大语言模型推理服务可能导致用户输入提示信息泄露给服务器端或专有模型权重泄露给用户。安全多方计算、同态加密等密码学技术为解决上述问题提供了可行方案,但由于计算和通信开销过大,在处理大语言模型推理任务时难以实际应用。基于此... 大语言模型推理服务可能导致用户输入提示信息泄露给服务器端或专有模型权重泄露给用户。安全多方计算、同态加密等密码学技术为解决上述问题提供了可行方案,但由于计算和通信开销过大,在处理大语言模型推理任务时难以实际应用。基于此,提出了基于轻量级秘密分享的大语言模型密态推理方案,在不泄露用户输入和模型权重的前提下,高效精准地实现大语言模型推理。实验表明,相较现有先进工作,所提方案密态推理效率提升1.2~10倍,通信开销减少20%~90%。 展开更多
关键词 隐私保护 大语言模型 秘密分享 安全多方计算 密态推理
在线阅读 下载PDF
面向学术文本的语义增强自然语言推理模型
6
作者 张贞港 余传明 王静楠 《现代情报》 北大核心 2025年第8期18-30,共13页
[目的/意义]旨在利用大模型生成学术文本的高质量同义句,通过实施语义增强策略,以优化自然语言推理模型的性能。[方法/过程]在利用大语言模型生成学术文本同义句的基础上,提出语义增强的自然语言推理模型SENLI,该模型包括表示模块、语... [目的/意义]旨在利用大模型生成学术文本的高质量同义句,通过实施语义增强策略,以优化自然语言推理模型的性能。[方法/过程]在利用大语言模型生成学术文本同义句的基础上,提出语义增强的自然语言推理模型SENLI,该模型包括表示模块、语义增强模块和推理模块。其中,表示模块负责获取学术文本及其对应同义句的语义特征;语义增强模块将同义句的语义特征融合到学术文本的原始语义特征,获取语义增强特征;推理模块则基于学术文本的原始语义特征和语义增强特征,预测学术文本对的语义关系。将本文模型应用到SciTail、SciNLI和ZwNLI数据集上,开展实证研究。[结果/结论]实验结果显示,SENLI模型在SciTail、SciNLI和ZwNLI这3个基准数据集上的准确率分别达到了9511%、7920%和9843%,相较于基线模型,提升幅度至少为127%、108%和092%,彰显了本文模型的有效性。应用大语言模型生成的学术文本同义句进行语义增强可以提高自然语言推理模型的效果,研究有助于推动自然语言推理领域的发展,并为信息检索、学术文献挖掘等相关应用提供潜在的技术支持。 展开更多
关键词 自然语言推理 学术文本 语义增强 深度学习 大语言模型
在线阅读 下载PDF
Self-Guide:一种基于自我规划的大语言模型推理增强方法
7
作者 刘艺彬 刘正皓 +6 位作者 闫宇坤 于是 王硕 杨麟儿 陈慧敏 谷峪 于戈 《中文信息学报》 北大核心 2025年第4期55-66,共12页
尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认... 尽管大语言模型在自然语言处理任务中取得显著进展,但其在复杂问题推理等领域还面临着认知负荷问题,即大语言模型在推理过程中需要记忆并处理大量信息。因此,如何有效地减少大语言模型推理过程中的认知负荷,缓解推理过程中可能出现的认知过载,是一个亟待解决的问题。对此该文提出了Self-Guide方法,用于增强语言模型的推理能力。该方法通过指引大语言模型生成常识知识和推理指导,让大语言模型基于自我规划来增强其推理能力,并通过与推理链结合的方式对模型的推理过程进行校准。与现有方法不同的是,该文在不对大语言模型进行微调或使用外部工具的情况下,显著提升了大语言模型的推理性能。实验结果表明,Self-Guide方法在四种常见推理任务上性能显著优于基线方法,同时相比传统的推理链模型,Self-Guide方法在推理能力较弱的模型上也具有良好的泛化性能。通过结合大语言模型的自我规划和推理能力,Self-Guide方法为提升语言模型的推理能力提供了一种新的有效途径。 展开更多
关键词 大语言模型 自我引导 推理增强 认知负荷
在线阅读 下载PDF
KADR-LLM:基于深度检索推理的大语言模型辅助档案开放审核方法
8
作者 曹正阳 金咏诗 +2 位作者 孙俐丽 秦洋 冯李航 《中国测试》 北大核心 2025年第7期9-18,共10页
针对传统档案开放审核模式中存在的效率低下、主观性强及语义分析能力不足等问题,该文提出一种基于KADR-LLM的智能审核框架。该框架通过融合DPR的密集检索能力与KARP的渐进式推理机制,构建“检索-推理-验证”三阶审核范式,显著提升审核... 针对传统档案开放审核模式中存在的效率低下、主观性强及语义分析能力不足等问题,该文提出一种基于KADR-LLM的智能审核框架。该框架通过融合DPR的密集检索能力与KARP的渐进式推理机制,构建“检索-推理-验证”三阶审核范式,显著提升审核的精准性与效率。创新性体现于:设计基于文档空间结构的双通道文本预处理方法,通过段落裁剪优化语义表征;融合敏感词匹配与检索增强生成技术,建立规则驱动的动态推理机制;提出关键词引导的渐进式审核策略,实现从表层特征提取到逻辑链验证的可解释决策。实验结果表明,在OParchives等数据集上,KADR-LLM在零样本与少样本条件下的审核准确率分别达79.98%与82.34%,较基线模型提升4.31%,且具备更高的语义泛化能力。 展开更多
关键词 档案开放审核 大语言模型 密集检索 推理提示
在线阅读 下载PDF
人工智能时代的语言服务行业发展趋势 被引量:3
9
作者 崔启亮 《北京第二外国语学院学报》 北大核心 2025年第1期62-72,共11页
人工智能技术的快速发展和深入应用促进了语言服务行业组织结构和服务模式的变革。本文结合国际和国内市场的实际情况,从语言服务的需求和供给两个方面,分析了人工智能技术对语言服务行业的影响,对语言服务行业的发展趋势进行了展望,提... 人工智能技术的快速发展和深入应用促进了语言服务行业组织结构和服务模式的变革。本文结合国际和国内市场的实际情况,从语言服务的需求和供给两个方面,分析了人工智能技术对语言服务行业的影响,对语言服务行业的发展趋势进行了展望,提出了加强语言服务行业发展、提高语言服务竞争力的建议。研究表明,人工智能技术已经渗入语言服务的全流程,形成了人机在环翻译模式。语言服务提供商应加强语言服务数字化和智能化发展战略,努力向知识流程外包商和全球内容战略服务商转型。推进语言服务行业的专业化和国际化发展,需要深化我国语言服务行业智能化建设,完善语言服务标准体系规划,重视语言服务专业人才培养。 展开更多
关键词 人工智能 语言服务 翻译模型 人机在环 数字化
在线阅读 下载PDF
基于新型中医人工智能可解释推理模型的眩晕辨证诊断
10
作者 江启煜 孙晓生 罗晓牧 《中华中医药学刊》 北大核心 2025年第5期21-27,I0004-I0007,共11页
目的创新性地提出了一种能够直观利用中医诊断学知识推理的智能辨证模型以及零临床样本机器学习训练方法,并以眩晕病辨证进行实例分析。方法在基于Transformer的双向编码器(Bidirectional encoder representations from transformers,Be... 目的创新性地提出了一种能够直观利用中医诊断学知识推理的智能辨证模型以及零临床样本机器学习训练方法,并以眩晕病辨证进行实例分析。方法在基于Transformer的双向编码器(Bidirectional encoder representations from transformers,Bert)深度学习大语言模型的基础上提出新的推理算法,以建立新型智能诊断推理模型。根据《中医内科学》眩晕病肝阳上亢、气血亏虚等6种证型的辨证要点,通过随机函数生成每类证型各400例辨证样本句子序列,直接让模型学习诊断学知识。以5折交叉法对新模型和随机森林模型进行预测对比,以准确率(Accuracy)、F1值(F1-score)、受试者工作特征曲线(Receiver operating characteristic curve,ROC曲线)、精确率-召回率曲线(Precision-recall curve,P-R曲线)等指标评价模型对各种证型的预测性能。同时通过新模型自动输出的辨证推理图直观展示算法对中医辨证思维的模拟推理过程,根据模型推理过程中产生的症状和概率组合数据,计算并绘制证型-概率密度分布图、症状-证型关联聚类热图、证型-证型Pearson相关性分析图,进一步验证辨证结果的可靠性。结果新模型使用5折交叉法测试的平均总体Accuracy以及F1值分别为0.990和0.971,在所有证型中肝肾阴虚的Accuracy(0.975)以及F1值(0.923)最低。ROC曲线和P-R曲线显示新模型预测能力较差的是肝肾阴虚证和肝阳上亢证,而随机森林预测能力较差的是气血亏虚证。证型-概率密度分布图、症状-证型关联聚类热图的数据分布与新模型的推理结论相符,证型-证型Pearson相关性图显示模型所诊断的主证型与其余证型负相关且相关系数的P值小于0.01,表明模型推理过程中对证型的区分性良好。结论基于新型中医智能诊断推理模型,能够进行眩晕智能辨证并根据中医辨证思维展示推理过程,可能有助于解决当前中医人工智能诊断领域的瓶颈难题。 展开更多
关键词 人工智能 可解释性 眩晕 辨证 中医诊断 推理 深度学习 大语言模型 中医 模型
在线阅读 下载PDF
融合ReAct模式的图书馆大语言模型知识服务系统构建 被引量:10
11
作者 郭利敏 付雅明 《图书馆论坛》 CSSCI 北大核心 2024年第6期61-70,共10页
文章聚焦大语言模型时代图书馆知识服务,以家谱知识内容为实验对象,探索融合ReAct模式的图书馆大语言模型知识服务系统构建路径。实验通过将RDF数据转化为自然语言文本构建数据集,运用ReAct模式推动大语言模型执行数据查询、多语种查询... 文章聚焦大语言模型时代图书馆知识服务,以家谱知识内容为实验对象,探索融合ReAct模式的图书馆大语言模型知识服务系统构建路径。实验通过将RDF数据转化为自然语言文本构建数据集,运用ReAct模式推动大语言模型执行数据查询、多语种查询、资源检索、资源推荐和资源解读等任务,展现融合ReAct模式下大语言模型在自然语言处理和上下文理解方面的能力,实验也揭示了包括多语种问题理解上的挑战、模糊查询结果一致性、背景知识补充方面的改进空间等问题。文章对大语言模型时代图书馆知识服务的创新发展提出新视角,通过整合ReAct模式下智能系统的推理和行动能力,探索图书馆提升知识服务效能和个性化服务的新模式。 展开更多
关键词 图书馆知识服务 大语言模型 AI 2.0时代 ReAct模式
在线阅读 下载PDF
面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例 被引量:6
12
作者 刘思得 李东升 《现代情报》 CSSCI 北大核心 2024年第12期102-121,共20页
[目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧... [目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧化服务产生重要影响和价值,可有效识别信息中的人名、地名、组织机构、资源利用、服务特色和文化推广等实体,为知识组织、信息检索等提供支持。[方法/过程]本文利用命名实体识别技术分析高校图书馆智慧化服务系统的应用前景,通过构建高质量的高校图情语料库,提供高质量训练数据,以满足领域内特定的实体识别需求的准确性和适应性,为优化图书馆智慧服务系统提供基础。采用基于深度学习的ALBERT-BILSTM-CRF模型,用以验证命名实体识别任务的效果,将该模型应用于高校图书馆服务推荐和知识图谱的案例分析,并与现有的国内外主流大语言模型进行了效果比较。[结果/结论]结果表明,本文提出的方法有效地提高了高校图情领域命名实体识别的性能,有助于实现图书馆智慧化服务的推广与应用,同时也减少了资源浪费和训练成本。此外,本文还探讨了服务于图书馆领域大语言模型LibraryGPT的可能性,以便对未来高校图书馆智慧服务的推广和发展提供参考和借鉴。 展开更多
关键词 高校图书馆 智慧服务 命名实体识别 大语言模型
在线阅读 下载PDF
大语言模型的会计垂域推理能力探究 被引量:6
13
作者 钟慧 陈宋生 王明 《财会月刊》 北大核心 2024年第11期17-25,共9页
大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提... 大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提升LLMs的推理能力。本文以如何提升LLMs在会计领域的推理能力为起点,提出会计垂域推理能力的概念、研究路径、评测标准,分析中文开源模型清华智谱的GLM系列的评测结果,为后续的推理研究提供标准范式,并为如何提升会计推理能力提供评价标准,力图推动LLMs在会计领域达到应有水平。同时,为验证LLMs的会计推理能力,本文比较了GLM-6B、GLM-130B、GLM-4在算术推理能力和会计常识推理能力方面的差别,并将OPENAI的GPT-4作为基准进行分析。结果表明,在不同推理提示工程下,模型规模显著影响推理能力,虽然各种模型算术推理能力已经得到极大的提高,但是会计推理能力还远不能达到应用水平,需要在应用中逐层优化,研究为LLMs会计垂域进入应用实践的优化过程提供参考。 展开更多
关键词 大语言模式 垂域模型 推理能力 提示词工程 会计推理能力 基准数据集
在线阅读 下载PDF
基于知识图谱和预训练语言模型深度融合的可解释生物医学推理 被引量:3
14
作者 徐寅鑫 杨宗保 +2 位作者 林宇晨 胡金龙 董守斌 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期62-70,共9页
基于预训练语言模型(LM)和知识图谱(KG)的联合推理在应用于生物医学领域时,因其专业术语表示方式多样、语义歧义以及知识图谱存在大量噪声等问题,联合推理模型并未取得较好的效果。基于此,提出一种面向生物医学领域的可解释推理方法DF-... 基于预训练语言模型(LM)和知识图谱(KG)的联合推理在应用于生物医学领域时,因其专业术语表示方式多样、语义歧义以及知识图谱存在大量噪声等问题,联合推理模型并未取得较好的效果。基于此,提出一种面向生物医学领域的可解释推理方法DF-GNN。该方法统一了文本和知识图谱的实体表示方式,利用大型生物医学知识库构造子图并进行去噪,改进文本和子图实体的信息交互方式,增加对应文本和子图节点的直接交互,使得两个模态的信息能够深度融合。同时,利用知识图谱的路径信息对模型推理过程提供了可解释性。在公开数据集MedQA-USMLE和MedMCQA上的测试结果表明,与现有的生物医学领域联合推理模型相比,DF-GNN可以更可靠地利用结构化知识进行推理并提供解释性。 展开更多
关键词 生物医学 预训练语言模型 知识图谱 联合推理
在线阅读 下载PDF
基于大语言模型的时序知识图谱推理模型蒸馏方法 被引量:2
15
作者 司悦航 成清 +1 位作者 黄金才 胡星辰 《指挥与控制学报》 CSCD 北大核心 2024年第6期712-719,共8页
基于时序知识图谱的推理,是提升智能决策效率推理未来态势的技术基础。传统推理模型面临着模型参数规模大、计算硬件需求高等问题,难以满足低性能、低功耗分布式设备的实时推理决策要求。传统模型压缩方法忽略了时序特征。提出一种应用... 基于时序知识图谱的推理,是提升智能决策效率推理未来态势的技术基础。传统推理模型面临着模型参数规模大、计算硬件需求高等问题,难以满足低性能、低功耗分布式设备的实时推理决策要求。传统模型压缩方法忽略了时序特征。提出一种应用于时序知识图谱推理模型的蒸馏方法,构建基于大语言模型的蒸馏框架,融合海量公开知识和特定时序知识,辅助轻量模型训练。在公开数据集上展开的实验表明该方法优于国际同类方法。 展开更多
关键词 时序知识图谱 知识图谱推理 知识蒸馏 大语言模型
在线阅读 下载PDF
基于大语言模型的移动应用隐私政策合规性检测方法
16
作者 王立梅 韩林睿 +3 位作者 杜祖炜 郑日 时建中 刘奕群 《计算机科学》 北大核心 2025年第8期1-16,共16页
隐私政策是网络服务提供者对其合法采集和利用个人信息行为的自律性承诺,旨在增强用户对个人信息处理过程的信任并提升其控制能力。然而,实际应用中却存在内容冗长、术语复杂、合规边界模糊等问题。传统方法依赖分类模型,通过对隐私政... 隐私政策是网络服务提供者对其合法采集和利用个人信息行为的自律性承诺,旨在增强用户对个人信息处理过程的信任并提升其控制能力。然而,实际应用中却存在内容冗长、术语复杂、合规边界模糊等问题。传统方法依赖分类模型,通过对隐私政策文本进行标注实现自动化合规检测,但存在评估标准单一化、标注数据获取成本高、模型泛化能力不足等局限性。对此,提出一种基于大语言模型的移动应用隐私政策合规性检测方法,核心流程为“构建合规性评估体系-设计层级式推理框架-实现自动化合规检测”。首先,依据《民法典》《个人信息保护法》等9部法律法规及国家标准,构建包含6个一级指标、14个二级指标和41个三级指标的合规性评估体系;其次,基于动态最优轨迹搜索方法设计三阶段层级式推理框架DOTS-THCE,通过小样本提示工程引导大语言模型实现隐私政策的多层次动态评估;最后,基于从“腾讯应用宝”移动应用商店采集的PPC-Bench数据集(涵盖10个类别、4821份隐私政策文本)开展实验。实验结果表明,与Deepseek-LLM-7B-Chat,Llama3.1-8B-Chinese-Chat和GLM-4-9B-Chat相比,Qwen2.5-7B-Instruct模型经DOTS-THCE方法增强推理后性能更优。Qwen2.5-7B-Instruct@DOTS-THCE模型在隐私政策合规性检测中宏F1值达89.30%,显著优于SVM,CNN,RNN,BERT以及Qwen2.5-7B-Instruct@RAG等基线模型。研究不仅验证了大语言模型在隐私政策合规性检测中应用的有效性,更为破解司法领域高质量标注数据稀缺的困境提供了有益参考。 展开更多
关键词 隐私政策 合规性检测 动态最优轨迹搜索 三阶段层级式推理框架 大语言模型
在线阅读 下载PDF
基于路径和增强三元组文本的开放世界知识推理模型
17
作者 王利琴 耿智雷 +2 位作者 李英双 董永峰 边萌 《计算机应用》 北大核心 2025年第4期1177-1183,共7页
传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理,有效进行开放世界的知识推理是目前的热点问题。因此,提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR(Path and Enhanced triplet text for Open world know... 传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理,有效进行开放世界的知识推理是目前的热点问题。因此,提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR(Path and Enhanced triplet text for Open world knowledge Reasoning)。首先,使用由实体对间结构生成的多条路径和单个实体周围结构生成的增强三元组,其中路径文本通过拼接路径中的三元组文本得到,而增强三元组文本通过拼接头实体邻域文本、关系文本和尾实体邻域文本得到;其次,使用BERT(Bidirectional Encoder Representations from Transformers)分别编码路径文本和增强三元组文本;最后,使用路径向量和三元组向量计算语义匹配注意力,再使用语义匹配注意力聚合多条路径的语义信息。在3个开放世界知识图谱数据集WN18RR、FB15k-237和NELL-995上的对比实验结果表明,与次优模型BERTRL(BERT-based Relational Learning)相比,所提模型的命中率(Hits@10)指标分别提升了2.6、2.3和8.5个百分点,验证了所提模型的有效性。 展开更多
关键词 知识图谱 文本信息 预训练语言模型 开放世界知识推理 注意力机制
在线阅读 下载PDF
语义理解与常识推理的机器表现和人类基线之比较——怎样评估ChatGPT等大型语言模型的语言运用能力? 被引量:2
18
作者 袁毓林 《汉语学报》 CSSCI 北大核心 2024年第4期2-16,共15页
本文讨论怎样通过跟人类基线的比较,来合理地评估ChatGPT等现代大型语言模型的语言运用能力。首先,用代词指称歧义和否定辖域问题测试ChatGPT,展示语言大模型在语义理解和常识推理方面的优秀表现;接着简介维诺格拉德模式挑战及其升级版... 本文讨论怎样通过跟人类基线的比较,来合理地评估ChatGPT等现代大型语言模型的语言运用能力。首先,用代词指称歧义和否定辖域问题测试ChatGPT,展示语言大模型在语义理解和常识推理方面的优秀表现;接着简介维诺格拉德模式挑战及其升级版本WinoGrande数据集,还介绍了我们对于这种类型的测试题和机器表现的评估方式的改进方案(把仅触发词不同的“句对”扩展为锚定词也不同的“句偶”,把机器表现跟人类被试的表现进行比较);然后介绍我们怎样用“句对”和“句偶”测试ChatGPT和人类被试,并且把人类和机器的表现进行对比,从而得出语言大模型的语言运用能力接近人类的结论。 展开更多
关键词 语义理解/常识推理 ChatGPT/大型语言模型 维诺格拉德模式/句对与句偶 机器表现/人类基线
在线阅读 下载PDF
服务型与技术型职业院校发展状况比较研究:基于大语言模型 被引量:1
19
作者 王丹 张磊 +2 位作者 刘卫卫 马倩妮 杨阳 《职业技术教育》 北大核心 2024年第21期14-22,共9页
为深入探讨服务型职业院校与技术型职业院校在资源投入、参与教学改革以及助推企业发展三个关键方面的行业差异,为职业教育的精准发展提供理论支撑和实践指导,利用大语言模型ChatGPT,从职业院校发布的质量年度报告中抽取主谓宾结构信息... 为深入探讨服务型职业院校与技术型职业院校在资源投入、参与教学改革以及助推企业发展三个关键方面的行业差异,为职业教育的精准发展提供理论支撑和实践指导,利用大语言模型ChatGPT,从职业院校发布的质量年度报告中抽取主谓宾结构信息,以此为基础构建本体关系的三元组,进而深入剖析服务型与技术型职业院校在资源投入、教学改革以及企业发展助推等三个维度上的具体差异。结果显示,服务型职业院校更注重服务类专业的实践教学和职业素养培养,致力于提升学生的服务能力和综合素质,以满足服务行业对人才的需求;而技术型职业院校则更侧重于技术类专业的教学设备、实训基地建设与技术更新,旨在培养具备专业技术能力和创新精神的技术人才。 展开更多
关键词 大语言模型 职业教育 服务型职业院校 技术型职业院校 本体关系
在线阅读 下载PDF
大语言模型在数学推理中的研究进展 被引量:2
20
作者 罗焕坤 葛一烽 刘帅 《计算机工程》 CAS CSCD 北大核心 2024年第9期1-17,共17页
全面概述大语言模型(LLM)在数学推理中的研究进展、机制原理以及应用趋势,为后续开展相关研究提供参考借鉴。选取与大语言模型在数学推理领域相关的122篇文献。系统描述了数学推理问题的类型及其数据集,分别从增强模型推理能力的策略和... 全面概述大语言模型(LLM)在数学推理中的研究进展、机制原理以及应用趋势,为后续开展相关研究提供参考借鉴。选取与大语言模型在数学推理领域相关的122篇文献。系统描述了数学推理问题的类型及其数据集,分别从增强模型推理能力的策略和思维链提示方法这两方面深入解析各技术的原理、应用价值和存在问题。通过定性分析,提出未来可能的研究方向。大语言模型相关研究发展迅速,相关调研工作可能未覆盖完整。基于思维链提示技术、微调、利用编程语言等外部工具、验证机制等方法可以有效提升大语言模型的数学推理能力,特别是基于思维链提示的方法成为当前大语言模型的主要研究热点。未来研究工作可在进一步提升大语言模型的推理能力、提出解决数学推理问题的新方法等方面展开深入研究。 展开更多
关键词 大语言模型 数学推理 思维链 GPT-4 微调
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部