期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于ChatGPT API和提示词工程的专利知识图谱构建 被引量:10
1
作者 张玲玲 黄务兰 《情报杂志》 北大核心 2025年第3期180-187,共8页
[研究目的]在信息爆炸的时代背景下,专利数据的快速增长为知识管理和分析带来了新的挑战。该文旨在探讨利用ChatGPT从专利摘要中抽取信息,构建专利知识图谱,以提升知识管理和分析的效率和准确性。[研究方法]从中国知网专利数据库选取了... [研究目的]在信息爆炸的时代背景下,专利数据的快速增长为知识管理和分析带来了新的挑战。该文旨在探讨利用ChatGPT从专利摘要中抽取信息,构建专利知识图谱,以提升知识管理和分析的效率和准确性。[研究方法]从中国知网专利数据库选取了智能驾驶领域的专利摘要,利用ChatGPT进行信息抽取。为实现高效批量处理,采用了ChatGPT API接口与模型进行交互。为确保信息抽取的准确性,多次迭代和优化提示词,设计了系统消息、助手消息及用户消息三种角色,通过模拟对话场景,引导模型精确抽取实体与关系。[研究结果/结论]研究结果表明,ChatGPT成功从1126份专利摘要中提取了丰富的五元组信息,并以此为基础构建了专利知识图谱。与传统方法如Bert2Keras相比,ChatGPT在精确率、召回率及F1值等关键指标上均表现出明显优势,分别达到了88.2%、88.3%和88.3%,远超Bert2Keras的34.7%、9%和14.6%。最后,利用抽取的实体关系和Neo4j技术,成功地构建了知识图谱并完成了可视化展示,便于通过Cypher语句进行查询操作。该研究不仅证实了ChatGPT在专利知识图谱构建中的可行性,也为其在知识产权管理、技术研发及竞争情报分析等方面的智能化应用奠定了基础。 展开更多
关键词 ChatGPT API 提示词工程 专利知识图谱 实体关系抽取 智能驾驶
在线阅读 下载PDF
基于性早熟电子病历中个体危险因素抽取评价提示词工程方法的性能
2
作者 周费翔 钟韬玮 +2 位作者 杨桂艳 丁祥龙 颜艳 《中南大学学报(医学版)》 北大核心 2025年第7期1224-1233,共10页
目的:性早熟危险因素的准确识别有助于临床诊疗,但运用自然语言处理非结构化数据的方法仍有待评价。本研究旨在基于性早熟电子病历中个体危险因素抽取评价提示词工程方法的性能。方法:根据CRISPE(capacity and role-insight-statement-p... 目的:性早熟危险因素的准确识别有助于临床诊疗,但运用自然语言处理非结构化数据的方法仍有待评价。本研究旨在基于性早熟电子病历中个体危险因素抽取评价提示词工程方法的性能。方法:根据CRISPE(capacity and role-insight-statement-personality-experiment)提示词框架制订简单提示词和优化提示词,2种提示词分别引导大语言模型GLM-4-9B从653份电子病历记录中提取10种性早熟的危险因素,采用准确率、精确率、召回率和F1值作为信息抽取任务的评价指标。结果:在简单提示词和优化提示词下,模型总体的准确率、精确率、召回率和F1值分别为84.18%、98.09%、81.99%、89.32%和97.15%、98.31%、98.16%、98.23%。优化提示词在年龄(<9岁和≥9岁)和就诊时间(<2023年和≥2023年)各组间的模型性能差异小于简单提示词。在简单提示词下,模型抽取每种危险因素的准确率的区间范围为60.03%~97.24%;在优化提示词下,准确率的区间范围为92.19%~99.85%。2种提示词在抽取“饮料摄入情况”时的准确率差异最大(60.03%vs 92.19%),在抽取“母亲初潮年龄”时差异最小(97.24%vs99.23%)。在简单提示词、优化提示词和真实值3种情况下,零食摄入情况、饮料摄入情况、豆浆摄入情况、蜂蜜摄入情况、保健品服用情况、补品服用情况、睡眠质量、开灯睡觉情况的分布特征差异均具有统计学意义(均P<0.001),运动情况(P=0.966)和母亲初潮年龄(P=0.952)的分布特征差异无统计学意义。结论:优化提示词相比简单提示词更能有效地完成电子病历中个体危险因素的抽取任务,表明提示词工程在提升大语言模型性能方面具有重要作用。 展开更多
关键词 性早熟 电子病历 提示词工程 大语言模型 信息抽取
在线阅读 下载PDF
基于提示词工程的中文修辞识别与理解方法
3
作者 来雨轩 王夏菁 胡文鹏 《中文信息学报》 北大核心 2025年第6期22-34,共13页
修辞识别与理解任务旨在利用自然语言处理的手段识别并理解句子所采用的修辞手法,对情感分析、机器翻译等下游任务具有重要意义。该文提出了一种基于大语言模型提示词工程的中文修辞识别与理解方法,通过系统地提示词设计与基于动态检索... 修辞识别与理解任务旨在利用自然语言处理的手段识别并理解句子所采用的修辞手法,对情感分析、机器翻译等下游任务具有重要意义。该文提出了一种基于大语言模型提示词工程的中文修辞识别与理解方法,通过系统地提示词设计与基于动态检索的上下文学习策略,激发大语言模型识别与理解中文修辞表达的能力,并探究了不同的思维链与上下文学习样例选择排布策略对模型修辞识别与理解表现的影响。在修辞识别与理解评测数据集CERRU上,该文基于Qwen-long实现的方法三赛道平均表现达60.7%,超越精调32B规模大语言模型,无需基于梯度的参数调整,同业内领先水平表现相当。消融测试与分析结果展现了不同的提示词设计策略对模型表现的影响,验证该文方法有效性的同时,也为其它中文理解任务提供了经验性参考。 展开更多
关键词 大语言模型 上下文学习 提示词工程 修辞识别与理解
在线阅读 下载PDF
道德机器何以实现:生成式AI智能向善的逻辑基础与提示词框架
4
作者 刘琴 常立瑛 《编辑之友》 北大核心 2025年第4期57-64,共8页
生成式AI作为道德机器需要承担智能向善的使命,而提示词工程是生成式AI特别是对话式AI话语把关的重要环节,能够引导用户“说什么”,构建符合人类实际的价值观。文章从技术生命、意义本体和政治身份三个层面探讨生成式AI智能向善的逻辑基... 生成式AI作为道德机器需要承担智能向善的使命,而提示词工程是生成式AI特别是对话式AI话语把关的重要环节,能够引导用户“说什么”,构建符合人类实际的价值观。文章从技术生命、意义本体和政治身份三个层面探讨生成式AI智能向善的逻辑基础,揭示其智能向善的核心是进行主流价值观的引领,而要实现生成式AI的社会道德责任,需要重新设计主流价值的语料库,通过开源的大模型和私域小模型等多种渠道开展语义训练,在不断演绎与修正中,提升用户的价值认知,实现价值纠偏与对齐。作为生命机器,生成式AI不是单纯地迎合价值主体,努力使自己的语言内容对齐输入指令,而是能够再创生产力,反作用于人类。因此,既需要从功能层面探讨其价值对齐和道德行善,更要从平等的视角重释人机关系:从被动到主动、从辅助到主导、从服从到超越。 展开更多
关键词 道德机器 智能向善 价值对齐 提示词工程
在线阅读 下载PDF
基于提示词策略的生成式人工智能在国际中文教学中的应用研究
5
作者 史金生 葛星辰 《陕西师范大学学报(哲学社会科学版)》 北大核心 2025年第5期135-145,共11页
生成式人工智能与结构化提示词的深度融合为国际中文教学资源生成开辟了新路径。以ICIO、CRISPE、BROKE、RASCEF 4类结构化提示词框架和ChatGPT、DeepSeek、文心一言、KimiChat、通义千问5种大语言模型为研究对象,构建80组实验条件,收集... 生成式人工智能与结构化提示词的深度融合为国际中文教学资源生成开辟了新路径。以ICIO、CRISPE、BROKE、RASCEF 4类结构化提示词框架和ChatGPT、DeepSeek、文心一言、KimiChat、通义千问5种大语言模型为研究对象,构建80组实验条件,收集400份专家评分数据,采用双因素方差分析,考察提示词框架和大语言模型在国际中文教学资源生成中的影响,发现提示词框架对生成内容的质量具有决定性影响,CRISPE框架表现最优,大语言模型对生成材料的影响不显著,二者交互效应也不显著。在数智时代背景下,提升国际中文教师的提示词设计能力已成为其专业发展能力的核心要素,这对于人工智能融入学科建设、提升教学质量及区域均衡发展意义重大。 展开更多
关键词 生成式人工智能 提示词工程 国际中文教师
在线阅读 下载PDF
PromptVis:面向文本生成图片的提示词的交互式可视分析方法 被引量:2
6
作者 卢裕弘 封颖超杰 +4 位作者 朱琳 周海怡 朱航 喻晨昊 陈为 《计算机辅助设计与图形学学报》 北大核心 2025年第4期688-696,共9页
高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用... 高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用户输入的提示词语句进行成分解析,并提供改进提示词的建议,如推荐相关的提示词;然后将用户输入与系统推荐的提示词集合进行聚类呈现,并支持用户交互探索;第三,从多个维度自动评估文本提示词和生成的图片,为用户修改提示词提供参考;第四,根据推荐的提示词对现有图片进行局部调整,支持用户预览提示词的修改效果.通过用户对比实验,从提示词创作效率分析和实用性问卷评估2个角度,证明了所提方法在辅助用户进行提示词创作上的实用性与有效性. 展开更多
关键词 文本生成图片 提示词工程 提示可视化
在线阅读 下载PDF
提示词馆员:生成式人工智能时代下图书馆馆员的新角色
7
作者 李国俊 汪聪 +2 位作者 唐勇 庄昕 徐扬 《图书与情报》 北大核心 2025年第2期78-84,共7页
文章分析了“提示词工程”的概念内涵,并与图书馆信息检索过程进行对比分析,给出了提示词馆员的定义,最后探讨了提示词馆员的功能职责和培养建议。研究表明,提示词工程和图书馆信息检索之间存在许多相似之处,如都需通过精确的语言表达... 文章分析了“提示词工程”的概念内涵,并与图书馆信息检索过程进行对比分析,给出了提示词馆员的定义,最后探讨了提示词馆员的功能职责和培养建议。研究表明,提示词工程和图书馆信息检索之间存在许多相似之处,如都需通过精确的语言表达来实现特定的信息检索或生成目标。从AI科技公司的要求和图书馆界培训课程来梳理提示词馆员的功能职责,并提出从技能融合、工具赋能、用户协同、伦理素养四个方面培养提示词馆员。包括将检索技能融入提示词工程、构建本地化提示词优化平台、以用户需求驱动提示词迭代、构建伦理保障体系,以应对生成式人工智能技术挑战。 展开更多
关键词 生成式人工智能 提示馆员 提示词工程 大语言模型
在线阅读 下载PDF
基于大语言模型链式提示词的再制造工艺知识精准抽取方法
8
作者 张豪杰 张华 +2 位作者 鄢威 朱硕 江志刚 《制造技术与机床》 北大核心 2025年第10期90-98,共9页
针对再制造知识多环节和歧义性等特点导致的传统抽取方法标注数据依赖性强、多跳关系解析能力不足等问题,提出一种基于大语言模型链式提示词的再制造工艺知识多粒度抽取方法,通过融合提示词工程与思维链推理,结合语义对齐机制,利用大语... 针对再制造知识多环节和歧义性等特点导致的传统抽取方法标注数据依赖性强、多跳关系解析能力不足等问题,提出一种基于大语言模型链式提示词的再制造工艺知识多粒度抽取方法,通过融合提示词工程与思维链推理,结合语义对齐机制,利用大语言模型(large language model,LLM)实现粗粒度到细粒度知识的精准提取。首先,基于提示词工程引导LLM完成初始知识的粗粒度抽取,定位再制造工艺核心实体;其次,设计思维链推理框架,驱动LLMs解析实体间复杂逻辑关系,并通过余弦相似度实现异构语义对齐,提升细粒度知识的语义一致性与匹配精度。试验结果表明,链式提示词法的F1分数达88.0%,较传统方法提升超30%,且多跳关系覆盖率达89.2%,有效解决了传统技术对标注数据的依赖问题。 展开更多
关键词 大语言模型 提示词工程 思维链推理 再制造工艺 知识抽取
在线阅读 下载PDF
基于提示词与多模态大模型选择的环境地图评价优化路径研究
9
作者 张雨薇 王民 《地理教学》 北大核心 2025年第13期20-24,共5页
为探究人工智能辅助环境地图评价的优化路径,本研究对比了不同提示词与大模型组合的评价结果,测量其与人类专家评分的拟合程度。本研究选择了环境地图展示活动的作品作为研究样本,选取了输入—输出提示(IO)、专家提示(EP)、自洽提示(SC... 为探究人工智能辅助环境地图评价的优化路径,本研究对比了不同提示词与大模型组合的评价结果,测量其与人类专家评分的拟合程度。本研究选择了环境地图展示活动的作品作为研究样本,选取了输入—输出提示(IO)、专家提示(EP)、自洽提示(SC)及思维图像提示(IOT)四类提示词,以及豆包、通义千问、智谱清言、跃问四个多模态大模型进行组合测试。结果表明,IOT提示词在整体作品评价和多数的分项评价上都表现出与人类专家相似的评价能力,豆包和跃问模型在地图识别任务上表现相对较好,为教学实践中的提示词及大模型选择提供了借鉴。 展开更多
关键词 环境地图 人工智能 多模态大模型 提示词工程 教学评价
在线阅读 下载PDF
基于大型语言模型的AI招生咨询助理设计与实现 被引量:3
10
作者 阮昆 杨璟轩 +3 位作者 殷旭 储雯 罗婷婷 黄容 《实验室研究与探索》 北大核心 2025年第2期110-116,共7页
针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立... 针对高考招生咨询业务繁忙,咨询覆盖范围有限、咨询效率不高等问题,基于检索增强生成、大型语言模型、提示词工程和检索增强生成转结构化查询语言等技术构建AI招生咨询助理,搜集学校招生信息网招生政策、常见问题、学院专业介绍等建立本地权威招生知识库,对政策咨询类问题直接在本地向量知识库检索,对数据查询类问题转化为SQL数据查询,将检索或查询结果送至大模型推理生成回复,提升提问方式的自由度以及问题回复的权威性和实时性,降低大模型幻觉,实现全天候为考生和家长提供精准化、智能化、个性化的咨询服务。在2024年高考招生咨询中,大幅度减轻学校招生咨询工作压力,有效提升招生咨询效率,促进公平获取招生信息。 展开更多
关键词 大型语言模型 检索增强生成技术 提示词工程 招生咨询
在线阅读 下载PDF
大语言模型在电力系统中的应用初探 被引量:2
11
作者 牛泽原 李嘉媚 艾芊 《电网技术》 北大核心 2025年第4期1327-1336,I0015,I0016,共12页
大语言模型在电力系统中的应用研究正在广泛深入地开展。该文初步探讨了大语言模型在电力系统中的应用,分析了其在提示工程、多模态处理、模型微调等方面的技术优势和实践价值。通过实验验证了大语言模型在电力系统辅助运行中的潜力和能... 大语言模型在电力系统中的应用研究正在广泛深入地开展。该文初步探讨了大语言模型在电力系统中的应用,分析了其在提示工程、多模态处理、模型微调等方面的技术优势和实践价值。通过实验验证了大语言模型在电力系统辅助运行中的潜力和能力,并分析了其在不同任务中的表现。研究结果表明,大语言模型结合提示词框架设计和模型微调,可以解决电力系统中如功率预测、最优潮流计算和专业知识问答等问题,给为电气工程师利用大语言模型解决实际问题提供了参考,也为未来更广泛的应用探索提供了良好基础。 展开更多
关键词 大语言模型 电力系统 提示词工程 微调 功率预测 最优潮流
在线阅读 下载PDF
打开教学决策的“黑箱”:教师决策自动化评价智能体构建及应用 被引量:1
12
作者 王妤 曾蓓 郭力平 《现代远程教育研究》 北大核心 2025年第4期34-44,共11页
教师决策能力作为教学过程中的一种“黑箱”技能,因其情境复杂性而长期面临评价难题。生成式人工智能(GAI)在模拟人类认知过程与处理大规模数据方面具有独特优势,为教师决策自动化评价带来新的可能,但其在具体应用中亦面临情境适配不足... 教师决策能力作为教学过程中的一种“黑箱”技能,因其情境复杂性而长期面临评价难题。生成式人工智能(GAI)在模拟人类认知过程与处理大规模数据方面具有独特优势,为教师决策自动化评价带来新的可能,但其在具体应用中亦面临情境适配不足、专业引导有限以及成本与质量难以兼顾等挑战。基于提示词工程构建的教师决策自动化评价智能体,为破解上述难题提供了理论框架与实践路径。教师决策自动化评价智能体包括输入器、生成标准评价器、决策等级评价器与决策评价反馈器四个组成部分,可实现教师情境化决策数据的接入、融合人机智慧的决策评价标准构建、教师决策智能化分级评价以及形成发展导向的个性化反馈。以幼儿园保教活动为案例情境,通过将智能体的评价结果与专家评估结果进行对比发现,该智能体在提升评价一致性方面优于传统学科专家,且提示词工程的应用显著增强了GAI与人工评价之间的一致性。此外,该智能体不仅实现了对教师决策能力的自动评价与精准定位,还能够提供蕴含教育智慧、具有专业深度的反馈,为教师专业发展提供了有力支持。 展开更多
关键词 教育智能体 教师决策 生成式人工智能 提示词工程 情境判断测验
在线阅读 下载PDF
融合大语言模型与向量知识库的应用文生成框架
13
作者 秦斌 陆平 +5 位作者 徐琰 邓芳伟 王旖洋 曾渭钰 李欣莹 李灿亮 《深圳大学学报(理工版)》 北大核心 2025年第5期597-605,I0005,共10页
为提高应用文编写效率,提出一种融合大语言模型(large language model,LLM)与向量知识库(vector knowledge base)的应用文自动生成框架.根据目标应用场景,以人工编写的标准应用文为范本,构建结构化辅助生成文件,并建立相应类型应用文的... 为提高应用文编写效率,提出一种融合大语言模型(large language model,LLM)与向量知识库(vector knowledge base)的应用文自动生成框架.根据目标应用场景,以人工编写的标准应用文为范本,构建结构化辅助生成文件,并建立相应类型应用文的向量知识库.利用目标类型应用文的章节标题和用户输入的关键信息在知识库中进行检索,匹配相关文段;设置提示词引导LLM,以召回的参考文段及用户输入的提示信息为参考,使用末级标题作为分割标志,分章节生成应用文文本;最终按规定格式整合全文并输出完整的目标应用文.以应急预案为例,在同一评价标准下使用ChatGPT-4Turbo进行评测,自动生成的应急预案高度趋近于人工编写的质量,二者的文档质量相似度达95.87%.所提方法能够在算力资源有限的情况下突破字数限制,生成符合基本标准的长篇幅应用文,可供人工参考或直接使用,极大提高了编写人员的工作效率. 展开更多
关键词 人工智能 应用文生成 大语言模型 向量知识库 提示词工程 模型评测 ChatGPT-4Turbo DeepSeek-R1
在线阅读 下载PDF
国画自动生成方法及其在陶瓷装饰中的应用
14
作者 林津民 章义来 胡开华 《陶瓷学报》 北大核心 2025年第4期840-848,共9页
采用传统国画装饰陶瓷产品由来已久,深受中外消费者喜爱。然而,手工绘制国画对专业技艺要求较高,存在门槛高、版权争议多、可选范围有限等问题。为此,本文提出一种基于稳定扩散模型的国画生成方法。该方法引入双层U-net结构,结合加入卷... 采用传统国画装饰陶瓷产品由来已久,深受中外消费者喜爱。然而,手工绘制国画对专业技艺要求较高,存在门槛高、版权争议多、可选范围有限等问题。为此,本文提出一种基于稳定扩散模型的国画生成方法。该方法引入双层U-net结构,结合加入卷积层控制的低秩自适应算法进行微调训练,并利用控制网络调整图像边框和布局。实验表明,该方法能通过文本或图片实现国画的自动生成,并借助提示词工程进一步提升生成质量。通过陶瓷三维模型展示验证,使陶瓷装饰设计更加高效便捷,同时提升了设计多样性,有利于实现产品个性化定制需求。 展开更多
关键词 国画 图像生成 稳定扩散模型 低秩自适应算法 U-net 提示词工程
在线阅读 下载PDF
基于大型视觉语言模型的施工现场安全监控研究
15
作者 冷烁 王玮 +3 位作者 欧家勇 薛志刚 宋英龙 莫斯钧 《图学学报》 北大核心 2025年第5期960-968,共9页
针对施工安全监控过程中,传统视觉模型构建成本高、应用范围窄等问题,提出一种基于大型视觉语言模型(LVLM)的全新解决方案。基于开源预训练LVLM,提出包括文本提示、图像附加信息、图像样本提示等多类适用于施工安全监控任务的提示词策略... 针对施工安全监控过程中,传统视觉模型构建成本高、应用范围窄等问题,提出一种基于大型视觉语言模型(LVLM)的全新解决方案。基于开源预训练LVLM,提出包括文本提示、图像附加信息、图像样本提示等多类适用于施工安全监控任务的提示词策略,实现LVLM对施工监控图像的理解与推理,并设计了基于LVLM的智能监控工作流程与系统架构。研究成果被应用于管理人员离岗识别、危险区域侵入识别、以及违规施工行为识别等多项典型施工安全监控场景。实际数据验证表明,通过合适的提示词策略,LVLM无需数据标注与模型训练,便可实现接近主流深度学习模型的识别准确率,同时具有构建成本低、落地速度快、任务适应灵活等优势,在图像识别与智能监控领域具有应用潜力。 展开更多
关键词 大型视觉语言模型 计算机视觉 施工安全 智能监控 提示词工程
在线阅读 下载PDF
智能包装设计中AI绘图的精细化控图研究
16
作者 张汉栋 张伟 潘帅 《包装工程》 北大核心 2025年第S1期254-259,共6页
深入探讨生成式人工智能(AIGC)技术中的提示词和微调模型,分析不同格式的提示词及其对微调模型控图能力的影响,以解决当前包装设计过程中AI绘图生成结果不稳定及不可控等问题。使用ComfyUI工具开展实验,系统地评估不同类型提示词(包括... 深入探讨生成式人工智能(AIGC)技术中的提示词和微调模型,分析不同格式的提示词及其对微调模型控图能力的影响,以解决当前包装设计过程中AI绘图生成结果不稳定及不可控等问题。使用ComfyUI工具开展实验,系统地评估不同类型提示词(包括结构化和非结构化提示词)与微调模型的应用效果。通过案例对比分析,深入研究其在实际生成过程中的表现与影响,探讨提示词的解构方式与微调策略之间的协同效应。结构化提示词与微调模型的有效结合能够显著提升AI绘图的控图能力,不仅改善绘图结果的准确性和一致性,还能提高整体绘图效率,降低生成过程中的随机性和不确定性。通过系统的实验与分析,为不同结构的提示词和微调模型在AI绘图中的控图能力提供了实证支持,为未来的模型训练和提示词工程的发展奠定了理论基础和实践参考。 展开更多
关键词 生成式人工智能(AIGC) 提示词工程 精细化控图 微调模型 智能包装设计
在线阅读 下载PDF
大语言模型的会计垂域推理能力探究 被引量:6
17
作者 钟慧 陈宋生 王明 《财会月刊》 北大核心 2024年第11期17-25,共9页
大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提... 大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提升LLMs的推理能力。本文以如何提升LLMs在会计领域的推理能力为起点,提出会计垂域推理能力的概念、研究路径、评测标准,分析中文开源模型清华智谱的GLM系列的评测结果,为后续的推理研究提供标准范式,并为如何提升会计推理能力提供评价标准,力图推动LLMs在会计领域达到应有水平。同时,为验证LLMs的会计推理能力,本文比较了GLM-6B、GLM-130B、GLM-4在算术推理能力和会计常识推理能力方面的差别,并将OPENAI的GPT-4作为基准进行分析。结果表明,在不同推理提示工程下,模型规模显著影响推理能力,虽然各种模型算术推理能力已经得到极大的提高,但是会计推理能力还远不能达到应用水平,需要在应用中逐层优化,研究为LLMs会计垂域进入应用实践的优化过程提供参考。 展开更多
关键词 大语言模式 垂域模型 推理能力 提示词工程 会计推理能力 基准数据集
在线阅读 下载PDF
CFB:金融领域大模型评估方法 被引量:8
18
作者 李毅 李浩 +1 位作者 许骁哲 杨一凡 《计算机科学与探索》 CSCD 北大核心 2024年第12期3272-3287,共16页
随着大语言模型(LLM)在金融领域的应用潜力不断显现,评估金融大模型的性能变得尤为重要。然而,由于当下的金融评估方法评估任务单一、评测数据集覆盖面不足以及测评基准数据污染等方面的局限,大模型在金融领域的潜力尚未得到充分探索。... 随着大语言模型(LLM)在金融领域的应用潜力不断显现,评估金融大模型的性能变得尤为重要。然而,由于当下的金融评估方法评估任务单一、评测数据集覆盖面不足以及测评基准数据污染等方面的局限,大模型在金融领域的潜力尚未得到充分探索。基于此,提出了中文金融大模型评估方法CFB,构建36个数据集,涵盖24个金融任务,涉及多项问答、术语解释、文本生成、文本翻译、分类任务、语步识别、预测决策7个金融大模型测评任务,并构建了相应的测评基准。CFB提出的新思路包括:更广泛的任务和数据范围,引入了基于LLM的基准去污方法以及基于指令微调、知识检索增强和提示词工程3种方法的评估。并对包括GPT-4o、ChatGPT和Gemini在内的12个LLM进行了评估,实验结果显示,虽然LLM在信息提取和文本分析方面表现出色,但在高级推理和复杂任务方面存在困难。GPT-4o在信息提取和股票交易方面表现突出,而Gemini在文本生成和预测方面更胜一筹。经过指令微调的LLM在文本分析上有所提升,但对复杂任务提供的益处有限。 展开更多
关键词 金融大模型 评估基准 提示词工程 知识检索增强 指令微调
在线阅读 下载PDF
基于检索增强大语言模型的MBSE智能设计方法
19
作者 于晗 陈治源 +2 位作者 熊熙瑞 戴原星 蔡鸿明 《图学学报》 CSCD 北大核心 2024年第6期1188-1199,共12页
基于模型的系统工程(MBSE)是当今产品数字化设计的重要方法之一。然而由于系统工程极高的专业性和产品极高的复杂关联性,在复杂产品上应用基于模型的系统工程十分困难。针对这一问题,一种基于检索增强大语言模型的智能化设计方法被首次... 基于模型的系统工程(MBSE)是当今产品数字化设计的重要方法之一。然而由于系统工程极高的专业性和产品极高的复杂关联性,在复杂产品上应用基于模型的系统工程十分困难。针对这一问题,一种基于检索增强大语言模型的智能化设计方法被首次提出。方法首先建立了面向模型对象的多模态向量表示方法,通过检索增强生成技术,引入领域知识和建模规则,引导大模型更准确地生成MBSE模型视图;其次,提出了基于MBSE元素关联的视图优化方法,通过上下文交互结果交叉验证模型准确性;再次,通过大语言模型对建模工具接口调用和对候选零件的选择,实现设计模型和物料树的生成;最后,构建了一个包含24个场景模型的数据集对方法进行验证,实验结果表明该方法具有较高的准确性和可用性。以喷水推进装置为建模对象的案例研究也表明该方法能在保持可用性的基础上有效提升建模效率,对于基于MBSE方法的智能化具有重要意义。 展开更多
关键词 基于模型的系统工程 大语言模型 智能设计 提示词工程 计算机辅助设计
在线阅读 下载PDF
双引擎智能分析系统在财政支出审计中的应用研究
20
作者 田挺 《审计研究》 2025年第5期27-36,共10页
DeepSeek凭借大幅下降的算力成本和强大的思维链推理能力,为各行各业应用人工智能大模型带来了新的突破和可能。本文分析了审计机关获取数据情况及其价值,剖析直接应用大模型处理结构化数据存在的输出篡改、效果波动和人工冗余三大技术... DeepSeek凭借大幅下降的算力成本和强大的思维链推理能力,为各行各业应用人工智能大模型带来了新的突破和可能。本文分析了审计机关获取数据情况及其价值,剖析直接应用大模型处理结构化数据存在的输出篡改、效果波动和人工冗余三大技术瓶颈,提出“规则引擎+智能引擎”双层协同架构,即通过规则确定性逻辑与大模型语义推理的互补性协同,实现自然语言驱动的审计模式,为审计数字化转型提供了可扩展、高可控的技术路径,进一步挖掘释放结构化数据价值。通过该架构,在财政支出智能分类场景中,系统实现三级分类动态构建与摘要语义解析,破解了科目颗粒度不足与主观错配难题;在违规支出挖掘场景中,依托大模型的多维度协同研判与跨记录关联分析,有效识别科目嫁接、拆分报销等隐蔽违规行为。 展开更多
关键词 大模型 双引擎架构 思维链推理 提示词工程 财政支出审计
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部