期刊文献+
共找到562篇文章
< 1 2 29 >
每页显示 20 50 100
Capability requirements modeling and verification based on fuzzy ontology 被引量:4
1
作者 Qingchao Dong Zhixue Wang Weixing Zhu Hongyue He 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第1期78-87,共10页
The capability requirements of the command, control, communication, computing, intelligence, surveillance, reconnaissance (C41SR) systems are full of uncertain and vague information, which makes it difficult to mode... The capability requirements of the command, control, communication, computing, intelligence, surveillance, reconnaissance (C41SR) systems are full of uncertain and vague information, which makes it difficult to model the C41SR architecture. The paper presents an approach to modeling the capability requirements with the fuzzy unified modeling language (UML) and building domain ontologies with fuzzy description logic (DL). The UML modeling constructs are extended according to the meta model of Depart- ment of Defense Architecture Framework to improve their domain applicability, the fuzzy modeling mechanism is introduced to model the fuzzy efficiency features of capabilities, and the capability requirement models are converted into ontologies formalized in fuzzy DL so that the model consistency and reasonability can be checked with a DL reasoning system. Finally, a case study of C41SR capability requirements model checking is provided to demonstrate the availability and applicability of the method. 展开更多
关键词 fuzzy ontology fuzzy unified modeling language (UML) fuzzy description logic (DL) model checking.
在线阅读 下载PDF
基于大语言模型技术的古籍限定域关系抽取及应用研究 被引量:3
2
作者 刘畅 张琪 +4 位作者 王东波 沈思 吴梦成 刘浏 苏雨诗 《情报学报》 北大核心 2025年第2期200-219,共20页
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟... 古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟待生成式人工智能技术的赋能。本研究探索了基于大语言模型的古籍领域限定域关系抽取方法和高质量训练语料自动生成方法。通过比较不同提示模板对模型抽取性能的影响,证明了微调方法对模型性能提升具有显著价值。基于ChatGPT4的API服务,结合自指令、思维链与人类反馈合成古籍限定域关系抽取数据集,在数据增强后于两种古籍关系抽取数据集上分别取得56.07%和30.50%的F1值,迁移能力较两种使用全部数据训练的模型均取得了显著提升。本研究还探索了协同使用自指令模型和自动评价模型合成训练语料和评价信息,并基于合成数据训练模型,有效缓解了训练数据不足的问题。研究结果表明,使用大语言模型抽取关系三元组与合成训练数据,能够显著降低过往限定域关系抽取的人力成本,有助于提升古籍领域知识图谱的构建效率。 展开更多
关键词 大语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文
在线阅读 下载PDF
新型电力系统下电力二次系统仿真的设计方法
3
作者 何瑞文 陆嘉亮 +2 位作者 杨长鑫 彭浩 MOHAMMAD Shahidehpour 《上海交通大学学报》 北大核心 2025年第10期1419-1430,共12页
在新形势下,为匹配新型电力系统需求,亟需对信息高度共享且需实时决策的电力二次系统进行建模与仿真.本文首次提出关联电力一次系统运行状态以实现电力二次系统仿真的设计方法.以功能描述复杂的智能变电站二次系统为研究对象,提出电力... 在新形势下,为匹配新型电力系统需求,亟需对信息高度共享且需实时决策的电力二次系统进行建模与仿真.本文首次提出关联电力一次系统运行状态以实现电力二次系统仿真的设计方法.以功能描述复杂的智能变电站二次系统为研究对象,提出电力一次与二次系统仿真的关联方法,阐明其仿真实现框架、数据交互方法及数据同步管理,从而将一次系统的实际电气量数据传导至二次侧,解决二次系统仿真数据源问题.然后,进一步提出电力二次系统的仿真设计方法,基于面向对象统一建模语言(UML)提出其系统级交互设计、元件级类设计和模块级状态设计的方法,从而解析电气量数据在二次系统的传输交互处理转换全流程.最后,以220/110/10kV主变间隔110kV侧出口处短路故障场景为算例,结合主变差动保护方案,仿真验证所提方法的有效性. 展开更多
关键词 新型电力系统 电力信息物理系统 电力二次系统 数据同步管理 统一建模语言
在线阅读 下载PDF
土木工程专业知识驱动大语言模型构建与评测体系
4
作者 周颖 孟诗乔 +1 位作者 徐灏然 冷皓 《同济大学学报(自然科学版)》 北大核心 2025年第6期831-840,共10页
为解决通用大语言模型在土木工程领域应用中缺乏专业知识而导致的局限性问题,提出了一种专为土木工程领域设计的知识大模型―CivilGPT。通过多步骤的技术路线构建了CivilGPT模型,包括数据预处理、建立专业知识图谱、生成和优化自动化数... 为解决通用大语言模型在土木工程领域应用中缺乏专业知识而导致的局限性问题,提出了一种专为土木工程领域设计的知识大模型―CivilGPT。通过多步骤的技术路线构建了CivilGPT模型,包括数据预处理、建立专业知识图谱、生成和优化自动化数据集、分阶段预训练和微调,以及与工程任务的对齐,确保模型能够在土木工程领域实现准确的知识表达和推理能力。此外,建立了基于土木工程资格考试的标准化评测框架Civil-Bench,涵盖13类注册工程师考试题目,包含14823道客观题和269道主观题。通过测试15个国内外语言模型,结果显示CivilGPT在土木工程知识理解、推理能力和复杂问题解决方面具有显著优势。该研究为土木工程领域智能化发展奠定了技术基础,为其他专业领域模型开发提供了重要参考。 展开更多
关键词 土木工程 大语言模型 CivilGPT 领域知识图谱 Civil-Bench评测框架
在线阅读 下载PDF
大模型在垂直领域应用的现状与挑战 被引量:5
5
作者 籍欣萌 昝红英 +1 位作者 崔婷婷 张坤丽 《计算机工程与应用》 北大核心 2025年第12期1-11,共11页
近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的... 近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。 展开更多
关键词 自然语言处理 人工智能 大语言模型 垂直领域
在线阅读 下载PDF
大语言模型和知识图谱协同的跨域异质数据查询框架 被引量:4
6
作者 吴文隆 尹海莲 +7 位作者 王宁 徐梦飞 赵鑫喆 殷崭祚 刘元睿 王昊奋 丁岩 李博涵 《计算机研究与发展》 北大核心 2025年第3期605-619,共15页
大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和... 大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性. 展开更多
关键词 大语言模型 跨域异质数据 知识图谱 多域数据查询 数据治理
在线阅读 下载PDF
大语言模型驱动的跨领域属性级情感分析 被引量:5
7
作者 李诗晨 王中卿 周国栋 《软件学报》 北大核心 2025年第2期644-659,共16页
属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战... 属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战.目前已有许多数据增强方法试图解决这些问题,但现有方法生成的文本仍存在语义不连贯、结构单一以及特征与源领域过于趋同等问题.为了克服这些问题,提出一种基于大语言模型(large language model,LLM)数据增强的跨领域属性级情感分析方法.所提方法利用大模型丰富的语言知识,合理构建针对跨领域属性级别情感分析任务的引导语句,挖掘目标领域与源领域相似文本,通过上下文学习的方式,使用领域关联关键词引导LLM生成目标领域有标签文本数据,用以解决目标领域数据缺乏以及领域特异性问题,从而有效提高跨领域属性级情感分析的准确性和鲁棒性.所提方法在多个真实数据集中进行实验,实验结果表明,该方法可以有效提升基线模型在跨领域属性级情感分析中的表现. 展开更多
关键词 属性级情感分析 大语言模型(LLM) 迁移学习 数据增强 领域适应
在线阅读 下载PDF
基于相关性提示的知识图谱问答 被引量:1
8
作者 马杰 孙望淳 +3 位作者 王平辉 张若非 李帅鹏 苏洲 《软件学报》 北大核心 2025年第9期4056-4071,共16页
大语言模型(large language model,LLM)随着不断发展,在开放领域取得了出色的表现.然而,由于缺乏专业知识,LLM在垂直领域问答任务上效果较差.这一问题引发了研究者的广泛关注.现有研究通过“检索-问答”的方式,将领域知识注入大语言模型... 大语言模型(large language model,LLM)随着不断发展,在开放领域取得了出色的表现.然而,由于缺乏专业知识,LLM在垂直领域问答任务上效果较差.这一问题引发了研究者的广泛关注.现有研究通过“检索-问答”的方式,将领域知识注入大语言模型,以增强其性能.然而该方式通常会检索到额外的噪声数据而导致LLM的性能损失.为了解决该问题,提出基于知识相关性的知识图谱问答方法.具体而言,将噪声数据与回答问题所需要的知识进行区分,在“检索-相关性评估-问答”的框架下,引导大语言模型选择合理的知识做出正确的回答.此外,提出一个机械领域知识图谱问答的数据集Mecha-QA,包含传统机械制造以及增材制造两个子领域,以推进该领域大语言模型与知识图谱问答相关的研究.为了验证所提方法的有效性,在Mecha-QA和航空航天领域数据集Aero-QA上进行实验.结果表明,该方法可以显著提升大语言模型在垂直领域知识图谱问答的性能. 展开更多
关键词 大语言模型 知识图谱 垂直领域 问答系统 知识检索
在线阅读 下载PDF
Modelica语言及其多领域统一建模与仿真机理 被引量:127
9
作者 赵建军 丁建完 +1 位作者 周凡利 陈立平 《系统仿真学报》 CAS CSCD 北大核心 2006年第z2期570-573,共4页
详细介绍了Modelica语言及其主要特点,系统地阐述了Modelica语言的多领域统一建模与仿真原理,分析了Modelica语言适合于复杂系统建模的内在原因,探讨了基于Modelica语言的复杂产品建模方法,综述了基于Modelica语言的建模仿真工具研究现... 详细介绍了Modelica语言及其主要特点,系统地阐述了Modelica语言的多领域统一建模与仿真原理,分析了Modelica语言适合于复杂系统建模的内在原因,探讨了基于Modelica语言的复杂产品建模方法,综述了基于Modelica语言的建模仿真工具研究现状,总结了采用Modelica语言进行多领域统一建模的优势。 展开更多
关键词 多领域 统一建模 协同仿真 Modlica
在线阅读 下载PDF
面向列车运行组织的多分辨率铁路基础设施数据模型及应用
10
作者 郑然斐 孟令云 +3 位作者 苗建瑞 蒋熙 廖正文 李冰 《铁道运输与经济》 北大核心 2025年第6期77-89,共13页
刻画铁路基础设施信息的数据文件是列车运行组织生产智能化的必要条件,也是开展相关研究的数据底座。铁路运输涉及要素众多,组织列车运行时天然地在不同层级、不同岗位、不同业务下需要同一事物不同分辨率的信息。为满足未来铁路列车运... 刻画铁路基础设施信息的数据文件是列车运行组织生产智能化的必要条件,也是开展相关研究的数据底座。铁路运输涉及要素众多,组织列车运行时天然地在不同层级、不同岗位、不同业务下需要同一事物不同分辨率的信息。为满足未来铁路列车运行组织各层级、岗位、业务轴面协同、一体化联通的需求,以及针对不同分辨率场景的科研成果的便利整合与复用,提出了一种面向列车运行组织的刻画铁路基础设施信息的多分辨率可扩展标记语言(XML)数据模型。使用统一建模语言(UML)明确了模型组织架构,对宏观、中观、微观分辨率下列车运行组织所需基础设施信息和组织逻辑格式进行了定义并设计了一致性交互规则。开发了生成该数据格式文件的电子路网绘制程序。基于以上成果建立了京沪高速铁路等线路的车站、线路、路网的不同分辨率数据文件,并将文件作为基础输入数据应用于列车运行仿真、调度监督、运行优化等领域。结果表明,该数据模型定义的文件可以满足多分辨率多种场景下的列车运行组织生产与研究需求。 展开更多
关键词 铁路运输 列车运行组织 多分辨率 数据模型 可扩展标记语言 统一建模语言
在线阅读 下载PDF
多领域建模语言Modelica类型解析研究与实现 被引量:5
11
作者 吴民峰 吴义忠 +1 位作者 周凡利 陈立平 《计算机工程与应用》 CSCD 北大核心 2006年第25期80-83,共4页
类型解析是编译器开发的一项重要工作,也是语义分析的一个最重要组成部分。基于Modelica建模语言,研究了编译器类型系统的作用域、类型检查等关键技术,提出了类型系统的解析和查找机制,实现了类型检查及错误处理机制,并在多领域物理系... 类型解析是编译器开发的一项重要工作,也是语义分析的一个最重要组成部分。基于Modelica建模语言,研究了编译器类型系统的作用域、类型检查等关键技术,提出了类型系统的解析和查找机制,实现了类型检查及错误处理机制,并在多领域物理系统建模与仿真平台MWorks系统中得到应用。 展开更多
关键词 类型系统 modelICA 多领域 建模语言
在线阅读 下载PDF
多体动力学模型的Modelica语言建模 被引量:3
12
作者 刘俊 黄运保 +1 位作者 陈立平 王启富 《中国机械工程》 EI CAS CSCD 北大核心 2010年第9期1088-1093,共6页
对Adams多体模型结构及Modelica模型的转换方法进行了研究。对多体动力学模型结构及建模方式进行分析,根据Adams多体模型结构设计了对应的Modelica多体模型结构。研究了Adams多体模型各组件包含的信息,以及与Modelica模型的异同,提出了... 对Adams多体模型结构及Modelica模型的转换方法进行了研究。对多体动力学模型结构及建模方式进行分析,根据Adams多体模型结构设计了对应的Modelica多体模型结构。研究了Adams多体模型各组件包含的信息,以及与Modelica模型的异同,提出了各多体组件的转换方法。最后给出了多体模型转换验证实例与结果。该研究有助于提高多领域仿真系统的多体建模效率及与传统多体系统的兼容性。 展开更多
关键词 多领域统一建模 modelICA语言 多体动力学模型 模型转换
在线阅读 下载PDF
基于仿真建模语言Modelica的多领域仿真实现 被引量:9
13
作者 于涛 曾庆良 《山东科技大学学报(自然科学版)》 CAS 2005年第4期13-16,共4页
介绍了Modelica语言发展背景及特点,并对其语法结构进行了分析。介绍了Modelica模型库和Modelica仿真建模工具。最后,在仿真建模软件Dymola中,对一直流电机驱动系统进行了建模和仿真。仿真结果证明,Modelica语言及其模型库简单、易用,... 介绍了Modelica语言发展背景及特点,并对其语法结构进行了分析。介绍了Modelica模型库和Modelica仿真建模工具。最后,在仿真建模软件Dymola中,对一直流电机驱动系统进行了建模和仿真。仿真结果证明,Modelica语言及其模型库简单、易用,在多领域仿真建模中有很好的发展前景。 展开更多
关键词 多领域仿真 仿真建模语言 modelICA 面向对象
在线阅读 下载PDF
基于Modelica的电动汽车悬架系统建模与仿真分析 被引量:2
14
作者 刘炜 吴义忠 +1 位作者 陈立平 熊会元 《汽车技术》 北大核心 2014年第9期43-47,共5页
基于多领域统一建模的标准语言Modelica建立了电动汽车悬架系统模型库,并以一款电动客车的悬架系统为研究对象,对其操纵稳定性和行驶平顺性进行仿真分析,验证了悬架系统建模的准确性。采用正交试验方法对行驶平顺性进行了优化。仿真和... 基于多领域统一建模的标准语言Modelica建立了电动汽车悬架系统模型库,并以一款电动客车的悬架系统为研究对象,对其操纵稳定性和行驶平顺性进行仿真分析,验证了悬架系统建模的准确性。采用正交试验方法对行驶平顺性进行了优化。仿真和优化结果表明,所设计悬架能够满足电动汽车的性能需求。 展开更多
关键词 多领域统一建模 悬架系统 modelICA 电动汽车
在线阅读 下载PDF
基于轻量级大语言模型的茶叶智能问答方法
15
作者 裴国权 钱雪英 +3 位作者 周兵 王白娟 刘自高 吴文斗 《农业工程学报》 北大核心 2025年第15期174-182,共9页
通用大语言模型在茶叶智能问答垂直领域存在专业性不足、行业知识覆盖不全面、部署成本高等问题,该研究提出了一种轻量级茶叶智能问答模型ChatTea。研究以茶叶种植、加工及病虫害防治等领域的专业知识为基础,结合通用大语言模型和人工... 通用大语言模型在茶叶智能问答垂直领域存在专业性不足、行业知识覆盖不全面、部署成本高等问题,该研究提出了一种轻量级茶叶智能问答模型ChatTea。研究以茶叶种植、加工及病虫害防治等领域的专业知识为基础,结合通用大语言模型和人工半监督方法构建高质量问答语料库,并在Meta-LLaMA-3.1-8B-Instruct模型上通过低秩矩阵微调训练ChatTea模型。试验结果显示,ChatTea在双语评估得分(BLEU-4)、单字重叠率(ROUGE-1)、双字重叠率(ROUGE-2)和最长公共子序列重叠率(ROUGE-L)四项评估指标上分别达到21.73%、43.68%、21.33%和37.26%,相较基座模型分别提升了18.58、26.14、17.22、27.69个百分点,每秒训练步数从2.90提升至18.40。ChatTea在提升专业问答能力的同时兼具轻量化特性,为茶叶及其他农作物领域的智能问答方法构建提供了思路。 展开更多
关键词 智能问答 大语言模型 茶叶 LLAMA 轻量级 垂直领域
在线阅读 下载PDF
复杂系统的MBSE建模及可靠性评估方法
16
作者 李子航 王国新 +2 位作者 马君达 鲁金直 阎艳 《国防科技大学学报》 北大核心 2025年第2期183-192,共10页
针对复杂系统设计过程缺乏早期可靠性评估的问题,提出一种基于模型的系统工程方法支持复杂系统的设计及可靠性评估。结合复杂系统的研发特点,提出一种基于“使命、运行、功能、逻辑、物理、可靠性”的基于模型的系统工程(model-based sy... 针对复杂系统设计过程缺乏早期可靠性评估的问题,提出一种基于模型的系统工程方法支持复杂系统的设计及可靠性评估。结合复杂系统的研发特点,提出一种基于“使命、运行、功能、逻辑、物理、可靠性”的基于模型的系统工程(model-based systems engineering, MBSE)建模方法,支持复杂系统设计和可靠性评估;利用基于“图、对象、属性、点、关系、角色”的系统建模语言KARMA对上述过程进行统一表达;通过KARMA的代码生成功能实现图模型到计算模型的映射,完成复杂系统可靠性的评估;将方法应用于液压系统案例,结果表明所提方法对于复杂系统设计和评估具备有效性。 展开更多
关键词 贝叶斯网络 系统可靠性 故障树 MBSE 特定域建模 KARMA语言
在线阅读 下载PDF
大语言模型在代码优化任务中的能力探究及改进方法
17
作者 王志鹏 何铁科 +1 位作者 赵若愚 郑滔 《软件学报》 北大核心 2025年第6期2477-2500,共24页
代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用... 代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用传统代码质量评估指标(例如,BLEU,CodeBLEU,edit progress)对4种主流大语言模型和4种代表性小规模预训练模型在代码优化任务的表现进行评估,发现大语言模型在审查前代码优化子任务的优化质量劣于小规模预训练模型.由于现有代码质量评估指标难以解释上述现象,提出基于Unidiff的代码优化评估指标,量化优化过程中的变更操作,以解释劣势原因并揭示模型执行变更操作的倾向性:(1)审查前代码优化任务难度较大,模型执行正确变更操作的准确度极低,且大语言模型比小规模预训练模型表现更为“激进”,即倾向于执行更多的代码变更操作,导致其表现不佳;(2)相比小规模预训练模型,大语言模型在代码优化任务倾向于执行更多插入(ADD)和修改(MODIFY)变更操作且ADD变更操作平均插入的代码行数较多,进一步证明其“激进”性.为缓解大语言模型在审查前优化任务中的劣势,基于大语言模型和集成学习提出LLM-Voter方法,包含Inference-based(基于模型推理)和Confidence-based(基于置信度选择)两种子方案,旨在集成不同基模型的优势以提升代码优化质量.在此基础上,进一步引入优化判定机制,以增强模型的决策稳定性与可靠性.实验证明:基于置信度选择的LLM-Voter方法能够在大幅提高EM(exact match)值的同时获得优于所有基模型的优化质量,从而有效缓解大语言模型的劣势. 展开更多
关键词 代码审查 自动代码优化 大语言模型 统一差异格式 集成学习
在线阅读 下载PDF
基于组合上下文提示的大型语言模型领域知识问答研究
18
作者 方全 张金龙 +1 位作者 王冰倩 胡骏 《计算机科学》 北大核心 2025年第11期13-21,共9页
近年来,大型语言模型的快速发展引起了社会各界的广泛关注。大型语言模型虽然天然适应各种自然语言处理任务,但是在特定领域的问答任务中,由于缺少针对垂直领域的训练,生成答案的可靠性和适用性往往不尽如人意。为提升领域知识问答系统... 近年来,大型语言模型的快速发展引起了社会各界的广泛关注。大型语言模型虽然天然适应各种自然语言处理任务,但是在特定领域的问答任务中,由于缺少针对垂直领域的训练,生成答案的可靠性和适用性往往不尽如人意。为提升领域知识问答系统的性能,提出了一种新的基于组合上下文提示的大型语言模型领域知识问答方法。组合上下文提示包括了领域知识上下文和问答示例上下文两部分。领域知识上下文由采用基于对比学习的密集检索器从领域知识库中检索得到,能够增强大型语言模型的领域专业知识处理能力。问答示例上下文则通过语义相似检索从训练集中取得,能够提升大型语言模型对问题意图的理解能力。最后,将得到的组合上下文提示输入经过领域知识微调后的大型语言模型中,生成最终的领域答案。通过充分的实验和与基线模型的综合比较证明,所提方法在BERTScore指标上精确度和召回率分别比ChatGPT提高了15.91%和16.14%,F1 Score比ChatGPT提高了15.87%。 展开更多
关键词 大语言模型 领域知识问答 组合上下文提示 对比学习 检索
在线阅读 下载PDF
基于大语言模型的中文开放领域实体关系抽取策略
19
作者 龚永罡 陈舒汉 +3 位作者 廉小亲 李乾生 莫鸿铭 刘宏宇 《计算机应用》 北大核心 2025年第10期3121-3130,共10页
大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略... 大语言模型(LLM)在中文开放领域的实体关系抽取(ERE)任务中存在抽取性能不稳定的问题,对某些特定领域文本和标注类别的识别精准率较低。因此,提出一种基于LLM的中文开放领域实体关系抽取策略——基于LLM多级对话策略(MLDS-LLM)。该策略利用LLM优秀的语义理解和迁移学习能力,通过多轮不同任务的对话实现实体关系抽取。首先,基于开放领域文本结构化逻辑和思维链(CoT)机制,使用LLM生成结构化摘要,避免模型产生关系、事实幻觉和无法兼顾后文信息的问题;其次,通过文本简化策略并引入可替换词表,减少上下文窗口的限制;最后,基于结构化摘要和简化文本构建多级提示模板,使用LLaMA-2-70B模型探究参数temperature对实体关系抽取的影响。测试了LLaMA-2-70B在使用所提策略前后进行实体关系抽取的精准率、召回率、调和平均值(F1)和精确匹配(EM)值。实验结果表明,在CL-NE-DS、DiaKG和CCKS2021等5个不同领域的中文数据集上,所提策略提升了LLM在命名实体识别(NER)和关系抽取(RE)上的性能。特别是在专业性强且模型零样本测试结果不佳的DiaKG和IEPA数据集上,在应用所提策略后,相较于少样本提示测试,在NER上模型的精准率分别提升了9.3和6.7个百分点,EM值提升了2.7和2.2个百分点;在RE上模型的精准率分别提升了12.2和16.0个百分点,F1值分别提升了10.7和10.0个百分点。实验结果验证了所提策略能有效提升LLM实体关系抽取的效果并解决模型性能不稳定的问题。 展开更多
关键词 大语言模型 中文开放领域 命名实体识别 关系抽取 提示学习
在线阅读 下载PDF
中文多技能对话评估
20
作者 柳泽明 程子豪 +3 位作者 刘晶晶 杨晓 郭园方 王蕴红 《智能系统学报》 北大核心 2025年第5期1281-1293,共13页
准确评估多技能对话系统的能力,对满足用户多样化的需求,例如社交闲聊、深入的知识对话、角色化聊天以及对话推荐至关重要。现有的基准仅针对特定对话技能的评估,无法有效地同时评估多种对话技能。为解决这一问题,本文构建了一个中文多... 准确评估多技能对话系统的能力,对满足用户多样化的需求,例如社交闲聊、深入的知识对话、角色化聊天以及对话推荐至关重要。现有的基准仅针对特定对话技能的评估,无法有效地同时评估多种对话技能。为解决这一问题,本文构建了一个中文多技能评估基准(multi-skill dialogue evaluation benchmark,MSDE),它包含1781个对话和21218条话语,覆盖4类常见的对话任务,即闲聊、知识对话、画像聊天和对话推荐。然后,本文基于MSDE做了大量实验,并分析了自动评估指标和人工评估指标的相关性。实验结果表明:1)在4类对话任务中,闲聊最难评估,知识对话最容易评估。2)不同指标在MSDE上的表现存在明显差异。3)对于人工评估,各指标在不同对话任务上的评估难度不同。部分数据发布在https://github.com/IRIP-LLM/MSDE,全部数据将在整理后发布。 展开更多
关键词 多技能对话 对话评估 闲聊 开放域对话 对话推荐 画像聊天 知识对话 大语言模型
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部