期刊文献+
共找到553篇文章
< 1 2 28 >
每页显示 20 50 100
Capability requirements modeling and verification based on fuzzy ontology 被引量:4
1
作者 Qingchao Dong Zhixue Wang Weixing Zhu Hongyue He 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第1期78-87,共10页
The capability requirements of the command, control, communication, computing, intelligence, surveillance, reconnaissance (C41SR) systems are full of uncertain and vague information, which makes it difficult to mode... The capability requirements of the command, control, communication, computing, intelligence, surveillance, reconnaissance (C41SR) systems are full of uncertain and vague information, which makes it difficult to model the C41SR architecture. The paper presents an approach to modeling the capability requirements with the fuzzy unified modeling language (UML) and building domain ontologies with fuzzy description logic (DL). The UML modeling constructs are extended according to the meta model of Depart- ment of Defense Architecture Framework to improve their domain applicability, the fuzzy modeling mechanism is introduced to model the fuzzy efficiency features of capabilities, and the capability requirement models are converted into ontologies formalized in fuzzy DL so that the model consistency and reasonability can be checked with a DL reasoning system. Finally, a case study of C41SR capability requirements model checking is provided to demonstrate the availability and applicability of the method. 展开更多
关键词 fuzzy ontology fuzzy unified modeling language (UML) fuzzy description logic (DL) model checking.
在线阅读 下载PDF
基于大语言模型技术的古籍限定域关系抽取及应用研究 被引量:1
2
作者 刘畅 张琪 +4 位作者 王东波 沈思 吴梦成 刘浏 苏雨诗 《情报学报》 北大核心 2025年第2期200-219,共20页
古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟... 古籍文本中的细粒度知识单元的自动抽取和结构化能够为群体传记、历史地图等古籍数字人文研究提供数据基础。基于判别式模型的抽取方法严重受制于古汉语本身语义的复杂性和训练样本的缺失,抽取效果和领域迁移的效果受到影响,相关研究亟待生成式人工智能技术的赋能。本研究探索了基于大语言模型的古籍领域限定域关系抽取方法和高质量训练语料自动生成方法。通过比较不同提示模板对模型抽取性能的影响,证明了微调方法对模型性能提升具有显著价值。基于ChatGPT4的API服务,结合自指令、思维链与人类反馈合成古籍限定域关系抽取数据集,在数据增强后于两种古籍关系抽取数据集上分别取得56.07%和30.50%的F1值,迁移能力较两种使用全部数据训练的模型均取得了显著提升。本研究还探索了协同使用自指令模型和自动评价模型合成训练语料和评价信息,并基于合成数据训练模型,有效缓解了训练数据不足的问题。研究结果表明,使用大语言模型抽取关系三元组与合成训练数据,能够显著降低过往限定域关系抽取的人力成本,有助于提升古籍领域知识图谱的构建效率。 展开更多
关键词 大语言模型 古籍智能 限定域关系抽取 AI生成数据 数字人文
在线阅读 下载PDF
土木工程专业知识驱动大语言模型构建与评测体系
3
作者 周颖 孟诗乔 +1 位作者 徐灏然 冷皓 《同济大学学报(自然科学版)》 北大核心 2025年第6期831-840,共10页
为解决通用大语言模型在土木工程领域应用中缺乏专业知识而导致的局限性问题,提出了一种专为土木工程领域设计的知识大模型―CivilGPT。通过多步骤的技术路线构建了CivilGPT模型,包括数据预处理、建立专业知识图谱、生成和优化自动化数... 为解决通用大语言模型在土木工程领域应用中缺乏专业知识而导致的局限性问题,提出了一种专为土木工程领域设计的知识大模型―CivilGPT。通过多步骤的技术路线构建了CivilGPT模型,包括数据预处理、建立专业知识图谱、生成和优化自动化数据集、分阶段预训练和微调,以及与工程任务的对齐,确保模型能够在土木工程领域实现准确的知识表达和推理能力。此外,建立了基于土木工程资格考试的标准化评测框架Civil-Bench,涵盖13类注册工程师考试题目,包含14823道客观题和269道主观题。通过测试15个国内外语言模型,结果显示CivilGPT在土木工程知识理解、推理能力和复杂问题解决方面具有显著优势。该研究为土木工程领域智能化发展奠定了技术基础,为其他专业领域模型开发提供了重要参考。 展开更多
关键词 土木工程 大语言模型 CivilGPT 领域知识图谱 Civil-Bench评测框架
在线阅读 下载PDF
大模型在垂直领域应用的现状与挑战 被引量:3
4
作者 籍欣萌 昝红英 +1 位作者 崔婷婷 张坤丽 《计算机工程与应用》 北大核心 2025年第12期1-11,共11页
近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的... 近年来,以ChatGPT为代表的大语言模型在多个领域受到广泛的关注,并取得优异的表现,推动了人工智能技术的新一轮发展浪潮。目前国产大模型数量已有上百个,覆盖多个行业领域,应用场景也不断扩展。为了更好地应对大模型在自然语言处理中的发展及其对通用任务和领域应用带来的冲击,对自然语言处理和大模型的发展历程进行回顾,阐述了当前大模型的相关技术以及大模型在医疗、法律、金融等垂直领域的应用,并对大模型在应用过程中面临的挑战如能力缺陷、协同问题等作出分析。最后,针对这些问题探讨了大模型在实际应用中的未来研究方向。 展开更多
关键词 自然语言处理 人工智能 大语言模型 垂直领域
在线阅读 下载PDF
大语言模型驱动的跨领域属性级情感分析 被引量:4
5
作者 李诗晨 王中卿 周国栋 《软件学报》 北大核心 2025年第2期644-659,共16页
属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战... 属性级情感分析作为一种细粒度情感分析方法,目前在许多应用场景中都具有重要作用.然而,随着社交媒体和在线评论的日益广泛以及各类新兴领域的出现,使得跨领域属性级情感分析面临着标签数据不足以及源领域与目标领域文本分布差异等挑战.目前已有许多数据增强方法试图解决这些问题,但现有方法生成的文本仍存在语义不连贯、结构单一以及特征与源领域过于趋同等问题.为了克服这些问题,提出一种基于大语言模型(large language model,LLM)数据增强的跨领域属性级情感分析方法.所提方法利用大模型丰富的语言知识,合理构建针对跨领域属性级别情感分析任务的引导语句,挖掘目标领域与源领域相似文本,通过上下文学习的方式,使用领域关联关键词引导LLM生成目标领域有标签文本数据,用以解决目标领域数据缺乏以及领域特异性问题,从而有效提高跨领域属性级情感分析的准确性和鲁棒性.所提方法在多个真实数据集中进行实验,实验结果表明,该方法可以有效提升基线模型在跨领域属性级情感分析中的表现. 展开更多
关键词 属性级情感分析 大语言模型(LLM) 迁移学习 数据增强 领域适应
在线阅读 下载PDF
大语言模型和知识图谱协同的跨域异质数据查询框架 被引量:2
6
作者 吴文隆 尹海莲 +7 位作者 王宁 徐梦飞 赵鑫喆 殷崭祚 刘元睿 王昊奋 丁岩 李博涵 《计算机研究与发展》 北大核心 2025年第3期605-619,共15页
大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和... 大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性. 展开更多
关键词 大语言模型 跨域异质数据 知识图谱 多域数据查询 数据治理
在线阅读 下载PDF
Modelica语言及其多领域统一建模与仿真机理 被引量:126
7
作者 赵建军 丁建完 +1 位作者 周凡利 陈立平 《系统仿真学报》 CAS CSCD 北大核心 2006年第z2期570-573,共4页
详细介绍了Modelica语言及其主要特点,系统地阐述了Modelica语言的多领域统一建模与仿真原理,分析了Modelica语言适合于复杂系统建模的内在原因,探讨了基于Modelica语言的复杂产品建模方法,综述了基于Modelica语言的建模仿真工具研究现... 详细介绍了Modelica语言及其主要特点,系统地阐述了Modelica语言的多领域统一建模与仿真原理,分析了Modelica语言适合于复杂系统建模的内在原因,探讨了基于Modelica语言的复杂产品建模方法,综述了基于Modelica语言的建模仿真工具研究现状,总结了采用Modelica语言进行多领域统一建模的优势。 展开更多
关键词 多领域 统一建模 协同仿真 Modlica
在线阅读 下载PDF
面向列车运行组织的多分辨率铁路基础设施数据模型及应用
8
作者 郑然斐 孟令云 +3 位作者 苗建瑞 蒋熙 廖正文 李冰 《铁道运输与经济》 北大核心 2025年第6期77-89,共13页
刻画铁路基础设施信息的数据文件是列车运行组织生产智能化的必要条件,也是开展相关研究的数据底座。铁路运输涉及要素众多,组织列车运行时天然地在不同层级、不同岗位、不同业务下需要同一事物不同分辨率的信息。为满足未来铁路列车运... 刻画铁路基础设施信息的数据文件是列车运行组织生产智能化的必要条件,也是开展相关研究的数据底座。铁路运输涉及要素众多,组织列车运行时天然地在不同层级、不同岗位、不同业务下需要同一事物不同分辨率的信息。为满足未来铁路列车运行组织各层级、岗位、业务轴面协同、一体化联通的需求,以及针对不同分辨率场景的科研成果的便利整合与复用,提出了一种面向列车运行组织的刻画铁路基础设施信息的多分辨率可扩展标记语言(XML)数据模型。使用统一建模语言(UML)明确了模型组织架构,对宏观、中观、微观分辨率下列车运行组织所需基础设施信息和组织逻辑格式进行了定义并设计了一致性交互规则。开发了生成该数据格式文件的电子路网绘制程序。基于以上成果建立了京沪高速铁路等线路的车站、线路、路网的不同分辨率数据文件,并将文件作为基础输入数据应用于列车运行仿真、调度监督、运行优化等领域。结果表明,该数据模型定义的文件可以满足多分辨率多种场景下的列车运行组织生产与研究需求。 展开更多
关键词 铁路运输 列车运行组织 多分辨率 数据模型 可扩展标记语言 统一建模语言
在线阅读 下载PDF
多领域建模语言Modelica类型解析研究与实现 被引量:5
9
作者 吴民峰 吴义忠 +1 位作者 周凡利 陈立平 《计算机工程与应用》 CSCD 北大核心 2006年第25期80-83,共4页
类型解析是编译器开发的一项重要工作,也是语义分析的一个最重要组成部分。基于Modelica建模语言,研究了编译器类型系统的作用域、类型检查等关键技术,提出了类型系统的解析和查找机制,实现了类型检查及错误处理机制,并在多领域物理系... 类型解析是编译器开发的一项重要工作,也是语义分析的一个最重要组成部分。基于Modelica建模语言,研究了编译器类型系统的作用域、类型检查等关键技术,提出了类型系统的解析和查找机制,实现了类型检查及错误处理机制,并在多领域物理系统建模与仿真平台MWorks系统中得到应用。 展开更多
关键词 类型系统 modelICA 多领域 建模语言
在线阅读 下载PDF
多体动力学模型的Modelica语言建模 被引量:3
10
作者 刘俊 黄运保 +1 位作者 陈立平 王启富 《中国机械工程》 EI CAS CSCD 北大核心 2010年第9期1088-1093,共6页
对Adams多体模型结构及Modelica模型的转换方法进行了研究。对多体动力学模型结构及建模方式进行分析,根据Adams多体模型结构设计了对应的Modelica多体模型结构。研究了Adams多体模型各组件包含的信息,以及与Modelica模型的异同,提出了... 对Adams多体模型结构及Modelica模型的转换方法进行了研究。对多体动力学模型结构及建模方式进行分析,根据Adams多体模型结构设计了对应的Modelica多体模型结构。研究了Adams多体模型各组件包含的信息,以及与Modelica模型的异同,提出了各多体组件的转换方法。最后给出了多体模型转换验证实例与结果。该研究有助于提高多领域仿真系统的多体建模效率及与传统多体系统的兼容性。 展开更多
关键词 多领域统一建模 modelICA语言 多体动力学模型 模型转换
在线阅读 下载PDF
基于仿真建模语言Modelica的多领域仿真实现 被引量:9
11
作者 于涛 曾庆良 《山东科技大学学报(自然科学版)》 CAS 2005年第4期13-16,共4页
介绍了Modelica语言发展背景及特点,并对其语法结构进行了分析。介绍了Modelica模型库和Modelica仿真建模工具。最后,在仿真建模软件Dymola中,对一直流电机驱动系统进行了建模和仿真。仿真结果证明,Modelica语言及其模型库简单、易用,... 介绍了Modelica语言发展背景及特点,并对其语法结构进行了分析。介绍了Modelica模型库和Modelica仿真建模工具。最后,在仿真建模软件Dymola中,对一直流电机驱动系统进行了建模和仿真。仿真结果证明,Modelica语言及其模型库简单、易用,在多领域仿真建模中有很好的发展前景。 展开更多
关键词 多领域仿真 仿真建模语言 modelICA 面向对象
在线阅读 下载PDF
基于Modelica的电动汽车悬架系统建模与仿真分析 被引量:2
12
作者 刘炜 吴义忠 +1 位作者 陈立平 熊会元 《汽车技术》 北大核心 2014年第9期43-47,共5页
基于多领域统一建模的标准语言Modelica建立了电动汽车悬架系统模型库,并以一款电动客车的悬架系统为研究对象,对其操纵稳定性和行驶平顺性进行仿真分析,验证了悬架系统建模的准确性。采用正交试验方法对行驶平顺性进行了优化。仿真和... 基于多领域统一建模的标准语言Modelica建立了电动汽车悬架系统模型库,并以一款电动客车的悬架系统为研究对象,对其操纵稳定性和行驶平顺性进行仿真分析,验证了悬架系统建模的准确性。采用正交试验方法对行驶平顺性进行了优化。仿真和优化结果表明,所设计悬架能够满足电动汽车的性能需求。 展开更多
关键词 多领域统一建模 悬架系统 modelICA 电动汽车
在线阅读 下载PDF
基于轻量级大语言模型的茶叶智能问答方法
13
作者 裴国权 钱雪英 +3 位作者 周兵 王白娟 刘自高 吴文斗 《农业工程学报》 北大核心 2025年第15期174-182,共9页
通用大语言模型在茶叶智能问答垂直领域存在专业性不足、行业知识覆盖不全面、部署成本高等问题,该研究提出了一种轻量级茶叶智能问答模型ChatTea。研究以茶叶种植、加工及病虫害防治等领域的专业知识为基础,结合通用大语言模型和人工... 通用大语言模型在茶叶智能问答垂直领域存在专业性不足、行业知识覆盖不全面、部署成本高等问题,该研究提出了一种轻量级茶叶智能问答模型ChatTea。研究以茶叶种植、加工及病虫害防治等领域的专业知识为基础,结合通用大语言模型和人工半监督方法构建高质量问答语料库,并在Meta-LLaMA-3.1-8B-Instruct模型上通过低秩矩阵微调训练ChatTea模型。试验结果显示,ChatTea在双语评估得分(BLEU-4)、单字重叠率(ROUGE-1)、双字重叠率(ROUGE-2)和最长公共子序列重叠率(ROUGE-L)四项评估指标上分别达到21.73%、43.68%、21.33%和37.26%,相较基座模型分别提升了18.58、26.14、17.22、27.69个百分点,每秒训练步数从2.90提升至18.40。ChatTea在提升专业问答能力的同时兼具轻量化特性,为茶叶及其他农作物领域的智能问答方法构建提供了思路。 展开更多
关键词 智能问答 大语言模型 茶叶 LLAMA 轻量级 垂直领域
在线阅读 下载PDF
复杂系统的MBSE建模及可靠性评估方法
14
作者 李子航 王国新 +2 位作者 马君达 鲁金直 阎艳 《国防科技大学学报》 北大核心 2025年第2期183-192,共10页
针对复杂系统设计过程缺乏早期可靠性评估的问题,提出一种基于模型的系统工程方法支持复杂系统的设计及可靠性评估。结合复杂系统的研发特点,提出一种基于“使命、运行、功能、逻辑、物理、可靠性”的基于模型的系统工程(model-based sy... 针对复杂系统设计过程缺乏早期可靠性评估的问题,提出一种基于模型的系统工程方法支持复杂系统的设计及可靠性评估。结合复杂系统的研发特点,提出一种基于“使命、运行、功能、逻辑、物理、可靠性”的基于模型的系统工程(model-based systems engineering, MBSE)建模方法,支持复杂系统设计和可靠性评估;利用基于“图、对象、属性、点、关系、角色”的系统建模语言KARMA对上述过程进行统一表达;通过KARMA的代码生成功能实现图模型到计算模型的映射,完成复杂系统可靠性的评估;将方法应用于液压系统案例,结果表明所提方法对于复杂系统设计和评估具备有效性。 展开更多
关键词 贝叶斯网络 系统可靠性 故障树 MBSE 特定域建模 KARMA语言
在线阅读 下载PDF
大语言模型在代码优化任务中的能力探究及改进方法
15
作者 王志鹏 何铁科 +1 位作者 赵若愚 郑滔 《软件学报》 北大核心 2025年第6期2477-2500,共24页
代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用... 代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用传统代码质量评估指标(例如,BLEU,CodeBLEU,edit progress)对4种主流大语言模型和4种代表性小规模预训练模型在代码优化任务的表现进行评估,发现大语言模型在审查前代码优化子任务的优化质量劣于小规模预训练模型.由于现有代码质量评估指标难以解释上述现象,提出基于Unidiff的代码优化评估指标,量化优化过程中的变更操作,以解释劣势原因并揭示模型执行变更操作的倾向性:(1)审查前代码优化任务难度较大,模型执行正确变更操作的准确度极低,且大语言模型比小规模预训练模型表现更为“激进”,即倾向于执行更多的代码变更操作,导致其表现不佳;(2)相比小规模预训练模型,大语言模型在代码优化任务倾向于执行更多插入(ADD)和修改(MODIFY)变更操作且ADD变更操作平均插入的代码行数较多,进一步证明其“激进”性.为缓解大语言模型在审查前优化任务中的劣势,基于大语言模型和集成学习提出LLM-Voter方法,包含Inference-based(基于模型推理)和Confidence-based(基于置信度选择)两种子方案,旨在集成不同基模型的优势以提升代码优化质量.在此基础上,进一步引入优化判定机制,以增强模型的决策稳定性与可靠性.实验证明:基于置信度选择的LLM-Voter方法能够在大幅提高EM(exact match)值的同时获得优于所有基模型的优化质量,从而有效缓解大语言模型的劣势. 展开更多
关键词 代码审查 自动代码优化 大语言模型 统一差异格式 集成学习
在线阅读 下载PDF
基于查询感知和信息压缩的检索增强语言模型
16
作者 何欣洋 何智毅 +1 位作者 任思远 彭程 《计算机应用》 北大核心 2025年第S1期24-29,共6页
检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响... 检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响,而这些不相关的文档和文档中的噪声会误导LLM生成错误的答案,降低模型性能,并增加LLM的推理时间。针对上述问题,提出一种基于查询感知和信息压缩的检索增强语言模型。首先,在检索过程完成后,通过信息压缩模块利用关键句抽取模块来选择单个文档中的关键句;其次,通过重排器模块选择文档集中最相关的文档,从而达到去除文档中的噪声和过滤不相关文档的目的;最后,提出基于查询感知的上下文学习(ICL)模块,通过在训练集中检索与输入最相似的示例对并把它们插入到LLM的上下文中,利用LLM的ICL能力来提高模型性能。实验结果显示,相比最好的基线模型REAR(RElevance-Aware Retrieval-augmented framework),所提模型在NQ(Natural Questions)、SQuAD(Stanford Question Answering Dataset)和TQA(TriviaQA)数据集的F1值上分别获得了0.70、0.96、1.23个百分点的提升,在NQ和SQuAD数据集的EM(Exact Match)值上分别获得了1.13和0.82个百分点的提升,证明了所提模型在开放域问答(ODQA)任务上的有效性。此外,由于所提出的模型无需额外训练,降低了对计算资源的需求,并且该模型可以应用到任意LLM中,体现了所提模型广泛的适用性。 展开更多
关键词 检索增强生成 大语言模型 上下文学习 信息压缩 开放域问答
在线阅读 下载PDF
基于Modelica的磁流变制动器多领域建模与仿真
17
作者 李志华 原龙昊 龚友平 《机电工程》 CAS 2015年第12期1539-1543,共5页
针对磁流变制动器的多领域耦合建模问题,对磁流变制动器的工作原理和多领域模型的构建进行了研究。基于Modelica/MWorks平台,采用多领域统一建模方法,建立了磁流变制动器的多领域统一模型。分析了结构参数、磁路参数、材料特性、工作间... 针对磁流变制动器的多领域耦合建模问题,对磁流变制动器的工作原理和多领域模型的构建进行了研究。基于Modelica/MWorks平台,采用多领域统一建模方法,建立了磁流变制动器的多领域统一模型。分析了结构参数、磁路参数、材料特性、工作间隙、转轴转速和励磁电流等因素对制动性能的影响,并对磁流变制动器在不同参数下的制动性能进行了仿真;同时,设计并制造了一款用于微型汽车的单盘式磁流变制动器,搭建了制动器性能测试平台,将实验结果与仿真结果进行了比较,两者基本吻合。研究结果表明,用多领域统一建模的方法构建的磁流变制动器模型具有较高的精确性,该建模仿真方法为磁流变制动器后续的优化设计及产品开发奠定了基础,对其他磁流变装置的研究开发也具有借鉴作用。 展开更多
关键词 磁流变制动器 多领域统一建模 仿真 modelICA
在线阅读 下载PDF
基于大语言模型的航空发动机领域高质量数据集构建
18
作者 邹冠沄 王存俊 +2 位作者 孔寅豪 马小庆 李丕绩 《数据采集与处理》 北大核心 2025年第3期603-615,共13页
随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构... 随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。 展开更多
关键词 大语言模型 垂直领域大模型 问答数据生成 问答数据质量评估
在线阅读 下载PDF
武信:一种垂直领域大语言模型系统架构设计与实证
19
作者 朱新立 高志强 +2 位作者 姬纬通 李少华 李松杰 《数据采集与处理》 北大核心 2025年第3期637-646,共10页
在定制化应用场景下亟需提升大语言模型(Large language models,LLMs)在特定垂直领域的语言理解和生成能力。本文提出一种适用于垂直领域的大语言模型系统开发范式——武信。其涵盖架构、数据、模型和训练等大语言模型系统的系列开发方... 在定制化应用场景下亟需提升大语言模型(Large language models,LLMs)在特定垂直领域的语言理解和生成能力。本文提出一种适用于垂直领域的大语言模型系统开发范式——武信。其涵盖架构、数据、模型和训练等大语言模型系统的系列开发方法,利用人在回路的数据增强提升军事训练伤问答数据集的质量,采用梯度低秩投影(GaLore)策略对轻量级基座大语言模型进行高效全参微调。实验结果表明,所采用的全参微调方法在收敛性和准确性指标上优于主流的LoRA微调,所训练的武信大模型在军事训练伤防治专业知识理解、克服“幻觉”等方面优势明显,相关成果可为垂直领域问答大模型系统设计与应用提供参考。 展开更多
关键词 数据增强 大语言模型系统 全参微调 垂直领域大模型
在线阅读 下载PDF
基于大语言模型的电信领域知识问答技术研究
20
作者 魏思言 许文嘉 《南京邮电大学学报(自然科学版)》 北大核心 2025年第4期125-134,共10页
为提升电信领域知识问答与通信协议解析的精度,解决传统方法依赖人工经验导致的泛化性差等问题,提出一种基于大语言模型的电信领域知识问答技术框架(Telecom‑LLM)。使用Qwen2.5‑7B模型作为基础架构,采用两阶段优化方法:引入基于LoRA的... 为提升电信领域知识问答与通信协议解析的精度,解决传统方法依赖人工经验导致的泛化性差等问题,提出一种基于大语言模型的电信领域知识问答技术框架(Telecom‑LLM)。使用Qwen2.5‑7B模型作为基础架构,采用两阶段优化方法:引入基于LoRA的监督微调方法和基于GRPO的强化学习方法。此外,构建大规模3GPP标准文档开放式问答数据集3GPPQnA(涵盖3000份技术文档,总规模超100万字)。结果表明,提出的Telecom‑LLM在电信领域知识问答任务中,在TeleQnA数据集上达到77.55%的准确率,在3GPPQnA数据集上取得59.01%的综合评分,相较基线模型提升显著。 展开更多
关键词 大语言模型 监督微调 强化学习 3GPP 电信领域 知识问答
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部