期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
武信:一种垂直领域大语言模型系统架构设计与实证
1
作者 朱新立 高志强 +2 位作者 姬纬通 李少华 李松杰 《数据采集与处理》 北大核心 2025年第3期637-646,共10页
在定制化应用场景下亟需提升大语言模型(Large language models,LLMs)在特定垂直领域的语言理解和生成能力。本文提出一种适用于垂直领域的大语言模型系统开发范式——武信。其涵盖架构、数据、模型和训练等大语言模型系统的系列开发方... 在定制化应用场景下亟需提升大语言模型(Large language models,LLMs)在特定垂直领域的语言理解和生成能力。本文提出一种适用于垂直领域的大语言模型系统开发范式——武信。其涵盖架构、数据、模型和训练等大语言模型系统的系列开发方法,利用人在回路的数据增强提升军事训练伤问答数据集的质量,采用梯度低秩投影(GaLore)策略对轻量级基座大语言模型进行高效全参微调。实验结果表明,所采用的全参微调方法在收敛性和准确性指标上优于主流的LoRA微调,所训练的武信大模型在军事训练伤防治专业知识理解、克服“幻觉”等方面优势明显,相关成果可为垂直领域问答大模型系统设计与应用提供参考。 展开更多
关键词 数据增强 大语言模型系统 全参微调 垂直领域模型
在线阅读 下载PDF
从通用到垂直:大模型赋能管理学研究的新路径 被引量:1
2
作者 魏炜 张坤 徐哲淇 《管理学报》 北大核心 2025年第1期1-11,共11页
通过梳理人工智能的现有技术进展,重点提出了垂直领域大模型及其技术原理,尤其是多智能体系统在管理学研究中的应用,分析对比了人工智能技术在管理学研究中出现的理论方法,并探究了不同方法论在管理学领域的优点与不足。通过ExpertCPT... 通过梳理人工智能的现有技术进展,重点提出了垂直领域大模型及其技术原理,尤其是多智能体系统在管理学研究中的应用,分析对比了人工智能技术在管理学研究中出现的理论方法,并探究了不同方法论在管理学领域的优点与不足。通过ExpertCPT的案例,详细阐述了垂直领域大模型优化管理学研究过程中每一步的实现过程,提出了人工智能技术在管理学研究中的新理论方法,即基于垂直领域大模型的多智能体系统。研究结果发现,人工智能的新技术方法论可以提升研究效率并推动研究创新,具体包括为构建研究问题提出新视角、优化文献检索与整理、自动化数据收集与分析能力、提升数据可视化、智能化文献参考和引用管理以及数字化同行评审和出版过程。此外,还进一步探讨了垂直领域大模型助力管理学研究后续要关注的话题及未来的研究方向,为学术界提供了在管理学研究中有效利用人工智能技术的具体路径和方法。 展开更多
关键词 人工智能 管理学研究 生成式人工智能 垂直领域模型 多智能体
在线阅读 下载PDF
垂直领域大模型的定制化:理论基础与关键技术 被引量:26
3
作者 陈浩泷 陈罕之 +3 位作者 韩凯峰 朱光旭 赵奕晨 杜滢 《数据采集与处理》 CSCD 北大核心 2024年第3期524-546,共23页
随着ChatGPT等基于大模型的产品展现出强大的通用性能,学术界和工业界正积极探索如何将这些模型适配到特定行业和应用场景中,即进行垂直领域大模型的定制化。然而,现有的通用大模型可能无法完全适配特定领域数据的格式,或不足以捕捉该... 随着ChatGPT等基于大模型的产品展现出强大的通用性能,学术界和工业界正积极探索如何将这些模型适配到特定行业和应用场景中,即进行垂直领域大模型的定制化。然而,现有的通用大模型可能无法完全适配特定领域数据的格式,或不足以捕捉该领域的独特需求。因此,本文旨在探讨垂直领域大模型定制化的方法论,包括大模型的定义和类别、通用架构的描述、大模型有效性背后的理论基础,以及几种可行的垂直领域大模型构建方法,期望通过这些内容为相关领域的研究者和从业者在垂直领域大模型定制化方面提供指导和参考。 展开更多
关键词 人工智能 垂直领域模型 多模态大模型 预训练大模型 模型微调
在线阅读 下载PDF
印刷领域专用服务型大型语言模型的研究与应用
4
作者 程朝 李金栋 张国伟 《印刷与数字媒体技术研究》 北大核心 2025年第4期221-228,共8页
大型语言模型(Large Language Model,LLM)在处理常规语言指令方面表现出色,但是处理印刷领域相关专业问题的能力还有待提升。本研究通过构建高质量的印刷领域微调数据集对开源LLM进行微调优化,利用清晰的微调提示词引导模型生成符合期... 大型语言模型(Large Language Model,LLM)在处理常规语言指令方面表现出色,但是处理印刷领域相关专业问题的能力还有待提升。本研究通过构建高质量的印刷领域微调数据集对开源LLM进行微调优化,利用清晰的微调提示词引导模型生成符合期望的回答。基于此,设计了一个针对印刷领域应用场景的服务型LLM,借助定制化训练提高其在印刷领域的表现能力。该过程主要涉及两项关键工作:通过收集、清洗、标注和扩增数据等方法,构建一个印刷领域微调数据集;选择Qwen-7B-Chat作为基座模型进行监督式微调,结合LoRA方法以实现参数高效的任务适应,并借助AdamW优化器策略对LLM的微调训练过程进行优化。验证结果表明,微调后的Qwen-7B-Chat模型相较原模型在回答长度上提升了约302.92%,并在回答质量评估环节保持了更高的满意率。 展开更多
关键词 垂直领域模型 印刷领域 监督式微调 LoRA AdamW
在线阅读 下载PDF
基于大语言模型的航空发动机领域高质量数据集构建
5
作者 邹冠沄 王存俊 +2 位作者 孔寅豪 马小庆 李丕绩 《数据采集与处理》 北大核心 2025年第3期603-615,共13页
随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构... 随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。 展开更多
关键词 大语言模型 垂直领域模型 问答数据生成 问答数据质量评估
在线阅读 下载PDF
油气大模型发展方向及实施关键路径 被引量:3
6
作者 熊华平 赵春宇 刘万伟 《大庆石油地质与开发》 CAS 北大核心 2024年第3期214-224,共11页
大庆油田历经60余年的勘探开发,面临着理论创新、技术突破和现场实施等诸多挑战。在这个过程中,传统的数学模型在处理复杂的地质数据和工程数据时已接近瓶颈,需要探索新的研究范式。近年来,大模型特别是多模态生成式大模型作为一种基于... 大庆油田历经60余年的勘探开发,面临着理论创新、技术突破和现场实施等诸多挑战。在这个过程中,传统的数学模型在处理复杂的地质数据和工程数据时已接近瓶颈,需要探索新的研究范式。近年来,大模型特别是多模态生成式大模型作为一种基于大数据、大模型的智能化技术,能够处理大规模、异源、异构的数据,有望更好地应对油气勘探开发领域中的复杂性和不确定性,重塑油气领域的数字化流程,成为油气行业新的发展契机。从油气大模型产生的技术需求、时代背景出发,探索油气大模型技术体系,对油气大模型建设提出设想。具体方案从建设目标、建设原则开始,设计技术架构、给出实施路径,横向上规划4个实施阶段、纵向上规划4个研究领域,设计15项关键任务,进一步为大模型落地,规划了数据库、知识库、成果库和协同研究4项配套体系建设、制定13项关键技术,逐步推进大模型对“数”“图”“体”的理解,最后对大模型在未来油气研究领域的应用场景进行了展望。 展开更多
关键词 油气大模型 多模态 生成式预训练模型 垂直领域模型 指令微调
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部