期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
大模型微调的多领域机器翻译方法综述 被引量:1
1
作者 陈子建 王斯日古楞 斯琴图 《计算机科学与探索》 北大核心 2025年第4期916-928,共13页
随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚... 随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚焦于多领域机器翻译任务中大模型微调技术的关键问题,系统性地综述了微调技术的核心原理、主要方法及应用效果,重点分析了全参数微调、参数高效微调和提示微调三类策略的性能表现与适用场景。深入探讨了不同微调方法的优势与局限性,重点分析了在资源受限条件下如何通过高效微调策略平衡领域泛化能力与任务特异性,展示了参数高效微调与提示微调在资源利用效率和领域适应性方面的显著优势。通过对比分析与实验验证,进一步评估了不同微调策略在领域迁移和资源利用方面的实际效果,并通过案例分析验证了其有效性。未来的研究方向应重点关注资源的高效利用、模型的领域自适应能力,以及翻译质量和鲁棒性的提升,从而推动多领域机器翻译系统在性能与适应性方面的持续发展。 展开更多
关键词 大模型微调 多领域机器翻译 全参数微调 参数高效微调 提示微调
在线阅读 下载PDF
融合大模型微调与图神经网络的知识图谱问答 被引量:4
2
作者 陈俊臻 王淑营 罗浩然 《计算机工程与应用》 CSCD 北大核心 2024年第24期166-176,共11页
传统知识图谱问答系统在处理自然语言问句时,常因语义解析不精确而导致错误。为解决这一问题,提出一种融合大模型微调和图神经网络的知识图谱问答方法。收集问题并定义问题的逻辑形式;利用大型预训练语言模型的强大语义解析能力,通过对... 传统知识图谱问答系统在处理自然语言问句时,常因语义解析不精确而导致错误。为解决这一问题,提出一种融合大模型微调和图神经网络的知识图谱问答方法。收集问题并定义问题的逻辑形式;利用大型预训练语言模型的强大语义解析能力,通过对问题及其对应逻辑形式构成的问答对进行微调,提升问题解析的精度;采用模糊集方法增强微调后的逻辑形式,提高其检索精度;利用图神经网络对这些逻辑形式进行关系投影和逻辑运算获取最终答案。在通用领域标准数据集WebQSP和ComplexWebQuestions上的实验验证表明,该方法在F1、Hit@1和ACC这三个指标上均优于基准模型。同时,方法也在垂直领域风电装备数据集、高速列车数据集上进行了应用和验证。 展开更多
关键词 知识图谱问答 大模型微调 逻辑形式 图神经网络检索
在线阅读 下载PDF
基于交替语言数据重构方法的跨语言文本相似度模型
3
作者 王轶 王坤宁 刘铭 《吉林大学学报(理学版)》 北大核心 2025年第2期551-558,共8页
针对现有多语言模型在预训练过程中对多语言数据集的利用效率低,导致跨语言上下文学习能力不足,进而产生语言偏差的问题,提出一种基于交替语言数据重构方法的跨语言文本相似度模型.该方法通过对称地替换平行语料中的中英文词语,形成重... 针对现有多语言模型在预训练过程中对多语言数据集的利用效率低,导致跨语言上下文学习能力不足,进而产生语言偏差的问题,提出一种基于交替语言数据重构方法的跨语言文本相似度模型.该方法通过对称地替换平行语料中的中英文词语,形成重构的预训练文本对,并利用上述文本对对多语言大模型mBERT(BERT-based-multilingual)进行基于数据重构的针对性预训练和微调处理.为验证该模型的可行性,在联合国平行语料数据集上进行实验,实验结果表明,该模型的相似度查准率优于mBERT和其他两种基线模型,其不仅可以进一步提高跨语言信息检索的准确性,并且可以降低多语言自然语言处理任务的研究成本. 展开更多
关键词 mBERT模型 文本相似度 多语言预训练模型 大模型微调
在线阅读 下载PDF
基于改进可控扩散模型的缺陷图像生成算法
4
作者 陈广庆 陈雅惠 +2 位作者 周鹏 刘梓煜 陈玉伦 《电子测量技术》 北大核心 2025年第6期152-160,共9页
工业场景下,缺陷工件的获取和标注非常困难,对工件缺陷检测带来极大的阻碍。通过少量真实缺陷样本生成大量缺陷样本,极大地缓解了缺陷样本稀缺的问题,但是现有的缺陷生成方法普遍存在生成缺陷样本的表观真实性差和与掩模对齐性差的问题... 工业场景下,缺陷工件的获取和标注非常困难,对工件缺陷检测带来极大的阻碍。通过少量真实缺陷样本生成大量缺陷样本,极大地缓解了缺陷样本稀缺的问题,但是现有的缺陷生成方法普遍存在生成缺陷样本的表观真实性差和与掩模对齐性差的问题。针对现有问题,文中提出了一种新颖的可控扩散模型AnomalyAlign来生成与掩膜高度对齐的逼真工业缺陷图像。AnomalyAlign在继承文生图大模型Stable Diffusion的先验知识基础上,提出了强语义对齐文本提示生成器,通过该生成器获取语义层面上与真实图像更加对齐的文本提示,促进了模型的收敛;同时,AnomalyAlign还提出了一种缺陷对齐损失来提高生成的缺陷图像和掩模之间的对齐性。通过MVTec-AD上的大量实验验证,AnomalyAlign可以生成与掩模高度对齐的逼真且多样化的缺陷图像,并有效地提升了下游缺陷检测任务的性能。 展开更多
关键词 工业缺陷检测 可控扩散模型 图像生成 微调大模型
在线阅读 下载PDF
垂直领域大模型的定制化:理论基础与关键技术 被引量:21
5
作者 陈浩泷 陈罕之 +3 位作者 韩凯峰 朱光旭 赵奕晨 杜滢 《数据采集与处理》 CSCD 北大核心 2024年第3期524-546,共23页
随着ChatGPT等基于大模型的产品展现出强大的通用性能,学术界和工业界正积极探索如何将这些模型适配到特定行业和应用场景中,即进行垂直领域大模型的定制化。然而,现有的通用大模型可能无法完全适配特定领域数据的格式,或不足以捕捉该... 随着ChatGPT等基于大模型的产品展现出强大的通用性能,学术界和工业界正积极探索如何将这些模型适配到特定行业和应用场景中,即进行垂直领域大模型的定制化。然而,现有的通用大模型可能无法完全适配特定领域数据的格式,或不足以捕捉该领域的独特需求。因此,本文旨在探讨垂直领域大模型定制化的方法论,包括大模型的定义和类别、通用架构的描述、大模型有效性背后的理论基础,以及几种可行的垂直领域大模型构建方法,期望通过这些内容为相关领域的研究者和从业者在垂直领域大模型定制化方面提供指导和参考。 展开更多
关键词 人工智能 垂直领域大模型 多模态大模型 预训练大模型 大模型微调
在线阅读 下载PDF
铁路自然语言大模型关键技术研究及应用展望 被引量:6
6
作者 史天运 李新琴 +3 位作者 代明睿 史维峰 李国华 杜文然 《中国铁路》 北大核心 2024年第7期7-14,共8页
人工智能自然语言大模型的涌现为行业深度赋能带来了新的曙光,研究铁路自然语言大模型关键技术及应用,对促进和统筹铁路人工智能发展具有重要意义。根据铁路人工智能应用需求,提出铁路自然语言大模型应用场景;依托铁路人工智能平台,设... 人工智能自然语言大模型的涌现为行业深度赋能带来了新的曙光,研究铁路自然语言大模型关键技术及应用,对促进和统筹铁路人工智能发展具有重要意义。根据铁路人工智能应用需求,提出铁路自然语言大模型应用场景;依托铁路人工智能平台,设计铁路自然语言大模型的总体架构,研究自然语言大模型关键技术,构建面向智能问答的铁路行业大模型,并以实际数据进行模型验证;最后从铁路运输组织、铁路运营安全、旅客服务方面对铁路自然语言大模型的发展和应用进行展望。 展开更多
关键词 智能高铁 人工智能 铁路自然语言大模型 应用场景 大模型架构 大模型微调 检索增强生成 铁路知识问答
在线阅读 下载PDF
Pipe-RLHF:计算模式感知的RLHF并行加速框架
7
作者 徐颖 王梦迪 +4 位作者 程龙 刘炼 赵世新 张磊 王颖 《计算机研究与发展》 北大核心 2025年第6期1513-1529,共17页
基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问... 基于人类反馈的强化学习(reinforcement learning with human feedback,RLHF)作为当前大语言模型(large language models,LLMs)对齐的主流方法,其核心优化算法——近端策略优化(proximal policy optimization,PPO)却面临着显著的效率问题.PPO由生成、推理、训练3个相互关联的阶段组成,各个阶段有着不同的计算特性.然而,现有的RLHF并行框架采用相同并行策略顺序执行PPO的所有阶段,这导致以下2个问题:其一,生成阶段不能充分利用计算资源,进而影响整体效率;其二,阶段间严格串行执行,未能充分利用潜在并行性.针对上述问题,提出了一个新型RLHF并行框架——Pipe-RLHF.该框架能够自适应地根据各阶段的计算特征确定最优并行策略,突破现有阶段串行范式,采用异步PPO算法发掘阶段间的并行性.具体而言,创新性地提出了适用于PPO生成阶段的延迟批间流水线并行方法,显著提升了该阶段的计算资源利用率;再次,使用异步PPO解放阶段间的依赖关系,将阶段间并行应用到PPO的加速上;最后,针对PPO算法的整体优化,构建了分层并行策略空间,并提出了一套优化算法以实现该空间中的最优解搜索.通过在多个大语言模型上的性能评估实验表明,相较于现有方法,Pipe-RLHF最高可实现3.7倍的加速比,充分验证了该框架的有效性和优越性. 展开更多
关键词 基于人类反馈的强化学习 近端策略优化 大模型微调 分布式系统 并行计算
在线阅读 下载PDF
基于微调Qwen2自动构建领域UML模型
8
作者 李嘉威 邓媛丹 陈波 《计算机科学》 2025年第S1期19-22,共4页
提出了一种基于大模型微调技术的领域UML(统一建模语言)自动构建系统,用于将各领域软件系统制作需求的自然语言描述自动转换为符合统一建模语言标准的UML类图。研究过程包括自然文本数据集构建、模型微调、量化部署以及前端交互界面的... 提出了一种基于大模型微调技术的领域UML(统一建模语言)自动构建系统,用于将各领域软件系统制作需求的自然语言描述自动转换为符合统一建模语言标准的UML类图。研究过程包括自然文本数据集构建、模型微调、量化部署以及前端交互界面的开发。通过此系统,非专业用户可以通过简单的自然语言输入,自动生成符合统一建模语言标准的UML类图,大大降低了时间和人力成本。 展开更多
关键词 大模型微调 领域建模 数据集构建 统一建模语言
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部