期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
PMoE:在P-tuning中引入混合专家的参数高效微调框架 被引量:4
1
作者 王浩 王珺 +3 位作者 胡海峰 周飞飞 龚锐 张索非 《计算机应用研究》 北大核心 2025年第7期1956-1963,共8页
大语言模型(LLM)在推理和生成任务中的表现显著提升,但现有的开源LLM在处理专业领域问题时仍存在知识不足,亟需针对特定任务进行微调。传统微调方法在多任务学习中难以兼顾低成本与高效性。为此,提出了一种名为PMoE的参数高效微调框架... 大语言模型(LLM)在推理和生成任务中的表现显著提升,但现有的开源LLM在处理专业领域问题时仍存在知识不足,亟需针对特定任务进行微调。传统微调方法在多任务学习中难以兼顾低成本与高效性。为此,提出了一种名为PMoE的参数高效微调框架。该框架基于P-tuning方法,并引入混合专家机制,在保持低成本微调的同时增强多任务处理能力。PMoE在Transformer模块的每一层构建可训练的专家模块,以替代P-tuning中的提示词模块,并采用路由机制根据输入任务特征动态分配任务。此外,PMoE的专家模块支持拆卸,实现不同任务场景下的模型复用,进一步降低计算成本。实验结果表明,PMoE在中国医学领域数据集上相较于P-tuning方法性能提升6.24%,并在多任务处理和迁移学习方面表现优越,验证了其高效性与广泛适用性。 展开更多
关键词 大语言模型 参数高效微调 P-tuning 混合专家 多任务学习
在线阅读 下载PDF
Rapid optimal control law generation: an MoE based method
2
作者 ZHANG Tengfei SU Hua +2 位作者 GONG Chunlin YANG Sizhi BAI Shaobo 《Journal of Systems Engineering and Electronics》 2025年第1期280-291,共12页
To better complete various missions, it is necessary to plan an optimal trajectory or provide the optimal control law for the multirole missile according to the actual situation, including launch conditions and target... To better complete various missions, it is necessary to plan an optimal trajectory or provide the optimal control law for the multirole missile according to the actual situation, including launch conditions and target location. Since trajectory optimization struggles to meet real-time requirements, the emergence of data-based generation methods has become a significant focus in contemporary research. However, due to the large differences in the characteristics of the optimal control laws caused by the diversity of tasks, it is difficult to achieve good prediction results by modeling all data with one single model.Therefore, the modeling idea of the mixture of experts(MoE) is adopted. Firstly, the K-means clustering algorithm is used to partition the sample data set, and the corresponding neural network classification model is established as the gate switch of MoE. Then, the expert models, i.e., the mappings from the generation conditions to the optimal control law represented by the results of principal component analysis(PCA), are represented by Kriging models. Finally, multiple rounds of accuracy evaluation, sample supplementation, and model updating are conducted to improve the generation accuracy. The Monte Carlo simulation shows that the accuracy of the proposed model reaches 96% and the generation efficiency meets the real-time requirement. 展开更多
关键词 optimal control mixture of experts(moe) K-MEANS Kriging model neural network classification principal component analysis(PCA)
在线阅读 下载PDF
基于集成树和MoE的馈线统计线损率双层估计模型 被引量:1
3
作者 王守相 张丙杰 +2 位作者 赵倩宇 郭陆阳 张晟 《电工技术学报》 EI CSCD 北大核心 2024年第3期774-784,共11页
统计线损率是衡量电力系统经济运行的重要指标。然而,用户用电数据采集异常、数据传输中断等因素会导致统计线损率异常或缺失,这严重阻碍了智能配电网的线损精益化管理与经济高效运行。针对馈线统计线损率合理值的估计问题,该文提出了... 统计线损率是衡量电力系统经济运行的重要指标。然而,用户用电数据采集异常、数据传输中断等因素会导致统计线损率异常或缺失,这严重阻碍了智能配电网的线损精益化管理与经济高效运行。针对馈线统计线损率合理值的估计问题,该文提出了一种基于集成树和混合专家系统(MoE)的馈线统计线损率双层估计模型。首先,使用最大信息系数以更有效地分析统计线损率与其相关特征间的非线性关系,并采用鲁棒性强的K-Medoids聚类算法对馈线进行精细划分;然后,使用Stacking集成学习框架,基于基估计和元估计双层模型对馈线统计线损率进行两阶段估计,选用决策树和各类集成树模型作为基估计模型对统计线损率进行初步估计,将各基估计模型输出结果输入元估计模型MoE中进行最终估计,使用方均根误差(RMSE)和平均绝对误差(MAE)来衡量模型所估计统计线损率的合理性;最后,通过算例分析表明,与其他模型相比,该文所提馈线统计线损率双层估计模型具有更低的RMSE和MAE,对馈线统计线损率的估计效果更好。 展开更多
关键词 统计线损率 线损率估计 机器学习 集成树 混合专家系统
在线阅读 下载PDF
基于轻量化改进ERNIE-RCNN的中文新闻标题分类
4
作者 李莉 张之欣 王小龙 《科学技术与工程》 北大核心 2025年第2期649-656,共8页
针对大型预训练语言模型在处理新闻标题时,面临参数规模庞大、无法高效利用上下文语意特征以及循环卷积神经网络对初始输入元素重要性忽视的问题,提出了一种融合混合专家模型(mixture-of-expert,MoE)的ERNIE与注意力机制的循环卷积神经... 针对大型预训练语言模型在处理新闻标题时,面临参数规模庞大、无法高效利用上下文语意特征以及循环卷积神经网络对初始输入元素重要性忽视的问题,提出了一种融合混合专家模型(mixture-of-expert,MoE)的ERNIE与注意力机制的循环卷积神经网络(recurrent convolutional neural networks,RCNN)的新闻标题分类方法。首先,借助MoE改进ERNIE技术进行文本编码,随后利用注意力RCNN在保留文本词序和特征的基础上进行分类。为提高分类能力,通过计算输入的融合上下文权重对RCNN进行改进。在计算MoE中各个专家权重的过程中,选择Gumbel_Softmax作为新型的门控函数以改进传统的Softmax函数,从而更好地控制平滑程度。根据实验结果,发现相较于传统的分类方法,本文研究提出的分类方法展现出显著优势,极大地减少了参数数量。在此基础上,F_(1)相较于传统模型提升了0.51%。经过消融实验的验证,该分类方法在分类任务上的可行性得到了证实。 展开更多
关键词 混合专家系统 知识增强语义表示模型 注意力机制 循环卷积神经网络 文本分类
在线阅读 下载PDF
大模型时代的混合专家系统优化综述 被引量:3
5
作者 史宏志 赵健 +5 位作者 赵雅倩 李茹杨 魏辉 胡克坤 温东超 金良 《计算机研究与发展》 北大核心 2025年第5期1164-1189,共26页
近年来,大模型推动自然语言处理、机器视觉等众多领域取得前所未有的进展.混合专家(mixture of experts,MoE)凭借在模型参数扩展、计算成本控制和复杂任务处理等方面的独特优势成为大模型的主流架构之一.然而,随着参数规模的持续增长,... 近年来,大模型推动自然语言处理、机器视觉等众多领域取得前所未有的进展.混合专家(mixture of experts,MoE)凭借在模型参数扩展、计算成本控制和复杂任务处理等方面的独特优势成为大模型的主流架构之一.然而,随着参数规模的持续增长,系统的执行效率和可扩展能力愈发难以满足需求,亟待解决.系统优化方法是解决这一挑战的有效途径,日益成为研究热点.故综述大模型时代MoE系统优化技术的研究现状,首先介绍MoE大模型的发展现状,并分析其在系统端面临的性能瓶颈;然后从内存占用、通信延迟、计算效率和并行扩展4个系统核心维度对最新的研究进展进行全面梳理和深入分析,并对其中涉及的关键技术、适用场景和待优化方向进行详细对比阐述;最后总结MoE系统优化的研究现状,并展望未来研究方向. 展开更多
关键词 大模型 混合专家 内存卸载 分层通信 专家放置 专家激活预测 自适应并行
在线阅读 下载PDF
基于门控混合专家网络的实时相关推荐方法
6
作者 李鹏 管紫薇 杭帆 《计算机工程与设计》 北大核心 2025年第2期515-522,共8页
针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合... 针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合专家策略和分层注意力机制,综合考虑这些专家网络;利用最终学习到的深层特征,预测推荐评分和项目点击概率,获得用户对项目的满意度。实验结果表明,与其它基线模型对比,AUC指标最多可提高0.35%,Logloss指标最多可降低0.76%,消融实验也验证了各个部分的有效性,说明了该模型的可行性与准确性。 展开更多
关键词 实时推荐算法 多门控制的混合专家策略 注意力机制 卷积神经网络 挤压激励网络 门控网络 语义特征相似性
在线阅读 下载PDF
基于多门控混合专家网络的社交机器人检测
7
作者 臧威龙 余正涛 +2 位作者 高盛祥 谭凯文 张勇丙 《厦门大学学报(自然科学版)》 北大核心 2025年第4期629-641,共13页
[目的]针对社交机器人模仿真实用户特征伪装自身及不同社区用户行为差异显著使得检测难度提升的问题进行研究.[方法]提出基于多门控混合专家网络的社交机器人检测模型(multi-gated mixture of experts network bot detection,MGEBot).... [目的]针对社交机器人模仿真实用户特征伪装自身及不同社区用户行为差异显著使得检测难度提升的问题进行研究.[方法]提出基于多门控混合专家网络的社交机器人检测模型(multi-gated mixture of experts network bot detection,MGEBot).该方法首先将用户元数据与推文数据编码为序列信息,并对关系数据进行图结构编码,实现多角度用户信息表征.随后,将信息输入多门控混合专家网络,学习不同社区用户群体的独有特征,以应对社区差异性问题.最终,融合3种模态的表征进行检测.[结果]在Cresci-15、TwiBot-20和TwiBot-223个主流数据集上,MGEBot在F_(1)等指标上均超越现有基准模型.在泛化性与鲁棒性实验中,MGEBot表现出更好的稳定性与适应性.分析实验表明门控数量增加可显著提升性能,但存在饱和点;专家数量并非越多越好,需寻求最优配置.[结论]MGEBot能有效应对社区差异性挑战,其多源信息融合与多门控混合专家网络机制提升了检测精度和泛化能力,适用于多样化真实场景的社交机器人检测任务. 展开更多
关键词 社交机器人检测 社区群体差异性 多门控专家混合网络
在线阅读 下载PDF
DeepSeek-R1是怎样炼成的? 被引量:61
8
作者 张慧敏 《深圳大学学报(理工版)》 北大核心 2025年第2期226-232,共7页
简述DeepSeek系列模型在大模型训练中的创新和优化.DeepSeek系列模型的突破主要体现在模型架构、算法创新、软硬件协同优化及整体训练效率的提升.DeepSeek-V3模型采用混合专家(mixture of experts,MoE)模型架构,通过细粒度设计和共享专... 简述DeepSeek系列模型在大模型训练中的创新和优化.DeepSeek系列模型的突破主要体现在模型架构、算法创新、软硬件协同优化及整体训练效率的提升.DeepSeek-V3模型采用混合专家(mixture of experts,MoE)模型架构,通过细粒度设计和共享专家策略,实现计算资源的高效利用;MoE模型架构中的稀疏激活机制和无损负载均衡策略显著提高了模型训练的效率和性能;多头潜在注意力(multi-head latent attention,MLA)机制通过减少内存使用和加速推理过程,降低了模型训练和推理成本;通过引入多token预测(multi-token prediction,MTP)和8位浮点数(floating point 8-bit,FP8)混合精度训练技术,提升了模型的上下文理解能力和训练效率;采用优化并行线程执行(parallel thread execution,PTX)代码显著提高了图形处理器(graphics processing unit,GPU)的计算效率;所提群体相对策略优化(group relative policy optimization,GRPO)对DeepSeek-R1-Zero模型进行纯强化学习训练,跳过了传统的监督微调和人类反馈阶段,显著提升了模型的推理能力.总体而言,DeepSeek系列模型通过多项创新,在人工智能领域取得了显著优势,树立了行业新标杆. 展开更多
关键词 人工智能 DeepSeek 大语言模型 混合专家模型 多头潜在注意力机制 多token预测 混合精度训练 群体相对策略优化
在线阅读 下载PDF
SAM-MR:基于SAM的混合区域匹配专家适配布匹检测算法
9
作者 罗其锋 肖星 +2 位作者 温焯飞 池明旻 彭博 《计算机科学》 北大核心 2025年第S2期460-465,共6页
有监督异常检测因其精准的工业异常检测能力而广泛应用于布匹质量检测。现有的统一架构的异常检测方法,因其单一的特征适配能力,不能对多样化的,所以度较高的布匹瑕疵进行有效地区分,因此在布匹的多类别的异常检测中性能会显著下降。为... 有监督异常检测因其精准的工业异常检测能力而广泛应用于布匹质量检测。现有的统一架构的异常检测方法,因其单一的特征适配能力,不能对多样化的,所以度较高的布匹瑕疵进行有效地区分,因此在布匹的多类别的异常检测中性能会显著下降。为此提出一种基于混合区域匹配专家适配方法(Mixture of Region Experts),通过Mixture of Adapter Experts模块来区别化不同类别的布匹瑕疵特征,使用Align and Differencing模块对齐模板图特征和瑕疵特征来进一步加强异常区域的划分,从而有效提高了模型分辨复杂多类型的布匹瑕疵的能力。同时,模型进一步集成成分检测任务,在完成瑕疵定位的基础上实现异常成分的语义识别。实验结果表明,SAM-MR在布匹纤维材质和缺陷检测任务上取得了优于现有方法的性能,定性、定量分析及消融实验验证了所提出方法在多任务预测中的有效性。 展开更多
关键词 有监督学习 异常检测 混合专家
在线阅读 下载PDF
多双曲空间传递图解耦表示学习
10
作者 郑帅 彭奏章 +1 位作者 朱振峰 赵耀 《智能系统学报》 北大核心 2025年第5期1243-1255,共13页
现有的图表示学习中存在两个问题,一是缺乏对细粒度邻域建模的考量,忽略了邻域节点间纠缠的多重语义;二是图表示学习的空间度量问题,欧氏空间并非是度量节点表示的最优选择。为解决上述问题,提出一种多双曲空间下表征传递预测的全新架构... 现有的图表示学习中存在两个问题,一是缺乏对细粒度邻域建模的考量,忽略了邻域节点间纠缠的多重语义;二是图表示学习的空间度量问题,欧氏空间并非是度量节点表示的最优选择。为解决上述问题,提出一种多双曲空间下表征传递预测的全新架构,实现多双曲空间度量下的图解耦表示学习。在该架构下,通过节点表征将原始拓扑结构映射至双曲空间,获得双曲空间下的多分辨率传递矩阵。进一步地,基于混合专家结构设计,视不同分辨率的双曲标签传递网络为专家网络,从而发现由不同潜在因素引发的节点连接模式。在多个真实世界的数据集上的实验结果显示,本文方法在Squirrel和Crocodile数据集上分别达到32.3%和59.5%的分类准确率,可视化实验进一步证明了方法的有效性。 展开更多
关键词 图表示学习 图解耦 双曲空间 图神经网络 标签传递 混合专家系统 拓扑细化 多分辨率
在线阅读 下载PDF
算力约束下混合专家模型计算优化方法:现状及研究进展
11
作者 问佳琳 李晓军 +1 位作者 姚俊萍 辜弘炀 《计算机工程与应用》 北大核心 2025年第22期20-35,共16页
大语言模型近年来在自然语言处理等领域取得了显著成果,混合专家模型通过稀疏激活的策略减少了大语言模型的计算需求。随着混合专家模型所面临的推理任务越发复杂,部署于终端设备上的专家模型常常面临资源需求超出节点算力的问题,因此... 大语言模型近年来在自然语言处理等领域取得了显著成果,混合专家模型通过稀疏激活的策略减少了大语言模型的计算需求。随着混合专家模型所面临的推理任务越发复杂,部署于终端设备上的专家模型常常面临资源需求超出节点算力的问题,因此算力约束下的混合专家模型计算优化成为领域研究持续关注的热点问题。介绍了混合专家模型的概念与架构,并从门控网络、专家结构及模型、内存管理三个维度出发,对相关优化方法展开分类综述。在门控网络层面,研究了路由设计、损失函数优化和负载均衡机制,从而实现了精确路由;在专家结构层面,总结了各类专家设计、预处理方法和专家合并策略的结构创新;在内存管理层面,综述了现有的参数压缩和内存卸载技术,以应对模型在部署时面临的资源受限问题。分析了不同维度下计算优化的原理、策略及主要技术挑战,提出了领域研究需要关注的重点问题及潜在研究机会。 展开更多
关键词 混合专家模型(moe) 计算优化 负载均衡 专家结构 内存管理
在线阅读 下载PDF
DeepSeek支持下的高中生物学长句表述能力培养双阶四维模型应用
12
作者 徐文新 《生物学教学》 北大核心 2025年第6期50-52,共3页
针对新高考改革背景下生物学学科长句表述题的考核要求,融合DeepSeek-V3模型的动态路由机制与多token预测技术,构建了“双阶四维”训练体系。经过为期四周的教学实验验证,该模式显著提升了学生在机制解释类题型的逻辑链完整度和术语规... 针对新高考改革背景下生物学学科长句表述题的考核要求,融合DeepSeek-V3模型的动态路由机制与多token预测技术,构建了“双阶四维”训练体系。经过为期四周的教学实验验证,该模式显著提升了学生在机制解释类题型的逻辑链完整度和术语规范度。为人工智能与生物学教学的深度融合提供理论支撑与实践范式。 展开更多
关键词 DeepSeek 混合专家模型 长句表述 科学思维
在线阅读 下载PDF
正态分布混合线性专家模型的稳健估计
13
作者 孙明云 李龙 《统计与决策》 北大核心 2025年第8期53-58,共6页
针对误差项服从正态分布的混合线性专家模型(NMoLE模型)对异常值或重尾数据非常敏感的问题,文章提出了一种稳健估计方法:在NMoLE模型的对数似然函数中引入M估计,并提出了一种稳健的EM算法。蒙特卡洛模拟结果表明,所提稳健估计方法对带... 针对误差项服从正态分布的混合线性专家模型(NMoLE模型)对异常值或重尾数据非常敏感的问题,文章提出了一种稳健估计方法:在NMoLE模型的对数似然函数中引入M估计,并提出了一种稳健的EM算法。蒙特卡洛模拟结果表明,所提稳健估计方法对带异常值的数据具有鲁棒性,且效果优于误差项服从t分布的混合线性专家模型的估计方法和极大似然估计方法;若数据中不存在异常值,则所提稳健估计方法与误差项服从t分布的混合线性专家模型的估计方法及极大似然估计方法的效果相近。最后,通过实际数据验证了所提估计方法的稳健性。 展开更多
关键词 混合线性专家模型 NMoLE模型 M估计
在线阅读 下载PDF
矿山人工智能大模型技术研究现状及展望
14
作者 贾运红 徐慈强 +1 位作者 田原 鲍文亮 《中国矿业》 北大核心 2025年第10期135-143,共9页
随着煤矿智能化建设的推进,人工智能技术在生产管理、设备运维、安全巡检、地质勘探等方面得到深度应用。然而,现有人工智能模型因参数量小、精度差、模式单一等问题,无法满足矿山复杂任务需求,制约了行业进步。大模型的出现带来了理解... 随着煤矿智能化建设的推进,人工智能技术在生产管理、设备运维、安全巡检、地质勘探等方面得到深度应用。然而,现有人工智能模型因参数量小、精度差、模式单一等问题,无法满足矿山复杂任务需求,制约了行业进步。大模型的出现带来了理解能力和推理能力的巨大飞跃,对加快煤矿智能化建设和推动安全高效开采具有重要意义。大模型主要包括语言类大模型、视觉类大模型、多模态大模型、其他大模型,这些大模型基于Transformer架构,采用数据增强、思维链、RLHF和LoRA微调等技术,增强了模型的性能和灵活性。本文讨论了国内外大模型的研究现状和应用场景,得出尽管大模型展现出强大潜力,但在矿山环境中仍面临诸多挑战,这对模型训练和泛化提出了更高要求。未来研究应关注提升大模型在矿山场景中的时空预测能力,探索混合专家模型结构,发展矿山装备具身智能技术,加速大模型落地应用,为基于大模型的煤矿智能化提供坚实的理论技术支持,促进矿业行业的转型升级和技术革新。 展开更多
关键词 大模型 时空状态预测 混合专家模型 具身智能 人工智能
在线阅读 下载PDF
基于STL与MMoE多任务学习的区域多光伏电站超短期功率联合预测方法 被引量:12
15
作者 王本涛 白杨 +1 位作者 邢红涛 徐岩 《电力系统及其自动化学报》 CSCD 北大核心 2022年第9期17-23,31,共8页
随着光伏并网容量的不断增加,准确的光伏功率预测对电网安全稳定运行意义重大。本文提出一种基于季节性分解与MMoE多任务学习的区域多光伏电站超短期功率联合预测方法。首先,通过季节性分解获得光伏功率的周期分量、剩余分量与趋势分量... 随着光伏并网容量的不断增加,准确的光伏功率预测对电网安全稳定运行意义重大。本文提出一种基于季节性分解与MMoE多任务学习的区域多光伏电站超短期功率联合预测方法。首先,通过季节性分解获得光伏功率的周期分量、剩余分量与趋势分量。其次,提出MMoE-LSTM-Attention网络来挖掘同一区域内不同光伏电站剩余分量与趋势分量之间的相关性,进行剩余分量与趋势分量的预测。最后,将分量进行汇总,得到光伏电站超短期功率预测结果。相较于传统基于硬共享机制的多任务学习模型,MMoE模型能够自动调整任务目标和任务间关系的参数权重。注意力机制能够进一步优化子任务的特征提取能力。在DKASC数据集上进行了算例实测,分别验证了季节性分解、MMoE多任务学习模型及注意力机制在区域多光伏电站功率预测问题上的有效性。 展开更多
关键词 区域光伏功率预测 Mmoe多任务学习 注意力机制 季节性分解
在线阅读 下载PDF
融合LSTM和MoE的倒闸操作识别
16
作者 张晓青 肖万芳 +6 位作者 郭英杰 刘博文 韩学森 马经纬 高高 黄赫 夏时洪 《系统仿真学报》 CAS CSCD 北大核心 2022年第8期1899-1907,共9页
为解决不同人员相同操作的个体差异以及同一人员不同时间相同操作差异的问题,提出一种基于混合专家系统(mixture of experts,MoE)和长短期记忆神经网络(long short-term memory,LSTM)的倒闸操作识别方法MoE-LSTM。基于MoE对LSTM进行集成... 为解决不同人员相同操作的个体差异以及同一人员不同时间相同操作差异的问题,提出一种基于混合专家系统(mixture of experts,MoE)和长短期记忆神经网络(long short-term memory,LSTM)的倒闸操作识别方法MoE-LSTM。基于MoE对LSTM进行集成,学习不同来源数据的特征分布。采集加速度动作数据构建倒闸操作数据集,基于滑动窗口对动作序列进行切分;将动作序列输入到MoE-LSTM中,由不同LSTM独立学习不同动作的时序依赖;通过门控网络选择对当前输入分类较好的LSTM的输出作为动作识别结果。仿真结果表明:不同LSTM对来自不同时空的动作数据都有擅长分类的特征空间。 展开更多
关键词 倒闸操作 长短期记忆神经网络 混合专家系统 神经网络
在线阅读 下载PDF
法律案件要素识别混合专家大模型 被引量:1
17
作者 尹华 吴梓浩 +2 位作者 柳婷婷 张佳佳 高子千 《计算机科学与探索》 CSCD 北大核心 2024年第12期3260-3271,共12页
智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础... 智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础任务上的效果不佳。提出了一种对话式混合专家要素识别大模型。该模型针对案件特点设计了特定的Prompt,供ChatGLM3-6B-base大模型学习;通过全参微调该大模型获得基础要素识别能力,其权重供后续混合专家共享,降低大模型学习成本;针对不同案件类型场景和标签不平衡场景,在大模型的注意力层引入案件DoRA专家和标签DoRA专家模块,提高模型对任务的区分度;设计可学习门控实现标签专家选择。在CAIL2019和某省脱敏盗窃案件要素识别数据集上,对比了三类方法的九个基准模型,并进行模型消融实验。实验结果显示,提出的模型综合性能F1值高于最优模型性能5.9个百分点;在标签不平衡的CAIL2019数据集上,标签专家一定程度上能够减缓数据极度不平衡给模型带来的影响;同时,CAIL2019上训练的模型不再需要全参微调,通过案件专家和标签专家轻量级微调后,在某省盗窃案件中取得最佳效果,证明模型具有易扩展性。 展开更多
关键词 案件要素识别 大模型 混合参数高效专家 提示词
在线阅读 下载PDF
基于混合专家模型的岩石薄片图像分类 被引量:6
18
作者 周程阳 刘伟 +2 位作者 吴天润 李骜 韩霄松 《吉林大学学报(理学版)》 CAS 北大核心 2024年第4期905-914,共10页
以常见的5种岩石薄片作为研究对象构建数据集,提出一种新的基于混合专家模型的岩石薄片图像分类模型.该模型从薄片图像中学习到每种岩石图像的特征,并对其进行分类.首先,使用多个基于卷积神经网络(CNN)和Transformer的图像分类模型(ResN... 以常见的5种岩石薄片作为研究对象构建数据集,提出一种新的基于混合专家模型的岩石薄片图像分类模型.该模型从薄片图像中学习到每种岩石图像的特征,并对其进行分类.首先,使用多个基于卷积神经网络(CNN)和Transformer的图像分类模型(ResNet50,MobileNetV3,InceptionV3,DeiT等)对数据进行训练;其次,选取效果较好的模型,通过构建混合专家模型,得到最终的预测结果,其岩性识别准确率(ACC)和AUC在验证集上达到85.33%和96.69%,在测试集上达到87.16%和96.75%;最后,通过混合专家模型结合多个模型,综合各模型的优势,平衡各模型间的贡献,提高分类结果的准确性和鲁棒性,使得到的分类结果更可靠、稳定. 展开更多
关键词 岩石薄片分类 混合专家模型 图像分类
在线阅读 下载PDF
奖励机制与用户意愿结合的高峰期负荷博弈调度策略 被引量:2
19
作者 杨雪莹 祁琪 +2 位作者 李启明 杨春萍 祁兵 《电工技术学报》 EI CSCD 北大核心 2024年第16期5060-5074,共15页
在高峰时段,居民冷/热设备占尖峰负荷的比重不断攀升,影响了低压配电网的安全稳定优化运行。为补充供给侧调节能力,提升调控灵活性,亟须引导用户侧可调资源参与电网供需互动。该文提出一种奖励机制与用户意愿相结合的高峰期负荷博弈调... 在高峰时段,居民冷/热设备占尖峰负荷的比重不断攀升,影响了低压配电网的安全稳定优化运行。为补充供给侧调节能力,提升调控灵活性,亟须引导用户侧可调资源参与电网供需互动。该文提出一种奖励机制与用户意愿相结合的高峰期负荷博弈调度策略。依据用户用能意愿对高峰时段用电负荷进行动态划分,制定基于负载率-奖励函数的差异化补贴机制。将高峰时段需要提升功率的负荷群视为领导者,将具有灵活削减能力的负荷群视为追随者,建立Stackelberg博弈模型,证明博弈均衡的唯一性。进而该文提出了Stackelberg博弈下的用电高峰期负荷日内优化调度方法,优化博弈双方在追求效益最大时的策略。该文构建多通路混合专家网络求解设备动作意愿,提出基于用户意愿的单功率-多功率级负荷联合控制策略,实现负荷的实时精细化调控。最后,算例表明所提策略能够在实现聚合商与用户侧双赢、遵从用户调控意愿的同时,有效地平抑用电高峰期的负荷波动,减小峰谷差。 展开更多
关键词 主从博弈 高峰期负荷 用户意愿 负载率-奖励函数 混合专家网络
在线阅读 下载PDF
基于混合专家模型的智能网联汽车换道决策方法 被引量:3
20
作者 姚福星 孙超 +3 位作者 兰云港 卢兵 王博 于海洋 《汽车工程》 EI CSCD 北大核心 2024年第5期882-892,共11页
高速公路换道决策问题场景复杂、不确定性强、实时性要求高,是国内外自动驾驶领域的研究热点和难点。深度强化学习(deep reinforcement learning,DRL)具有良好的决策实时性和面向复杂场景的适应性,然而,在训练样本与成本有限的条件下学... 高速公路换道决策问题场景复杂、不确定性强、实时性要求高,是国内外自动驾驶领域的研究热点和难点。深度强化学习(deep reinforcement learning,DRL)具有良好的决策实时性和面向复杂场景的适应性,然而,在训练样本与成本有限的条件下学习效果有限,其难以保证最优的驾驶效率和完全的行驶安全性。本文提出了一种基于改进DRL的混合专家模型(DRL-mixture of expert,DRL-MOE)换道决策方法。首先,模型的上层分类器根据输入状态特征动态地决定下层DRL专家或启发式专家的激活状态。为提高DRL专家的学习效果,本方法通过行为克隆(behavior cloning,BC)对神经网络参数进行初始化,对传统深度确定性策略梯度算法(deep deterministic policy gradient,DDPG)进行了改进。将智能驾驶员模型和最小化换道引起的总制动策略设计为启发式专家,以确保行驶安全性。仿真结果表明,本文所提出的DRL-MOE模型方法与非混合专家型DRL方法相比,在驾驶效率方面提高了15.04%,并确保了零碰撞和零出界,具有较高的鲁棒性和更优的效果。 展开更多
关键词 自动驾驶 高速换道决策 深度强化学习 混合专家模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部