期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于门控混合专家网络的实时相关推荐方法
1
作者 李鹏 管紫薇 杭帆 《计算机工程与设计》 北大核心 2025年第2期515-522,共8页
针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合... 针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合专家策略和分层注意力机制,综合考虑这些专家网络;利用最终学习到的深层特征,预测推荐评分和项目点击概率,获得用户对项目的满意度。实验结果表明,与其它基线模型对比,AUC指标最多可提高0.35%,Logloss指标最多可降低0.76%,消融实验也验证了各个部分的有效性,说明了该模型的可行性与准确性。 展开更多
关键词 实时推荐算法 多门控制的混合专家策略 注意力机制 卷积神经网络 挤压激励网络 门控网络 语义特征相似性
在线阅读 下载PDF
基于轻量化改进ERNIE-RCNN的中文新闻标题分类
2
作者 李莉 张之欣 王小龙 《科学技术与工程》 北大核心 2025年第2期649-656,共8页
针对大型预训练语言模型在处理新闻标题时,面临参数规模庞大、无法高效利用上下文语意特征以及循环卷积神经网络对初始输入元素重要性忽视的问题,提出了一种融合混合专家模型(mixture-of-expert,MoE)的ERNIE与注意力机制的循环卷积神经... 针对大型预训练语言模型在处理新闻标题时,面临参数规模庞大、无法高效利用上下文语意特征以及循环卷积神经网络对初始输入元素重要性忽视的问题,提出了一种融合混合专家模型(mixture-of-expert,MoE)的ERNIE与注意力机制的循环卷积神经网络(recurrent convolutional neural networks,RCNN)的新闻标题分类方法。首先,借助MoE改进ERNIE技术进行文本编码,随后利用注意力RCNN在保留文本词序和特征的基础上进行分类。为提高分类能力,通过计算输入的融合上下文权重对RCNN进行改进。在计算MoE中各个专家权重的过程中,选择Gumbel_Softmax作为新型的门控函数以改进传统的Softmax函数,从而更好地控制平滑程度。根据实验结果,发现相较于传统的分类方法,本文研究提出的分类方法展现出显著优势,极大地减少了参数数量。在此基础上,F_(1)相较于传统模型提升了0.51%。经过消融实验的验证,该分类方法在分类任务上的可行性得到了证实。 展开更多
关键词 混合专家系统 知识增强语义表示模型 注意力机制 循环卷积神经网络 文本分类
在线阅读 下载PDF
多双曲空间传递图解耦表示学习
3
作者 郑帅 彭奏章 +1 位作者 朱振峰 赵耀 《智能系统学报》 北大核心 2025年第5期1243-1255,共13页
现有的图表示学习中存在两个问题,一是缺乏对细粒度邻域建模的考量,忽略了邻域节点间纠缠的多重语义;二是图表示学习的空间度量问题,欧氏空间并非是度量节点表示的最优选择。为解决上述问题,提出一种多双曲空间下表征传递预测的全新架构... 现有的图表示学习中存在两个问题,一是缺乏对细粒度邻域建模的考量,忽略了邻域节点间纠缠的多重语义;二是图表示学习的空间度量问题,欧氏空间并非是度量节点表示的最优选择。为解决上述问题,提出一种多双曲空间下表征传递预测的全新架构,实现多双曲空间度量下的图解耦表示学习。在该架构下,通过节点表征将原始拓扑结构映射至双曲空间,获得双曲空间下的多分辨率传递矩阵。进一步地,基于混合专家结构设计,视不同分辨率的双曲标签传递网络为专家网络,从而发现由不同潜在因素引发的节点连接模式。在多个真实世界的数据集上的实验结果显示,本文方法在Squirrel和Crocodile数据集上分别达到32.3%和59.5%的分类准确率,可视化实验进一步证明了方法的有效性。 展开更多
关键词 图表示学习 图解耦 双曲空间 图神经网络 标签传递 混合专家系统 拓扑细化 多分辨率
在线阅读 下载PDF
Rapid optimal control law generation: an MoE based method
4
作者 ZHANG Tengfei SU Hua +2 位作者 GONG Chunlin YANG Sizhi BAI Shaobo 《Journal of Systems Engineering and Electronics》 2025年第1期280-291,共12页
To better complete various missions, it is necessary to plan an optimal trajectory or provide the optimal control law for the multirole missile according to the actual situation, including launch conditions and target... To better complete various missions, it is necessary to plan an optimal trajectory or provide the optimal control law for the multirole missile according to the actual situation, including launch conditions and target location. Since trajectory optimization struggles to meet real-time requirements, the emergence of data-based generation methods has become a significant focus in contemporary research. However, due to the large differences in the characteristics of the optimal control laws caused by the diversity of tasks, it is difficult to achieve good prediction results by modeling all data with one single model.Therefore, the modeling idea of the mixture of experts(MoE) is adopted. Firstly, the K-means clustering algorithm is used to partition the sample data set, and the corresponding neural network classification model is established as the gate switch of MoE. Then, the expert models, i.e., the mappings from the generation conditions to the optimal control law represented by the results of principal component analysis(PCA), are represented by Kriging models. Finally, multiple rounds of accuracy evaluation, sample supplementation, and model updating are conducted to improve the generation accuracy. The Monte Carlo simulation shows that the accuracy of the proposed model reaches 96% and the generation efficiency meets the real-time requirement. 展开更多
关键词 optimal control mixture of experts(MoE) K-MEANS Kriging model neural network classification principal component analysis(PCA)
在线阅读 下载PDF
Web服务失效处理的反射中间件技术应用与实现 被引量:3
5
作者 徐新卫 周良 丁秋林 《系统工程与电子技术》 EI CSCD 北大核心 2007年第8期1371-1376,共6页
为提高服务有效性,在Web服务的客户方和服务器方配置反射层,捕捉到导致服务失效的各种状态和参数,有针对性地从服务内部动态调整服务运行状态和配置。依据服务失效类型,给出客户方和服务器方反射层的处理方法和工作过程,并借助于分层混... 为提高服务有效性,在Web服务的客户方和服务器方配置反射层,捕捉到导致服务失效的各种状态和参数,有针对性地从服务内部动态调整服务运行状态和配置。依据服务失效类型,给出客户方和服务器方反射层的处理方法和工作过程,并借助于分层混合专家网络(HME)作为服务失效的检测方案,基于极大似然的HME学习策略可以对高维、非线性和强耦合的状态空间进行学习和辨识。通过实验和数据分析,表明了基于HME网络的反射中间件可以高效地对服务失效进行检测和处理。 展开更多
关键词 WEB服务 服务失效 反射中间件 分层混合专家网络
在线阅读 下载PDF
基于多门控混合专家网络的燃烧热化学流形表征 被引量:1
6
作者 王意存 邵长孝 +3 位作者 金台 邢江宽 罗坤 樊建人 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第12期2401-2411,共11页
为了更好地在小火焰燃烧模型框架内实施燃烧热化学流形表征,采用多任务学习领域中的多门控混合专家网络(MMoE).通过对三维层流喷雾射流火焰构型进行详细化学(DC)模拟,构建原始数据集.原始数据集经过Box-Cox转换和标准化处理,以应对燃烧... 为了更好地在小火焰燃烧模型框架内实施燃烧热化学流形表征,采用多任务学习领域中的多门控混合专家网络(MMoE).通过对三维层流喷雾射流火焰构型进行详细化学(DC)模拟,构建原始数据集.原始数据集经过Box-Cox转换和标准化处理,以应对燃烧数据的多尺度分布问题.对数据集进行Pearson相关系数分析,结果表明部分化学组分之间无明显的相关性.分别构建同等参数量规模的MMoE和前馈神经网络(FNN)模型,对比分析结果表明,2种模型取得的损失值和决定系数相近,但相比FNN模型,MMoE模型在训练过程中更加稳定,且取得的定量预测结果更加准确. 展开更多
关键词 多门控混合专家网络(MMoE) 前馈神经网络(FNN) 小火焰模型 层流喷雾火焰 燃烧数值模拟
在线阅读 下载PDF
响应变量随机缺失下偏正态众数混合专家模型的参数估计 被引量:1
7
作者 鲁钰 吴刘仓 王格格 《应用数学》 北大核心 2023年第2期474-486,共13页
数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层... 数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层众数回归插补方法.利用机器学习插补和统计学插补的方法,进一步比较研究三种机器学习插补方法:支持向量机插补、随机森林插补和神经网络插补,三种统计学插补方法:分层均值插补、众数回归插补和分层众数回归插补的缺失数据处理效果.通过Monte Carlo模拟和实例分析结果表明,分层众数回归插补的优良性. 展开更多
关键词 缺失偏正态数据 众数混合专家模型 支持向量机插补 随机森林插补 BP神经网络插补 分层众数回归插补
在线阅读 下载PDF
融合LSTM和MoE的倒闸操作识别
8
作者 张晓青 肖万芳 +6 位作者 郭英杰 刘博文 韩学森 马经纬 高高 黄赫 夏时洪 《系统仿真学报》 CAS CSCD 北大核心 2022年第8期1899-1907,共9页
为解决不同人员相同操作的个体差异以及同一人员不同时间相同操作差异的问题,提出一种基于混合专家系统(mixture of experts,MoE)和长短期记忆神经网络(long short-term memory,LSTM)的倒闸操作识别方法MoE-LSTM。基于MoE对LSTM进行集成... 为解决不同人员相同操作的个体差异以及同一人员不同时间相同操作差异的问题,提出一种基于混合专家系统(mixture of experts,MoE)和长短期记忆神经网络(long short-term memory,LSTM)的倒闸操作识别方法MoE-LSTM。基于MoE对LSTM进行集成,学习不同来源数据的特征分布。采集加速度动作数据构建倒闸操作数据集,基于滑动窗口对动作序列进行切分;将动作序列输入到MoE-LSTM中,由不同LSTM独立学习不同动作的时序依赖;通过门控网络选择对当前输入分类较好的LSTM的输出作为动作识别结果。仿真结果表明:不同LSTM对来自不同时空的动作数据都有擅长分类的特征空间。 展开更多
关键词 倒闸操作 长短期记忆神经网络 混合专家系统 神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部