期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
基于Seq2Seq双向模型的水锤压力预测 被引量:1
1
作者 吴罗长 刘振兴 +4 位作者 雷洁 颜建国 郭鹏程 孙帅辉 马晋阳 《振动与冲击》 北大核心 2025年第3期99-106,共8页
水锤计算对保障长距离输水工程管网系统安全稳定运行具有重要意义,但传统水锤数值方法存在模型复杂、计算量大的问题。为此,在自主开发的瞬态流试验平台上,通过支路快速关阀产生水锤,获取了不同流量和压力条件下的瞬态水锤压力。试验参... 水锤计算对保障长距离输水工程管网系统安全稳定运行具有重要意义,但传统水锤数值方法存在模型复杂、计算量大的问题。为此,在自主开发的瞬态流试验平台上,通过支路快速关阀产生水锤,获取了不同流量和压力条件下的瞬态水锤压力。试验参数范围为:体积流量15~55 m^(3)/h,压力150~450 kPa。采用集合经验模态分解方法对水锤信号进行滤波,并对水锤压力的变化规律进行了深入的研究分析。基于双向门控循环单元,建立了用于水锤压力预测的序列到序列(sequence-to-sequence,Seq2Seq)双向预测模型。结果表明,Seq2Seq双向预测模型能有效预测支路水锤,其预测数据决定系数在0.8以上,水锤特征参数预测准确率超过98%。该研究成果为水锤压力预测提供了一种新方法。 展开更多
关键词 水锤 瞬变流 seq2seq 经验模态分解
在线阅读 下载PDF
融合Seq2Seq与时序注意力机制的工艺质量预测
2
作者 阴艳超 施成娟 +1 位作者 邹朝普 刘孝保 《机械科学与技术》 北大核心 2025年第3期453-464,共12页
针对流程工业生产过程整体工序繁多,工序间耦合严重,多维工艺数据间时序关系及其复杂等问题,提出一种融合Seq2Seq与时序注意力机制的高维多尺度工艺过程质量预测方法。在分析多工序工艺数据特点,以及运用Seq2Seq模型进行编码解码过程面... 针对流程工业生产过程整体工序繁多,工序间耦合严重,多维工艺数据间时序关系及其复杂等问题,提出一种融合Seq2Seq与时序注意力机制的高维多尺度工艺过程质量预测方法。在分析多工序工艺数据特点,以及运用Seq2Seq模型进行编码解码过程面临的难题的基础上,引入时序注意力机制来构造长距离变化的时域信息矩阵。设计卷积神经网络和BiLSTM作为编码组件,学习工艺过程时序数据的工艺参数关联性和双向时序关系等潜在深度特征,并结合时序注意力机制抽取关键信息,实现对工艺质量相关的工艺参数时序数据的非线性相关特征和时序依赖性的自适应地学习。最后,通过对制丝生产工艺过程质量的单输出和多输出预测实验,验证了所提算法的实用性和有效性,为多工序耦合的流程制造过程质量的精准预测提供了方法和实现途径。 展开更多
关键词 多工序时序耦合 工艺质量预测 seq2seq 时序注意力机制 自适应学习
在线阅读 下载PDF
融合定长Seq2Seq网络的中文成语智能纠错模型
3
作者 何春辉 葛斌 +1 位作者 张翀 徐浩 《计算机科学》 北大核心 2025年第5期227-234,共8页
四字成语作为一类特殊词语,在中文使用中非常流行。随着中文纠错任务的发展,中文成语的智能纠错已经成为自然语言处理领域的一个研究热点。针对现有方法在中文成语智能纠错任务上准确率偏低的问题,提出了一种融合定长Seq2Seq网络的中文... 四字成语作为一类特殊词语,在中文使用中非常流行。随着中文纠错任务的发展,中文成语的智能纠错已经成为自然语言处理领域的一个研究热点。针对现有方法在中文成语智能纠错任务上准确率偏低的问题,提出了一种融合定长Seq2Seq网络的中文成语智能纠错模型。它在底层通过融合Seq2Seq网络架构和注意力机制,并结合混合数据集构造方法,共同训练得到输入和输出端序列长度固定的Seq2Seq模型,用来完成中文四字成语智能纠错任务。在大型公开中文成语纠错数据集上的实验结果表明,定长Seq2Seq模型优于现有方法,能够实现同一个模型同时兼容乱序、缺字和错字3种不同的中文成语智能纠错目标。它的综合纠错准确率可以达到91.3%,比最优基线模型高出11.73%。 展开更多
关键词 成语纠错 定长seq2seq 双向GRU 注意力机制
在线阅读 下载PDF
基于改进Seq2Seq的船舶轨迹预测模型
4
作者 唐家乐 段兴锋 姚鹏 《上海海事大学学报》 北大核心 2025年第2期18-22,共5页
针对传统循环神经网络(recurrent neural network,RNN)模型收敛速度慢、精度低,导致海上船舶预测轨迹与真实轨迹之间差别较大的问题,构建由RNN组成的Seq2Seq(sequence to sequence)模型。引入注意力机制和卷积神经网络(convolutional ne... 针对传统循环神经网络(recurrent neural network,RNN)模型收敛速度慢、精度低,导致海上船舶预测轨迹与真实轨迹之间差别较大的问题,构建由RNN组成的Seq2Seq(sequence to sequence)模型。引入注意力机制和卷积神经网络(convolutional neural network,CNN)对模型进行改进,加强对数据特征的提取能力,加快模型收敛速度并提高轨迹预测精度。实验结果显示:与传统RNN模型相比,Seq2Seq模型的均方误差、均方根误差和平均绝对误差分别降低81.41%、12.67%和62.43%;与Seq2Seq模型相比,改进Seq2Seq模型的均方误差、均方根误差和平均绝对误差分别降低42.87%、69.27%和45.79%。 展开更多
关键词 船舶轨迹预测 seq2seq(sequence to sequence) 注意力机制 卷积神经网络(CNN) 循环神经网络(RNN)
在线阅读 下载PDF
基于用户画像和改进Seq2Seq的船舶轨迹预测模型
5
作者 杨欣奕 韩众和 +1 位作者 艾万政 刘虎 《舰船科学技术》 北大核心 2025年第13期149-156,共8页
针对目前船舶轨迹预测模型主要考虑轨迹的位置特征,缺乏对船舶操纵性能和环境因素的探究,导致预测精度不高的问题,本文提出一种基于用户画像和改进Seq2Seq的船舶轨迹预测新模型。首先该模型基于用户画像理论,采用频数统计和聚类方法创... 针对目前船舶轨迹预测模型主要考虑轨迹的位置特征,缺乏对船舶操纵性能和环境因素的探究,导致预测精度不高的问题,本文提出一种基于用户画像和改进Seq2Seq的船舶轨迹预测新模型。首先该模型基于用户画像理论,采用频数统计和聚类方法创建了船舶用户画像;其次,创设多编码器实现对船舶用户画像、船舶轨迹和船舶标签等特征的分别编码;最后,基于Seq2Seq架构,增设画像特征检索模块和LSTM融合层,实现画像特征的快速提取和融合。实验结果表明,相较于LSTM、BiLSTM、A+LSTM、A+BiLSTM和Seq2Seq五种模型,新模型在长时间预测方面具备较高的精度和较好的稳定性。 展开更多
关键词 轨迹预测 数据挖掘 用户画像 深度学习 seq2seq
在线阅读 下载PDF
辅助短语音条件下说话人确认系统的seq2seq模型
6
作者 杨爽 马佰超 +1 位作者 杨宇 陈丹 《计算机应用与软件》 北大核心 2025年第4期223-228,共6页
文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,... 文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,使用注意力机制来获取序列之间的关系。在训练时加入余弦距离损失来提升生成模型的泛化性能,将训练好的说话人确认模型作为生成模型训练架构的组件。实验结果表明,在1~3 s语音时长下,采用该模型后等错误率平均降低7.78%。 展开更多
关键词 说话人确认 短时语音 seq2seq 余弦距离损失
在线阅读 下载PDF
基于变分自编码器和注意力Seq2Seq模型的风电功率预测 被引量:1
7
作者 李辰龙 李逗 +2 位作者 车畅畅 潘苗 高进 《南方电网技术》 CSCD 北大核心 2024年第12期107-116,共10页
针对风电场功率影响因素多、有效数据量小、预测时序长的复杂特点,提出了基于变分自编码器和注意力Seq2Seq模型的风电功率预测方法。采集测风塔数据和对应的连续功率值构造样本集,利用变分自编码器模型将样本进行数据增强,从而获得足够... 针对风电场功率影响因素多、有效数据量小、预测时序长的复杂特点,提出了基于变分自编码器和注意力Seq2Seq模型的风电功率预测方法。采集测风塔数据和对应的连续功率值构造样本集,利用变分自编码器模型将样本进行数据增强,从而获得足够多的样本用于支撑预测模型训练;构建从测风塔多个监测指标到连续功率值的回归分析模型,充分挖掘不同指标与功率值的映射关系;将扩充后的不同指标分别输入到注意力Seq2Seq模型中进行指标时序预测,并将数值天气预报数据用于修正预测结果,从而得到更准确的指标加权预测结果;将实时获取的测风塔和数值天气预报数据输入到训练好的加权预测模型和回归分析模型中,实现风电功率的多步预测。利用风电场站实际运行数据集进行了模型验证,结果表明:与传统时序预测方法相比,基于变分自编码器和注意力Seq2Seq模型能够在较小的重构误差下得到更准确的风电功率预测结果。 展开更多
关键词 变分自编码器 注意力机制 注意力seq2seq模型 风电功率预测
在线阅读 下载PDF
基于seq2seq模型的非侵入式负荷分解算法 被引量:3
8
作者 岳建任 宋亚奇 +1 位作者 杨丹旭 李莉 《电测与仪表》 北大核心 2024年第6期65-71,共7页
非侵入式负荷分解对于节能减排、负荷调峰、智能用能等方面均具有重要的现实意义。针对目前非侵入式负荷分解方法在低频采样条件下(1 Hz及以下)分解准确率较低的问题,提出了一种基于卷积神经网络(convolution netural network,CNN)与长... 非侵入式负荷分解对于节能减排、负荷调峰、智能用能等方面均具有重要的现实意义。针对目前非侵入式负荷分解方法在低频采样条件下(1 Hz及以下)分解准确率较低的问题,提出了一种基于卷积神经网络(convolution netural network,CNN)与长短期记忆网络(long short-term memory,LSTM)相结合的seq2seq的非侵入式负荷分解算法(seq2seq based on CNN and LSTM,seq2seqBCL)。该深度学习模型将功率时间序列作为网络的输入,通过CNN做特征提取。考虑到电力数据的时序性,增加了LSTM层进行电器识别,相比于NILMTK中seq2seq模型降低了网络层数,简化了网络结构。在REDD数据集上对算法性能进行了评估,所提出的算法提升了整个网络系统的性能,与FHMM、CO和传统seq2seq算法相比,负荷分解准确率有明显提升。 展开更多
关键词 非侵入式负荷分解 seq2seq 卷积神经网络 长短期记忆网络 深度学习 低频采样
在线阅读 下载PDF
基于时空注意力-Seq2Seq网络的ISAR包络对齐方法 被引量:1
9
作者 李文哲 李开明 +3 位作者 岳屹峰 王金昊 许慧革 罗迎 《信号处理》 CSCD 北大核心 2024年第9期1659-1673,共15页
包络对齐是逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像中平动补偿处理的第一步,包络对齐的精度对于方位聚焦和成像质量具有重要影响。针对稀疏孔径和低信噪比条件下传统的包络对齐算法性能显著降低的问题,本文提出一... 包络对齐是逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像中平动补偿处理的第一步,包络对齐的精度对于方位聚焦和成像质量具有重要影响。针对稀疏孔径和低信噪比条件下传统的包络对齐算法性能显著降低的问题,本文提出一种基于时空注意力-Seq2Seq网络的包络对齐方法。该网络模型以门控循环单元为编码解码单元,针对点目标距离像包络的能量分布特征对空间注意力机制进行改进后,添加时间和空间两维注意力机制形成对ISAR距离像回波包络进行对齐的能力。数据生成方面,基于电磁波仿真参数和目标运动仿真参数进行成像模拟仿真构造了ISAR回波数据集,经过8倍插值后输入网络进行训练,使网络学习到从未对齐回波到对齐回波的映射关系。所提方法以离线训练代替在线相关计算,融合了Seq2Seq模型在处理序列到序列问题上的结构优势、时间注意力机制在捕捉长期依赖关系和空间注意力机制在提取区域特征上的突出能力,实现了稀疏孔径和低信噪比条件下对距离-慢时间域ISAR回波的自动对齐。通过向训练好的时空注意力-Seq2Seq网络输入未对齐的回波序列,网络可以在不改变回波相位结构的前提下自动实现包络对齐。仿真和实测数据对齐结果表明,和传统的包络对齐方法相比,所提方法在稀疏孔径和低信噪比条件下优势明显,在欠采样率为50%、信噪比为0 dB条件下对雅克-42飞机实测回波数据的包络对齐实验中,该方法将循环移位误差由39、26减小至6,将成像结果的图像熵由4.58、4.22减小至1.71,验证了其良好性能。 展开更多
关键词 逆合成孔径雷达成像 包络对齐 时空注意力机制 seq2seq模型
在线阅读 下载PDF
基于seq2seq和SVM双层融合的非侵入式用户异常行为检测 被引量:1
10
作者 江友华 叶梦豆 +1 位作者 赵乐 杨兴武 《计算机应用与软件》 北大核心 2024年第9期97-105,共9页
以非侵入式负荷分解为基础,对用户异常用电行为进行研究。采用Kmeans聚类算法提取负荷状态特征;采用深度学习算法中的序列到序列翻译(sequence to sequence, seq2seq)模型,将电力用户用电总数据分解成单个电器的功耗数据;结合SVM算法对... 以非侵入式负荷分解为基础,对用户异常用电行为进行研究。采用Kmeans聚类算法提取负荷状态特征;采用深度学习算法中的序列到序列翻译(sequence to sequence, seq2seq)模型,将电力用户用电总数据分解成单个电器的功耗数据;结合SVM算法对分解后多种家用电器用电数据进行异常检测。在UKDALE数据集实验结果表明,该模型不仅能提高分解准确度、降低分解误差,而且多个电器数据结合分析实现了用户异常行为检测。 展开更多
关键词 非侵入式负荷分解 Kmeans聚类 seq2seq模型 SVM算法 异常行为检测
在线阅读 下载PDF
基于Seq2Seq模型的SparQL查询预测 被引量:5
11
作者 杨东华 邹开发 +1 位作者 王宏志 王金宝 《软件学报》 EI CSCD 北大核心 2021年第3期805-817,共13页
近年来,随着以数据为中心的应用大量增加,图数据模型逐渐被人们所关注,图数据库的发展也非常迅速,对于用户而言,往往更关心其在使用数据库过程中的效率问题.主要研究如何利用已有的信息进行图数据库的查询预测,从而进行数据的预加载与缓... 近年来,随着以数据为中心的应用大量增加,图数据模型逐渐被人们所关注,图数据库的发展也非常迅速,对于用户而言,往往更关心其在使用数据库过程中的效率问题.主要研究如何利用已有的信息进行图数据库的查询预测,从而进行数据的预加载与缓存,提高系统的响应效率.为了使得方法具有跨数据移植性,并深入挖掘数据间的联系,将SparQL查询提取为序列的形式,使用Seq2Seq模型对其进行数据分析和预测,并使用真实的数据集对方法进行测试,实验结果表明,本方案具有良好的效果. 展开更多
关键词 图数据库 SPARQL 查询预测 seq2seq模型
在线阅读 下载PDF
基于LSTM-Seq2Seq的兔舍环境多参数预测 被引量:3
12
作者 冀荣华 史珊弋 +2 位作者 赵迎迎 刘中英 吴中红 《农业机械学报》 EI CAS CSCD 北大核心 2021年第S01期396-401,409,共7页
为解决传统兔舍环境参数预测方法忽略环境参数间耦合关系的问题,提出了基于LSTM的Seq2Seq兔舍环境多参数关联序列预测模型。在建模过程中,使用双层LSTM作为Seq2Seq结构的编码器和解码器,以提高环境参数预测模型的表征能力及预测精度,而S... 为解决传统兔舍环境参数预测方法忽略环境参数间耦合关系的问题,提出了基于LSTM的Seq2Seq兔舍环境多参数关联序列预测模型。在建模过程中,使用双层LSTM作为Seq2Seq结构的编码器和解码器,以提高环境参数预测模型的表征能力及预测精度,而Seq2Seq结构不仅能够有效提取兔舍环境参数序列自身时间相关性,还能够挖掘参数间的耦合关系。利用该模型对浙江省嵊州市某兔场兔舍环境数据进行实验及预测。结果显示,该兔舍环境多参数预测模型取得了良好的预测性能,分别与标准LSTM、标准SVR模型对比分析,温度预测精度分别提高28.41%和48.60%,相对湿度预测精度分别提高9.84%和56.08%,二氧化碳浓度预测精度分别提高5.39%和11.19%。表明所提出的兔舍环境多参数预测模型能够充分挖掘关联环境参数序列间的耦合关系,满足兔舍环境数据精准预测的需要。 展开更多
关键词 兔舍 环境参数 关联时间序列 预测 LSTM seq2seq
在线阅读 下载PDF
基于E-Seq2Seq技术的数据驱动型机组组合智能决策方法 被引量:29
13
作者 杨楠 贾俊杰 +4 位作者 邢超 刘颂凯 陈道君 叶迪 邓逸天 《中国电机工程学报》 EI CSCD 北大核心 2020年第23期7587-7599,共13页
在能源技术变革日新月异、人工智能技术与电力系统深度融合的背景下,研究具有高适应性、高精度的机组组合智能决策方法具有重要意义。该文结合门限循环神经网络(gated recurrent unit,GRU)提出一种基于E-Seq2Seq(expand sequence to seq... 在能源技术变革日新月异、人工智能技术与电力系统深度融合的背景下,研究具有高适应性、高精度的机组组合智能决策方法具有重要意义。该文结合门限循环神经网络(gated recurrent unit,GRU)提出一种基于E-Seq2Seq(expand sequence to sequence,E-Seq2Seq)技术的数据驱动型机组组合智能决策方法。首先研究并梳理机组组合模型输入输出序列的类型与结构,形成机组组合弹性多序列映射型样本;然后研究提出一种适用于弹性多序列映射型样本的E-Seq2Seq技术;在此基础上,以GRU为神经元构建机组组合深度学习模型,并最终提出一种基于E-Seq2Seq技术的数据驱动型机组组合智能决策方法。基于IEEE118节点系统、Python环境的算例验证该文方法的正确性和有效性。 展开更多
关键词 GRU E-seq2seq技术 数据驱动 深度学习 机组组合决策
在线阅读 下载PDF
基于深度特征和Seq2Seq模型的网络态势预测方法 被引量:15
14
作者 林志兴 王立可 《计算机应用》 CSCD 北大核心 2020年第8期2241-2247,共7页
针对目前大多数的网络态势预测方法不能挖掘数据中的深度信息且需要手动提取与构造特征的问题,提出了深度特征网络态势预测方法DFS-Seq2Seq。首先将网络流、日志和系统事件等产生的数据进行清洗处理,使用深度特征融合算法自动合成深度... 针对目前大多数的网络态势预测方法不能挖掘数据中的深度信息且需要手动提取与构造特征的问题,提出了深度特征网络态势预测方法DFS-Seq2Seq。首先将网络流、日志和系统事件等产生的数据进行清洗处理,使用深度特征融合算法自动合成深度关系特征,然后采用自动编码器对合成的特征进行提取,最后使用长短期记忆网络(LSTM)构建Seq2Seq模型对数据进行预测。通过设计缜密的实验在公开数据集Kent2016上对所提方法进行验证,结果显示在深度为2时与支持向量机(SVM)、贝叶斯、随机森林(RF)和LSTM这四种分类模型相比,其召回率分别提升了7.4%、11.5%、6.5%、3.0%。实验结果表明DFS-Seq2Seq可以在实际应用中有效地识别网络身份验证中的危险事件,对网络态势作出有效的预测。 展开更多
关键词 网络态势 深度特征合成 自动编码器 seq2seq模型 双向长短期记忆网络
在线阅读 下载PDF
基于时空注意力-Seq2Seq模型的多风电机组多步风速预测算法 被引量:6
15
作者 刘长良 赵陆阳 +1 位作者 王梓齐 徐健 《太阳能学报》 EI CAS CSCD 北大核心 2023年第8期420-429,共10页
针对在多风电机组风速预测任务中,卷积运算不适用于提取排布不规则的多风电机组空间相关性的问题,提出一种基于时空注意力-Seq2Seq模型的多风电机组多步风速预测算法。首先使用空间注意力机制强化风速序列的空间相关性,并对常规空间注... 针对在多风电机组风速预测任务中,卷积运算不适用于提取排布不规则的多风电机组空间相关性的问题,提出一种基于时空注意力-Seq2Seq模型的多风电机组多步风速预测算法。首先使用空间注意力机制强化风速序列的空间相关性,并对常规空间注意力机制进行改进;之后使用Seq2Seq模型中的编码器进行编码;最后使用结合时间注意力机制的解码器计算多风电机组的多步预测结果。以河北市某风电场的实际数据为算例进行实验,结果表明相比其他对比算法,所提算法的平均绝对误差下降约4.3%~15.0%,精度有较大提高。 展开更多
关键词 风速 深度学习 风电机组 注意力机制 seq2seq 时空相关性
在线阅读 下载PDF
采用Seq2Seq模型的非受限词义消歧方法 被引量:5
16
作者 唐善成 马付玉 +1 位作者 张镤月 陈熊熊 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期351-355,共5页
词义消歧在中文自然语言处理中有着重要作用,基于传统机器学习的方法存在准确度不高,需要人工提取文本特征的缺点;基于深度学习的方法不适于词义歧义较多的情况。该文提出采用Seq2Seq模型的非受限词义消歧方法,输入词上下文序列,经过编... 词义消歧在中文自然语言处理中有着重要作用,基于传统机器学习的方法存在准确度不高,需要人工提取文本特征的缺点;基于深度学习的方法不适于词义歧义较多的情况。该文提出采用Seq2Seq模型的非受限词义消歧方法,输入词上下文序列,经过编码器编码得到潜在语义向量,再经过解码器解码输出词义序列,适用于所有词义歧义情况。最后,在SemEval-2007 Task#5任务中进行测试,测试结果表明,该文提出的方法比其他7种方法中的最优方法消歧准确率提高了11.48%。 展开更多
关键词 自然语言处理 词义消歧 seq2seq
在线阅读 下载PDF
基于双向LSTM的Seq2Seq模型在加油站时序数据异常检测中的应用 被引量:18
17
作者 陶涛 周喜 +1 位作者 马博 赵凡 《计算机应用》 CSCD 北大核心 2019年第3期924-929,共6页
加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异... 加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异常车辆,首先通过自动编码器对加油站点采集到的相关数据进行特征提取,然后采用嵌入双向长短期记忆(Bi-LSTM)的Seq2Seq模型对加油行为进行预测,最后通过比较预测值和原始值来定义异常点的阈值。通过在加油数据集以及信用卡欺诈数据集上的实验验证了该方法的有效性,并且相对于现有方法在加油数据集上均方根误差(RMSE)降低了21.1%,在信用卡欺诈数据集上检测异常的准确率提高了1.4%。因此,提出的模型可以有效应用于加油行为异常的车辆检测,从而提高加油站的管理和运营效率。 展开更多
关键词 加油站时序数据 深度学习 seq2seq 双向长短期记忆 异常检测
在线阅读 下载PDF
基于BI-GRU改进的Seq2Seq网络的变压器油中溶解气体浓度预测方法 被引量:14
18
作者 汤健 侯慧娟 +3 位作者 陈洪岗 王劭菁 盛戈皞 江秀臣 《电力自动化设备》 EI CSCD 北大核心 2022年第3期196-202,217,共8页
基于门控循环单元(GRU)构建双向多层门控循环单元,并引入编码器-解码器结构搭建Seq2Seq网络模型,通过优化神经元及神经网络结构提取时序数据依赖关系。同时引入注意力机制和Scheduled Sampling算法,自动获取与当前时刻预测输出显著相关... 基于门控循环单元(GRU)构建双向多层门控循环单元,并引入编码器-解码器结构搭建Seq2Seq网络模型,通过优化神经元及神经网络结构提取时序数据依赖关系。同时引入注意力机制和Scheduled Sampling算法,自动获取与当前时刻预测输出显著相关的关键输入时间点,提高长时间预测的精度。变压器正常运行状态下的气体浓度预测算例结果表明,与基于简单GRU模型及简单Seq2Seq模型的方法相比,所提方法的预测误差更低且预测的发展趋势更符合真实值;变压器异常运行状态下的气体浓度预测算例结果表明,所提方法的平均相对误差和最大相对误差相比长短期记忆(LSTM)网络方法分别降低了0.73%和2.31%。 展开更多
关键词 电力变压器 油中溶解气体 门控循环单元 seq2seq 注意力机制 Scheduled Sampling算法
在线阅读 下载PDF
基于改进seq2seq模型的英汉翻译研究 被引量:23
19
作者 肖新凤 李石君 +2 位作者 余伟 刘杰 刘倍雄 《计算机工程与科学》 CSCD 北大核心 2019年第7期1257-1265,共9页
目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型—seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理... 目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型—seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理和嵌入层参数初始化方法,并改进seq2seq模型结构,在编码器和解码器之间添加一层用于语法变化的转换层。通过预处理,能缩减翻译模型的参数规模和训练时间20%,且翻译性能提高0.4BLEU。使用转换层的seq2seq模型在翻译性能上提升0.7~1.0BLEU。实验表明,在规模大小不同的语料英汉翻译任务中,该模型与现有的基于注意力机制的seq2seq主流模型相比,训练时长一致,性能提高了1~2BLEU。 展开更多
关键词 深度学习 神经机器翻译 seq2seq模型 注意力机制 命名实体识别
在线阅读 下载PDF
一种新的seq2seq的可控图像字幕的生成方法 被引量:3
20
作者 王源顺 段迅 吴云 《计算机应用研究》 CSCD 北大核心 2021年第11期3510-3516,共7页
针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换... 针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换的块哨兵和带视觉哨兵的自适应注意力机制的指导下,将控制信号有规律地输入到双层的长短期记忆网络(long short term memory,LSTM)中,以可控的方式指导模型生成对应的图像字幕;此外,baseline使用cross entropy loss来早停模型的训练,引入强化学习思想来解决训练时的优化目标与评估算法效果时指标不一致的问题,进一步优化模型效果。实验表明:在MSCOCO及Flickr30k数据集上,提出的算法在生成可控图像字幕、字幕质量、多样性上达到了非常好的效果。 展开更多
关键词 图像字幕 seq2seq 控制信号 哨兵机制 自适应注意力机制
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部