文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,...文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,使用注意力机制来获取序列之间的关系。在训练时加入余弦距离损失来提升生成模型的泛化性能,将训练好的说话人确认模型作为生成模型训练架构的组件。实验结果表明,在1~3 s语音时长下,采用该模型后等错误率平均降低7.78%。展开更多
非侵入式负荷分解对于节能减排、负荷调峰、智能用能等方面均具有重要的现实意义。针对目前非侵入式负荷分解方法在低频采样条件下(1 Hz及以下)分解准确率较低的问题,提出了一种基于卷积神经网络(convolution netural network,CNN)与长...非侵入式负荷分解对于节能减排、负荷调峰、智能用能等方面均具有重要的现实意义。针对目前非侵入式负荷分解方法在低频采样条件下(1 Hz及以下)分解准确率较低的问题,提出了一种基于卷积神经网络(convolution netural network,CNN)与长短期记忆网络(long short-term memory,LSTM)相结合的seq2seq的非侵入式负荷分解算法(seq2seq based on CNN and LSTM,seq2seqBCL)。该深度学习模型将功率时间序列作为网络的输入,通过CNN做特征提取。考虑到电力数据的时序性,增加了LSTM层进行电器识别,相比于NILMTK中seq2seq模型降低了网络层数,简化了网络结构。在REDD数据集上对算法性能进行了评估,所提出的算法提升了整个网络系统的性能,与FHMM、CO和传统seq2seq算法相比,负荷分解准确率有明显提升。展开更多
以非侵入式负荷分解为基础,对用户异常用电行为进行研究。采用Kmeans聚类算法提取负荷状态特征;采用深度学习算法中的序列到序列翻译(sequence to sequence, seq2seq)模型,将电力用户用电总数据分解成单个电器的功耗数据;结合SVM算法对...以非侵入式负荷分解为基础,对用户异常用电行为进行研究。采用Kmeans聚类算法提取负荷状态特征;采用深度学习算法中的序列到序列翻译(sequence to sequence, seq2seq)模型,将电力用户用电总数据分解成单个电器的功耗数据;结合SVM算法对分解后多种家用电器用电数据进行异常检测。在UKDALE数据集实验结果表明,该模型不仅能提高分解准确度、降低分解误差,而且多个电器数据结合分析实现了用户异常行为检测。展开更多
针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换...针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换的块哨兵和带视觉哨兵的自适应注意力机制的指导下,将控制信号有规律地输入到双层的长短期记忆网络(long short term memory,LSTM)中,以可控的方式指导模型生成对应的图像字幕;此外,baseline使用cross entropy loss来早停模型的训练,引入强化学习思想来解决训练时的优化目标与评估算法效果时指标不一致的问题,进一步优化模型效果。实验表明:在MSCOCO及Flickr30k数据集上,提出的算法在生成可控图像字幕、字幕质量、多样性上达到了非常好的效果。展开更多
文摘文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,使用注意力机制来获取序列之间的关系。在训练时加入余弦距离损失来提升生成模型的泛化性能,将训练好的说话人确认模型作为生成模型训练架构的组件。实验结果表明,在1~3 s语音时长下,采用该模型后等错误率平均降低7.78%。
文摘非侵入式负荷分解对于节能减排、负荷调峰、智能用能等方面均具有重要的现实意义。针对目前非侵入式负荷分解方法在低频采样条件下(1 Hz及以下)分解准确率较低的问题,提出了一种基于卷积神经网络(convolution netural network,CNN)与长短期记忆网络(long short-term memory,LSTM)相结合的seq2seq的非侵入式负荷分解算法(seq2seq based on CNN and LSTM,seq2seqBCL)。该深度学习模型将功率时间序列作为网络的输入,通过CNN做特征提取。考虑到电力数据的时序性,增加了LSTM层进行电器识别,相比于NILMTK中seq2seq模型降低了网络层数,简化了网络结构。在REDD数据集上对算法性能进行了评估,所提出的算法提升了整个网络系统的性能,与FHMM、CO和传统seq2seq算法相比,负荷分解准确率有明显提升。
文摘以非侵入式负荷分解为基础,对用户异常用电行为进行研究。采用Kmeans聚类算法提取负荷状态特征;采用深度学习算法中的序列到序列翻译(sequence to sequence, seq2seq)模型,将电力用户用电总数据分解成单个电器的功耗数据;结合SVM算法对分解后多种家用电器用电数据进行异常检测。在UKDALE数据集实验结果表明,该模型不仅能提高分解准确度、降低分解误差,而且多个电器数据结合分析实现了用户异常行为检测。
文摘针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换的块哨兵和带视觉哨兵的自适应注意力机制的指导下,将控制信号有规律地输入到双层的长短期记忆网络(long short term memory,LSTM)中,以可控的方式指导模型生成对应的图像字幕;此外,baseline使用cross entropy loss来早停模型的训练,引入强化学习思想来解决训练时的优化目标与评估算法效果时指标不一致的问题,进一步优化模型效果。实验表明:在MSCOCO及Flickr30k数据集上,提出的算法在生成可控图像字幕、字幕质量、多样性上达到了非常好的效果。