期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于对比预测编码模型的多任务学习语种识别方法 被引量:1
1
作者 赵建川 杨浩铨 +2 位作者 徐勇 吴恋 崔忠伟 《数据采集与处理》 CSCD 北大核心 2022年第2期288-297,共10页
语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network,TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Co... 语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network,TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络。ECAPA-TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA-TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练。在东方语种竞赛数据集AP17-OLR的10类语种上进行了实验。实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高。 展开更多
关键词 语种识别 对比预测编码 多任务学习 ECAPA-TDNN 联合损失
在线阅读 下载PDF
基于半监督联合神经网络的调制识别算法 被引量:7
2
作者 苟泽中 许华 +2 位作者 郑万泽 冯磊 白芃远 《信号处理》 CSCD 北大核心 2020年第2期168-176,共9页
针对基于有监督学习通信信号分类算法需要大量有标签训练样本,而在实际场合大多无法满足数量要求的问题,提出利用数据驱动模型的半监督学习方法,通过对比预测编码无监督算法预训练和有监督学习相结合,利用LSTM (long short term memory)... 针对基于有监督学习通信信号分类算法需要大量有标签训练样本,而在实际场合大多无法满足数量要求的问题,提出利用数据驱动模型的半监督学习方法,通过对比预测编码无监督算法预训练和有监督学习相结合,利用LSTM (long short term memory)和ResNet (residual network)联合神经网络实现小样本自动提取特征,提高小样本条件下信号识别准确率。在真实通信调制信号集上实验表明,半监督联合神经网络结构较以往方法,识别准确率提升3%~20%,小样本条件下性能提高60%,同时在低信噪比条件下识别能力突出,0 dB时对11种调制信号平均识别正确率达到92%,具有明显优势。 展开更多
关键词 数据驱动 小样本 联合神经网络 对比预测编码 无监督预训练
在线阅读 下载PDF
融合对比预测编码的深度双Q网络 被引量:1
3
作者 刘剑锋 普杰信 孙力帆 《计算机工程与应用》 CSCD 北大核心 2023年第6期162-170,共9页
在模型未知的部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)下,智能体无法直接获取环境的真实状态,感知的不确定性为学习最优策略带来挑战。为此,提出一种融合对比预测编码表示的深度双Q网络强化学... 在模型未知的部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)下,智能体无法直接获取环境的真实状态,感知的不确定性为学习最优策略带来挑战。为此,提出一种融合对比预测编码表示的深度双Q网络强化学习算法,通过显式地对信念状态建模以获取紧凑、高效的历史编码供策略优化使用。为改善数据利用效率,提出信念回放缓存池的概念,直接存储信念转移对而非观测与动作序列以减少内存占用。此外,设计分段训练策略将表示学习与策略学习解耦来提高训练稳定性。基于Gym-MiniGrid环境设计了POMDP导航任务,实验结果表明,所提出算法能够捕获到与状态相关的语义信息,进而实现POMDP下稳定、高效的策略学习。 展开更多
关键词 部分可观测马尔可夫决策过程 表示学习 强化学习 对比预测编码 深度双Q网络
在线阅读 下载PDF
局部可观测环境下未来信息辅助的无模型深度强化学习
4
作者 常芳芳 陈祺航 刘云龙 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期796-804,共9页
深度强化学习结合了深度学习的特征提取能力和强化学习的决策能力,近年来在众多领域得到了广泛应用,但现有的针对深度强化学习的研究通常假定系统状态完全可观测,而在实际应用中,由于受到感知能力的限制,智能体往往不能完全确定所处状态... 深度强化学习结合了深度学习的特征提取能力和强化学习的决策能力,近年来在众多领域得到了广泛应用,但现有的针对深度强化学习的研究通常假定系统状态完全可观测,而在实际应用中,由于受到感知能力的限制,智能体往往不能完全确定所处状态,即所处环境为局部可观测环境.同时,现有的无模型强化学习算法往往仅依赖以往历史数据来确定决策策略,不能利用可辅助智能体决策的未来有关信息.以局部可观测问题为应用背景,通过利用对比预测编码(Contrastive Prediction Code,CPC)对未来信息的预测能力实现局部可观测环境下未来信息辅助的无模型决策学习,提出的算法既保留了无模型强化学习算法端对端的训练、性能优势,又能充分利用预测的信息来辅助智能体的决策.在不同的局部可观测环境任务上对提出的算法进行了验证和对比,实验结果验证了该算法的有效性. 展开更多
关键词 深度强化学习 局部可观测环境 对比预测编码 未来信息 表征学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部