-
题名增强型深度确定策略梯度算法
被引量:9
- 1
-
-
作者
陈建平
何超
刘全
吴宏杰
胡伏原
傅启明
-
机构
苏州科技大学电子与信息工程学院
苏州科技大学江苏省建筑智慧节能重点实验室
苏州科技大学苏州市移动网络技术与应用重点实验室
苏州科技大学苏州市虚拟现实智能交互及应用技术重点实验室
苏州大学计算机科学与技术学院
-
出处
《通信学报》
EI
CSCD
北大核心
2018年第11期106-115,共10页
-
基金
国家自然科学基金资助项目(No.61502329
No.61772357
+9 种基金
No.61750110519
No.61772355
No.61702055
No.61672371
No.61602334
No.61502323)
江苏省自然科学基金资助项目(No.BK20140283)
江苏省重点研发计划基金资助项目(No.BE2017663)
江苏省高校自然科学研究基金资助项目(No.13KJB520020)
苏州市应用基础研究计划工业部分基金资助项目(No.SYG201422)~~
-
文摘
针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样性样本池和高误差样本池按比例选取,以兼顾样本多样性以及样本价值信息,提高样本的利用效率和算法的收敛性能。此外,进一步从理论上证明了利用自模拟度量方法对样本进行相似性度量的合理性,建立值函数与样本相似性之间的关系。将E-DDPG算法以及DDPG算法用于经典的Pendulum问题和MountainCar问题,实验结果表明,E-DDPG具有更好的收敛稳定性,同时具有更快的收敛速率。
-
关键词
深度强化学习
样本排序
自模拟度量
时间差分误差
-
Keywords
deep reinforcement learning
sample ranking
bisimulation metric
temporal difference error
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于CNN的足迹图像检索与匹配方法
被引量:7
- 2
-
-
作者
陈扬
曾诚
程成
邹恩岑
顾建伟
陆悠
奚雪峰
-
机构
苏州科技大学电子与信息工程学院
苏州科技大学苏州市虚拟现实智能交互及应用技术重点实验室
昆山市公安局指挥中心
-
出处
《南京师范大学学报(工程技术版)》
CAS
2018年第3期39-45,共7页
-
基金
国家自然科学基金(61750110534
61728205)
苏州市科技发展计划(重点实验室SZS201609/产业前瞻性项目SYG201707)
-
文摘
足迹图像作为犯罪现场的重要痕迹物证之一,在破解串并案上有着不可忽视的作用.传统的足迹图像检索与匹配,需要耗费大量的时间与人力,极大地影响了破案进展.卷积神经网络(CNN)在图像识别与检索上表现出很好的效果.面向公安足迹图像比对实战需求,提出了一种基于卷积神经网络的足迹图像检索与匹配方法,对检索结果设置不同检索区,可以满足不同业务需求.初步实验表明该方法的有效性和实用性.
-
关键词
深度学习
卷积神经网络
足迹检索
图像处理
-
Keywords
deep leaming
convolutional neural network
footprint searching
image processing
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-