期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多注意力多尺度特征融合的图像描述生成算法
被引量:
17
1
作者
陈龙杰
张钰
+1 位作者
张玉梅
吴晓军
《计算机应用》
CSCD
北大核心
2019年第2期354-359,共6页
针对图像描述生成中对图像细节表述质量不高、图像特征利用不充分、循环神经网络层次单一等问题,提出基于多注意力、多尺度特征融合的图像描述生成算法。该算法使用经过预训练的目标检测网络来提取图像在卷积神经网络不同层上的特征,将...
针对图像描述生成中对图像细节表述质量不高、图像特征利用不充分、循环神经网络层次单一等问题,提出基于多注意力、多尺度特征融合的图像描述生成算法。该算法使用经过预训练的目标检测网络来提取图像在卷积神经网络不同层上的特征,将图像特征分层输入多注意力结构中,依次将多注意力结构与多层循环神经网络相连,构造出多层次的图像描述生成网络模型。在多层循环神经网络中加入残差连接来提高网络性能,并且可以有效避免因为网络加深导致的网络退化问题。在MSCOCO测试集中,所提算法的BLEU-1和CIDEr得分分别可以达到0. 804及1. 167,明显优于基于单一注意力结构的自上而下图像描述生成算法;通过人工观察对比可知,所提算法生成的图像描述可以表现出更好的图像细节。
展开更多
关键词
长短期记忆网络
图像描述
多注意力机制
多尺度特征融合
深度神经网络
在线阅读
下载PDF
职称材料
题名
基于多注意力多尺度特征融合的图像描述生成算法
被引量:
17
1
作者
陈龙杰
张钰
张玉梅
吴晓军
机构
现代教学
技术
教育
部重点实验室(
陕西师范大学
)
陕西
省教学信息
技术
工程
实验室(
陕西师范大学
)
文化教育
智慧
传播
工程技术
研究
中心
(
陕西师范大学
)
陕西师范大学
计算机科学学院
出处
《计算机应用》
CSCD
北大核心
2019年第2期354-359,共6页
基金
国家自然科学基金资助项目(11772178
61741208
+8 种基金
11502133)
中央高校基本科研业务费资助项目(GK201801004
GK201803089
GK201703082)
陕西省自然科学基金资助项目(2017JQ6074)
国家重点研发计划项目(2017YFB1402102)
陕西省自然科学基础研究计划项目(2017JM6103
2017JM6060)
陕西师范大学2017年度校级综合教改研究项目(17JG33)~~
文摘
针对图像描述生成中对图像细节表述质量不高、图像特征利用不充分、循环神经网络层次单一等问题,提出基于多注意力、多尺度特征融合的图像描述生成算法。该算法使用经过预训练的目标检测网络来提取图像在卷积神经网络不同层上的特征,将图像特征分层输入多注意力结构中,依次将多注意力结构与多层循环神经网络相连,构造出多层次的图像描述生成网络模型。在多层循环神经网络中加入残差连接来提高网络性能,并且可以有效避免因为网络加深导致的网络退化问题。在MSCOCO测试集中,所提算法的BLEU-1和CIDEr得分分别可以达到0. 804及1. 167,明显优于基于单一注意力结构的自上而下图像描述生成算法;通过人工观察对比可知,所提算法生成的图像描述可以表现出更好的图像细节。
关键词
长短期记忆网络
图像描述
多注意力机制
多尺度特征融合
深度神经网络
Keywords
Long Short-Term Memory(LSTM)network
image caption
multi-attention mechanism
multi-scale feature fusion
deep neural network
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多注意力多尺度特征融合的图像描述生成算法
陈龙杰
张钰
张玉梅
吴晓军
《计算机应用》
CSCD
北大核心
2019
17
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部