-
题名基于CNN-RNN深度学习的图片描述方法与优化
被引量:2
- 1
-
-
作者
陈虹君
罗福强
赵力衡
张杰
李瑶
-
机构
四川大学锦城学院电子信息学院
四川大学图像研究所
-
出处
《湘潭大学自然科学学报》
CAS
2018年第2期67-70,共4页
-
基金
四川省教育厅重大培育项目(18CZ0047)
-
文摘
为了提高模型的泛化能力,将机器翻译的编-解码模型引入图片描述中.首先,提出了CNN-RNN模型:CNN负责编码,RNN负责解码,RNN模型采用LSTM网络.接着,考虑到该模型一定程度上忽略了图片的局部区域特征和图片语义信息,因此又提出改进的CNN-MIL-DRN模型.该模型考虑了属性概率向量,并将多个时刻状态堆叠在一个时刻的计算中,加深了非线性变换的复杂深度.最后,采用MS COCO C5进行模型测试,以AP及5个不用的阈值测试不同指标,同时选取一些目前较新的模型作对比,从而得到CNN-MIL-DRN模型的最优效果.
-
关键词
神经网络
CNN
RNN
MIL
LSTM
DRN
-
Keywords
neural network
CNN
RNN
MIL
LSTM
DRN
-
分类号
O152.1
[理学—基础数学]
-
-
题名基于ASR与Arduino的语音控制照明系统设计
被引量:1
- 2
-
-
作者
胡芷晗
-
机构
四川大学锦城学院电子信息学院
-
出处
《电声技术》
2019年第5期56-57,63,共3页
-
文摘
通过对Arduino单板深入研究,结合高性能的ASR语音识别芯片,将语音识别技术引入照明系统设计中,进行了语音控制系统的总体结构、主控制模块和语音识别的软硬件设计,实现了一套基于Arduino的语音控制系统。最终测试完成了远程控制台灯即时状态,提高智能化程度的目的。
-
关键词
语音识别
语音控制
ASR
ARDUINO
-
Keywords
speech recognition
voice-controled
ASR module
Arduino
-
分类号
TN912
[电子电信—通信与信息系统]
-