-
题名基于Gestalt优化的红外视频时空显著性检测
- 1
-
-
作者
王鑫
张春燕
宁晨
-
机构
河海大学计算机与信息学院
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
南京师范大学物理科学与技术学院
-
出处
《系统仿真学报》
CAS
CSCD
北大核心
2020年第6期1021-1031,共11页
-
基金
国家自然科学基金(61603124)
教育部中央高校基本科研业务费专项资金(2019B15314,30918014107)
江苏省“六大人才高峰”高层次人才(XYDXX-007)。
-
文摘
针对红外视频时空显著性检测问题,提出一种基于Gestalt优化的方法。设计基于多尺度局部稀疏表示和局部对比度测量的方法计算红外视频的空间显著性;为提取视频中显著性目标的运动信息,设计基于多帧对称差分的算法计算时间显著性;为得到初始时空显著图,设计基于交互一致性的融合策略将空间显著图和时间显著图进行自适应融合;提出基于Gestalt优化的最终时空显著图计算方法。实验结果表明,提出算法能有效检测红外视频的时空显著性。
-
关键词
红外
显著性检测
稀疏表示
Gestalt理论
-
Keywords
infrared
saliency detection
sparse representation
Gestalt theory
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名基于单模态的多尺度特征融合人体行为识别方法
被引量:3
- 2
-
-
作者
刘锁兰
田珍珍
王洪元
林龙
王炎
-
机构
常州大学计算机与人工智能学院阿里云大数据学院软件学院
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
-
出处
《计算机应用》
CSCD
北大核心
2023年第10期3236-3243,共8页
-
基金
国家自然科学基金资助项目(61976028)
江苏省社会安全图像与视频理解重点实验室开放课题(J2021⁃2)。
-
文摘
针对人体行为识别任务中未能充分挖掘超距关节点之间潜在关联的问题,以及使用多模态数据带来的高昂训练成本的问题,提出一种单模态条件下的多尺度特征融合人体行为识别方法。首先,将人体的原始骨架图进行全局特征关联,并利用粗尺度的全局特征捕获远距离关节点间的联系;其次,对全局特征关联图进行局部划分以得到融合了全局特征的互补子图(CSGF),利用细尺度特征建立强关联,并形成多尺度特征的互补;最后,将CSGF输入时空图卷积模块中提取特征,并聚合提取后的结果以输出最终的分类结果。实验结果表明,在行为识别权威数据集NTU RGB+D60上,所提方法的准确率分别为89.0%(X-sub)和94.2%(X-view);在具有挑战性的大规模数据集NTU RGB+D120上,所提方法的准确率分别为83.3%(X-sub)和85.0%(X-setup),与单模态下的ST-TR(Spatial-Temporal TRansformer)相比,分别提升1.4和0.9个百分点,与轻量级SGN(Semantics-Guided Network)相比,分别提升4.1和3.5个百分点。可见,所提方法能够充分挖掘多尺度特征的协同互补性,并有效提高单模态条件下模型的识别准确率和训练效率。
-
关键词
人体行为识别
骨架关节点
图卷积网络
单模态
多尺度
特征融合
-
Keywords
human action recognition
skeleton joint
Graph Convolutional Network(GCN)
single mode
multi-scale
feature fusion
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于退化四元小波变换的纸币识别
被引量:1
- 3
-
-
作者
盖杉
罗立民
-
机构
东南大学计算机科学与工程学院
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
-
出处
《数据采集与处理》
CSCD
北大核心
2014年第5期699-703,共5页
-
基金
国家自然科学青年基金(61202319)资助项目
江西省教育厅(GJJ13481)资助项目
+1 种基金
江苏省社会安全图像与视频理解重点实验室(南京理工大学)(30920140122007)资助项目
中国博士后基金(2013M530223,2013M530224)资助项目
-
文摘
针对如何提取纸币图像特征和提高识别率的问题,综合利用退化四元小波变换具有的相位特性,提出一种基于退化四元小波变换的纸币识别方法。该方法首先对采集的纸币图像进行倾斜校正和边缘检测,然后运用退化四元小波对纸币图像进行分解操作,并对分解系数进行统计分析,将每个分解子带系数的能量和标准差作为该纸币图像的特征向量,最后将支持向量机作为分类器对纸币图像进行识别。本文方法在资源约束的嵌入式清分系统上实现,实验结果表明采用本文提出的算法突破了传统纸币识别系统识别率很难再提高的瓶颈,同时能够满足清分系统的实时性要求。
-
关键词
退化四元小波变换
特征提取
支持向量机
纸币识别
-
Keywords
reduced quaternion wavelet transform
feature extraction
support vector machine
banknote recognition
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名基于注意力机制及类别层次结构的弱监督目标定位
被引量:6
- 4
-
-
作者
冯迅
杨健
周涛
宫辰
-
机构
南京理工大学计算机科学与工程学院模式计算与应用实验室
高维信息智能感知与系统教育部重点实验室(南京理工大学)
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第10期4916-4929,共14页
-
基金
国家自然科学基金(61973162,62172228)
江苏省自然科学基金(BZ2021013)
中央高校基本科研业务费专项资金(30920032202,30921013114)。
-
文摘
弱监督目标定位是指仅利用图像级的类别标注信息来训练目标定位器,而不需要使用精确的目标位置标注信息来进行算法训练.当前的一些方法往往只能定位出目标对象中最具鉴别性的部分而无法准确地标识出完整的目标对象,或者易受背景无关信息干扰从而导致定位结果不精确.为了解决上述问题,提出一种基于注意力机制和类别层次结构的弱监督目标定位方法.该方法通过对卷积神经网络的注意力图进行均值分割提取更完整的目标区域.进一步,通过类别层次结构网络实现对背景区域注意力的削弱,从而提高对感兴趣目标的定位精度.基于多个网络结构和公共数据集上的大量实验结果表明,相比目前已有的弱监督定位方法,所提方法在多个评价指标下均能够获得更好的定位效果.
-
关键词
弱监督目标定位
网络注意力
背景干扰
层次结构网络
卷积神经网络(CNN)
-
Keywords
weakly supervised object localization
network attention
background interference
hierarchical network
convolutional neural network(CNN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于注意力机制的乳腺X线摄影分类方法
被引量:4
- 5
-
-
作者
盛龙帅
李策
李欣
-
机构
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
中国矿业大学(北京)机电与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第8期166-170,共5页
-
基金
国家自然科学基金青年基金(No.61601466)
中央高校基本科研业务费专项资金(No.30918014107,No.2016QJ04)
“越崎青年学者”资助计划。
-
文摘
环境的日益恶化导致癌症的发病率不断升高,2018年全球乳腺癌的发病率在所有癌症中已经位居首位。乳腺X线摄影价格实惠且易于操作,目前被认作是最好的乳腺癌筛查方法,也是早期发现乳腺癌最有效的方法。针对乳腺X线摄影不容易分辨、特征不明显等特点,提出了基于RNN+CNN的注意力记忆网络对其进行分类。注意力记忆网络包含注意力记忆模块和卷积残差模块。注意力记忆模块中,注意力模块提取乳腺X线摄影的特征,记忆模块在RNN网络加入注意力权重来模拟人对所提取关键信息的重点突出;卷积残差模块使用CNN对图像进行分类。该方法创新之处在于:提出注意力记忆网络用于乳腺X线摄影图像分类;所设计网络在RNN+CNN结构上引入注意力权重,提取图像关键信息以增强特征描述。在乳腺X线摄影INbreast数据集上的实验结果显示,注意力记忆网络的运行时间比预训练的Inceptionv2、ResNet50、VGG16网络少50%以上,同时达到更高的分类准确率。
-
关键词
乳腺X线摄影
注意力机制
卷积神经网络
循环神经网络
预训练
-
Keywords
mammography
attention mechanism
Convolutional Neural Network(CNN)
Recurrent Neural Network(RNN)
pre-training
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名结合总变差和组稀疏性的压缩感知重构方法
被引量:1
- 6
-
-
作者
朱俊
陈长伟
-
机构
金陵科技学院计算机工程学院
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
南京晓庄学院信息工程学院
-
出处
《兵器装备工程学报》
CAS
2017年第11期114-117,128,共5页
-
基金
金陵科技学院博士启动金项目“基于聚类融合特征配准图像鲁棒拼接算法”(Jit-b-201508)
江苏省社会安全图像与视频理解重点实验室创新基金项目(30916014107)
江苏省高等学校自然科学研究面上资助项目(16KJB520014)
-
文摘
为了提高图像重建的质量,基于压缩感知理论,提出了一种基于总变差和组稀疏性的图像重建方法,同时考虑图像像素灰度值的梯度稀疏性和重叠图像块的非局部相似性两种先验知识。为了准确挖掘先验知识,本文选择非凸lp范数描述,并利用交替方向乘子法求解产生的重构模型。实验结果表明,与当前主流的重建算法相比,所提算法能够获得更高的图像重构结果。
-
关键词
压缩感知
总变差
组稀疏性
交替方向乘子算法
-
Keywords
compressive sensing (CS)
total variation
group sparsity
alternating direction methodof multipliers
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名基于近邻监督局部不变鲁棒主成分分析的特征提取模型
- 7
-
-
作者
葛孟婷
万鸣华
-
机构
南京审计大学计算机学院(智能审计学院)
江苏省社会安全图像与视频理解重点实验室(南京理工大学)
-
出处
《计算机应用》
CSCD
北大核心
2023年第4期1013-1020,共8页
-
基金
国家自然科学基金资助项目(61876213)
江苏省自然科学基金资助项目(BK20201397)
+2 种基金
江苏省社会安全图像与视频理解重点实验室项目(J2021-4)
江苏省高校未来网络科研基金资助项目(SRFP-2021-YB-25)
2021年江苏省研究生科研与实践创新计划项目(SJCX21_0885)。
-
文摘
针对无监督的局部不变鲁棒主成分分析(LIRPCA)算法未考虑样本间的类别关系的问题,提出了一种基于近邻监督局部不变鲁棒主成分分析(NSLIRPCA)的特征提取模型。所提模型考虑了样本间的类别信息,并以此构建关系矩阵。对所提模型进行公式求解和公式的收敛性证明,并将所提模型应用于各种遮挡数据集。实验结果表明,在ORL、Yale、COIL-Processed和PolyU数据集上,与主成分分析(PCA)算法、基于L1范数的主成分分析(PCA-L1)算法、非负矩阵分解(NMF)算法、局部保持投影(LPP)算法和LIRPCA算法相比,所提模型在原始图像数据集上的识别率分别最高提升了8.80%、7.76%、20.37%、4.72%和4.61%,在遮挡图像数据集上的识别率分别最高提升了30.79%、30.73%、36.02%、19.65%和17.31%。可见,所提模型提高了算法的识别性能,降低了模型复杂度,明显优于对比算法。
-
关键词
特征提取
子空间学习
无监督学习
鲁棒性
图像识别
-
Keywords
feature extraction
subspace learning
unsupervised learning
robustness
image recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-