期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于分层特征对齐网络的小样本马铃薯病害叶片检测 被引量:2
1
作者 牛玉霞 孙宙红 +2 位作者 任伟 陈林琳 陈莉莉 《中国农机化学报》 北大核心 2024年第2期250-258,共9页
针对传统马铃薯病害叶片检测方法过度依赖大量训练数据以及对未知病害识别泛化性不强的问题,提出一种基于分层特征对齐网络的小样本马铃薯病害叶片检测模型。首先,收集并整理包含多种病害类型的弱标注马铃薯病害叶片数据集。其次,在支... 针对传统马铃薯病害叶片检测方法过度依赖大量训练数据以及对未知病害识别泛化性不强的问题,提出一种基于分层特征对齐网络的小样本马铃薯病害叶片检测模型。首先,收集并整理包含多种病害类型的弱标注马铃薯病害叶片数据集。其次,在支持分支中建立文本语义和视觉语义的多模态双层特征语义表示,并利用预训练网络生成多个候选框。再次,利用卷积神经网络将候选框区域映射到深度特征空间,并借助无参数的度量方法实现文本语义与视觉语义的特征对齐。最后,将查询分支中的未知类病害图片与多模态视觉和文本语义关联集进行度量计算,根据相似度值快速给出待测图片中未知新类的病害类别。通过在自建的马铃薯病害叶片数据集和开源数据集上进行测试,所提出模型分别可以实现93.55%和96.35%的识别精度,在跨域数据集上可以实现95.15%和94.06%的识别精度,优于当前经典的目标检测模型,具有一定的实际应用价值。 展开更多
关键词 马铃薯病害 叶片检测 分层特征对齐网络 文本语义 视觉语义
在线阅读 下载PDF
分层特征编解码驱动的视觉引导立体声生成方法 被引量:1
2
作者 王睿琦 程皓楠 叶龙 《软件学报》 EI CSCD 北大核心 2024年第5期2165-2175,共11页
视觉引导的立体声生成是多模态学习中具有广泛应用价值的重要任务之一,其目标是在给定视觉模态信息及单声道音频模态信息的情况下,生成符合视听一致性的立体声音频.针对现有视觉引导的立体声生成方法因编码阶段视听信息利用率不足、解... 视觉引导的立体声生成是多模态学习中具有广泛应用价值的重要任务之一,其目标是在给定视觉模态信息及单声道音频模态信息的情况下,生成符合视听一致性的立体声音频.针对现有视觉引导的立体声生成方法因编码阶段视听信息利用率不足、解码阶段忽视浅层特征导致的立体声生成效果不理想的问题,提出一种基于分层特征编解码的视觉引导的立体声生成方法,有效提升立体声生成的质量.其中,为了有效地缩小阻碍视听觉模态数据间关联融合的异构鸿沟,提出一种视听觉特征分层编码融合的编码器结构,提高视听模态数据在编码阶段的综合利用效率;为了实现解码过程中浅层结构特征信息的有效利用,构建一种由深到浅不同深度特征层间跳跃连接的解码器结构,实现了对视听觉模态信息的浅层细节特征与深度特征的充分利用.得益于对视听觉信息的高效利用以及对深层浅层结构特征的分层结合,所提方法可有效处理复杂视觉场景中的立体声合成,相较于现有方法,所提方法生成效果在真实感等方面性能提升超过6%. 展开更多
关键词 立体声 视觉引导的声音生成 分层特征编解码 多模态学习 跳跃连接
在线阅读 下载PDF
基于图像显著性区域的遥感图像机场检测 被引量:19
3
作者 王鑫 王斌 张立明 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第3期336-344,共9页
针对已有方法对图像逐像素进行分析的不足,将人眼的注意力选择计算模型引入到遥感图像的机场目标检测中,提出一种基于图像显著性区域的遥感图像中机场目标检测与识别的方法,以提高自动目标检测的效率.首先利用霍夫变换对遥感图像中是否... 针对已有方法对图像逐像素进行分析的不足,将人眼的注意力选择计算模型引入到遥感图像的机场目标检测中,提出一种基于图像显著性区域的遥感图像中机场目标检测与识别的方法,以提高自动目标检测的效率.首先利用霍夫变换对遥感图像中是否存在机场目标进行初步筛选,然后利用改进后的基于图像的视觉显著性模型提取显著性区域,根据区域上的尺度不变特征变换特征并结合多层分类回归树完成机场目标的识别.实验结果表明,该方法比现有的其他机场检测方法具有速度快、识别率高、虚警率低的特点,同时对噪声有较强的鲁棒性. 展开更多
关键词 视觉注意 显著性区域 机场检测 尺度不变特征变换 多层分类回归树 霍夫变换
在线阅读 下载PDF
利用多层视觉网络模型进行图像局部特征表征的方法 被引量:10
4
作者 郎波 黄静 危辉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第4期703-712,共10页
为了寻求代价更小、效率更高、适应性更强的图像局部特征表征方法,提出一种基于视觉机制的多层网络计算模型.首先对初级视皮层中的简单细胞和复杂细胞等神经元进行建模;然后对腹侧视通路上的V4区神经元和下颞叶皮层区神经元的响应模式... 为了寻求代价更小、效率更高、适应性更强的图像局部特征表征方法,提出一种基于视觉机制的多层网络计算模型.首先对初级视皮层中的简单细胞和复杂细胞等神经元进行建模;然后对腹侧视通路上的V4区神经元和下颞叶皮层区神经元的响应模式进行研究,并利用该计算模型对输入图像进行局部特征的表征.实验结果表明,与传统的图像特征描述方法相比,该模型所提取的图像局部特征具有足够的区分度;此外,利用生物视觉模型提取出的图像局部特征在具有复杂背景的场景中显示出了更加优秀的泛化能力. 展开更多
关键词 多层视觉网络模型 V4区 下颞叶皮层区 图像局部特征 特征描述子
在线阅读 下载PDF
基于人眼视觉特性的NSCT医学图像自适应融合 被引量:7
5
作者 戴文战 姜晓丽 李俊峰 《电子学报》 EI CAS CSCD 北大核心 2016年第8期1932-1939,共8页
医学图像融合对于临床诊断具有重要的应用价值.针对多模态医学图像特性,本文提出一种基于人类视觉特性的医学图像自适应融合方法.首先,对经配准的源图像进行非间隔采样轮廓变换((Nonsubsampled Coutourlet,NSCT)多尺度分解,得到低频子... 医学图像融合对于临床诊断具有重要的应用价值.针对多模态医学图像特性,本文提出一种基于人类视觉特性的医学图像自适应融合方法.首先,对经配准的源图像进行非间隔采样轮廓变换((Nonsubsampled Coutourlet,NSCT)多尺度分解,得到低频子带和若干高频方向子带;其次,根据低频子带集中了大部分源图像能量和决定图像轮廓的特点,采用区域能量与平均梯度相结合的方法进行融合;根据人眼对图像对比度及边缘、纹理的高敏感度,在高频子带系数的选取时提出区域拉普拉斯能量、方向对比度与脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)相结合的融合策略;进而,提出了把与人类视觉高度一致的加权结构相似度(Weighted Structure Similarity,WSSIM)作为图像融合目标函数,自适应地获取各子带的最优权值;最后,对灰度图像和彩色图像进行了大量融合比较实验,并对不同融合方法进行分析对比.实验结果表明:本文算法不仅可以有效保留源图像的信息,而且可以使融合图像灰度级更分散,更好地保留了图像边缘信息,具有更好的视觉效果. 展开更多
关键词 医学图像融合 人类视觉特征 加权结构相似度 非间隔采样轮廓变换 拉普拉斯能量和方向对比度 脉冲耦合神经网络
在线阅读 下载PDF
基于视听分层模型的实时爆炸场景识别 被引量:2
6
作者 庄越挺 傅正钢 +1 位作者 叶朝阳 吴飞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第1期90-97,共8页
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸... 提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。 展开更多
关键词 听觉 视觉 压缩域 粗分支持向量机 爆炸场景识别
在线阅读 下载PDF
分层结构直方图及其应用 被引量:3
7
作者 余旺盛 李卫华 侯志强 《电子学报》 EI CAS CSCD 北大核心 2017年第11期2617-2624,共8页
针对传统直方图特征存在的特征分辨能力不强的问题,提出了一种图像分层结构直方图.该特征首先将图像按照亮度幅值的大小进行分层,然后根据预先设计的结构图元对所有的分层图进行基于结构图元的直方图统计,最后将所得的直方图进行集成得... 针对传统直方图特征存在的特征分辨能力不强的问题,提出了一种图像分层结构直方图.该特征首先将图像按照亮度幅值的大小进行分层,然后根据预先设计的结构图元对所有的分层图进行基于结构图元的直方图统计,最后将所得的直方图进行集成得到最终的分层结构直方图.以图像匹配与视觉跟踪为例,对分层结构直方图的应用进行了大量的仿真实验,结果表明该特征较参考特征具有更强的特征分辨性能和局部描述能力.利用分层结构直方图进行图像匹配得到的相似性度量图单峰特性更加明显,能够显著降低视觉跟踪算法的跟踪误差. 展开更多
关键词 图像匹配 视觉跟踪 直方图特征 分层结构直方图
在线阅读 下载PDF
面向场景解析的空间结构化编码深度网络 被引量:2
8
作者 张国印 王泽宇 +1 位作者 吴艳霞 布树辉 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第12期1928-1936,共9页
为了研究有效的特征提取和精确的空间结构化学习对提升场景解析效果的作用,本文提高出基于全卷积神经网络空间结构化编码深度网络,网络内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法,算法能够比较准确地描述物体所处... 为了研究有效的特征提取和精确的空间结构化学习对提升场景解析效果的作用,本文提高出基于全卷积神经网络空间结构化编码深度网络,网络内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法,算法能够比较准确地描述物体所处空间的物体分布以及物体间的空间位置关系。通过空间结构化编码深度网络,网络不仅能够提取包含多层形状信息的多维视觉特征,而且可以生成包含结构化信息的空间关系特征,从而得到更为准确表达图像语义信息的混合特征。实验结果表明:在SIFT FLOW和PASCAL VOC 2012标准数据集上,空间结构化编码深度网络较现有方法能够显著地提升场景解析的准确率。 展开更多
关键词 场景解析 全卷积神经网络 图模型 空间结构化编码算法 多维视觉特征 空间关系特征 混合特征
在线阅读 下载PDF
典型相关分析与多伯努利相关模型的图像标注 被引量:1
9
作者 周晓 潘洁珠 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期841-846,共6页
文章提出一种基于图像的视觉词袋与文本标注的典型相关分析与分割无关的多伯努利相关模型的自动图像标注算法。在图像标注与分类任务中,矢量量化图像局部描述子得到的视觉词袋特征已显示了其鲁棒性与可区分性,文中对视觉词袋与文本特征... 文章提出一种基于图像的视觉词袋与文本标注的典型相关分析与分割无关的多伯努利相关模型的自动图像标注算法。在图像标注与分类任务中,矢量量化图像局部描述子得到的视觉词袋特征已显示了其鲁棒性与可区分性,文中对视觉词袋与文本特征作典型相关分析,确保投影变换后新的视觉特征与文本特征的相关性最大化,从而有效地在视觉与文本2种模态中建立联系,契合了自动图像标注的主旨。文中还提出了一种简化的多伯努利相关模型,实验结果证明了典型相关分析比概率潜藏语义分析更适合于图像自动标注,也证明了简化的多伯努利相关模型的有效性。 展开更多
关键词 自动图像标注 尺度不变特征变换 层次化k-means 视觉词袋 典型相关分析 多伯努利相关模型
在线阅读 下载PDF
基于渐进式学习与多尺度增强的客体视觉注意力估计方法
10
作者 丰江帆 何中鱼 《电子与信息学报》 EI CSCD 北大核心 2023年第4期1475-1484,共10页
视觉注意力机制已引起学界和产业界的广泛关注,但既有工作主要从场景观察者的视角进行注意力检测。然而,现实中不断涌现的智能应用场景需要从客体视角进行视觉注意力检测。例如,检测监控目标的视觉注意力有助于预测其后续行为,智能机器... 视觉注意力机制已引起学界和产业界的广泛关注,但既有工作主要从场景观察者的视角进行注意力检测。然而,现实中不断涌现的智能应用场景需要从客体视角进行视觉注意力检测。例如,检测监控目标的视觉注意力有助于预测其后续行为,智能机器人需要理解交互对象的意图才能有效互动。该文结合客体视觉注意力的认知机制,提出一种基于渐进式学习与多尺度增强的客体视觉注意力估计方法。该方法把客体视域视为几何结构和几何细节的组合,构建层次自注意力模块(HSAM)获取深层特征之间的长距离依赖关系,适应几何特征的多样性;并利用方向向量和视域生成器得到注视点的概率分布,构建特征融合模块将多分辨率特征进行结构共享、融合与增强,更好地获取空间上下文特征;最后构建综合损失函数来估计注视方向、视域和焦点预测的相关性。实验结果表明,该文所提方法在公开数据集和自建数据集上对客体视觉注意力估计的不同精度评价指标都优于目前的主流方法。 展开更多
关键词 客体视觉注意力 渐进式学习 层次自注意力 特征融合
在线阅读 下载PDF
视觉显著性特征约束下的骨架生长算法 被引量:2
11
作者 周丹凤 蒋建国 +1 位作者 詹曙 王杰 《电子测量与仪器学报》 CSCD 2012年第6期535-540,共6页
骨架特征在图像处理和计算机图形学等领域有着广泛的应用,而常规的骨架提取算法易受到噪声和物体自身变化的影响,使得提取的骨架难以进行后续的应用。本文提出联合离散曲线演化和弯曲度比率这两种视觉显著性特征约束下的骨架生长算法。... 骨架特征在图像处理和计算机图形学等领域有着广泛的应用,而常规的骨架提取算法易受到噪声和物体自身变化的影响,使得提取的骨架难以进行后续的应用。本文提出联合离散曲线演化和弯曲度比率这两种视觉显著性特征约束下的骨架生长算法。在骨架生长过程中通过对判为结点的骨架点的邻域骨架点进行进一步的弯曲度比率约束,有效抑制了离散曲线演化约束骨架提取算法对于弯曲度较大的部位所产生的无法避免的冗余枝。通过调节保留的离散曲线演化点数以及弯曲度比率阈值,可获得多尺度的骨架。实验证明,在较大非刚体形变和轮廓噪声等干扰下,本文提出的算法仍能有效的抑制冗余骨架枝的产生,获得的骨架能够较好的表示图形中视觉重要部分。 展开更多
关键词 骨架 离散曲线演化 弯曲度比率 多尺度 视觉显著性特征
在线阅读 下载PDF
基于动态遍历的分层特征网络视觉定位 被引量:3
12
作者 蒋雪源 陈青梅 黄初华 《计算机工程》 CAS CSCD 北大核心 2021年第9期197-202,共6页
采用分层特征网络估计查询图像的相机位姿,会出现检索失败和检索速度慢的问题。对分层特征网络进行分析,提出采用动态遍历与预聚类的视觉定位方法。依据场景地图进行图像预聚类,利用图像全局描述符获得候选帧集合并动态遍历查询图像,利... 采用分层特征网络估计查询图像的相机位姿,会出现检索失败和检索速度慢的问题。对分层特征网络进行分析,提出采用动态遍历与预聚类的视觉定位方法。依据场景地图进行图像预聚类,利用图像全局描述符获得候选帧集合并动态遍历查询图像,利用图像局部特征描述符进行特征点匹配,通过PnP算法估计查询图像的相机位姿,由此构建基于MobileNetV3的分层特征网络,以准确提取全局描述符与局部特征点。在典型数据集上与AS、CSL、DenseVLAD、NetVLAD等主流视觉定位方法的对比结果表明,该方法能够改善光照与季节变化场景下对候选帧的检索效率,提升位姿估计精度和候选帧检索速度。 展开更多
关键词 视觉定位 分层特征网络 动态遍历 预聚类 位姿估计
在线阅读 下载PDF
自适应注意力选择与脉冲耦合神经网络相融合的沙漠车辆识别 被引量:2
13
作者 张津剑 顾晓东 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第1期56-64,共9页
针对现有车辆识别模型不适用于沙漠背景的不足,提出一种基于自适应四元数注意力选择模型与脉冲耦合神经网络相融合的车辆识别算法.首先建立自适应四元数注意力选择模型,将图像背景、颜色、亮度等多方面信息并行处理计算注意力显著图,并... 针对现有车辆识别模型不适用于沙漠背景的不足,提出一种基于自适应四元数注意力选择模型与脉冲耦合神经网络相融合的车辆识别算法.首先建立自适应四元数注意力选择模型,将图像背景、颜色、亮度等多方面信息并行处理计算注意力显著图,并利用图像缩放与双线性插值提升计算效率;然后将显著图输入脉冲耦合神经网络,利用神经元脉冲传播特性提取感兴趣区域;最后提取区域尺度不变特征并结合多层分类回归树完成目标识别.实验结果表明,该算法计算时间短、区域提取完整、识别虚警率低;以分辨率0.6m×0.6m的沙漠图像为例,文中算法较形态学及支撑向量机算法识别率分别提升了5.8%和15.4%. 展开更多
关键词 自适应注意力选择 脉冲耦合神经网络 沙漠车辆识别 尺度不变特征 多层分类回归树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部