期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于同源的同类事物连通本性的模式分类神经网络模型 被引量:6
1
作者 杨国为 王守觉 +1 位作者 卫成兵 曹文谊 《电子学报》 EI CAS CSCD 北大核心 2013年第1期52-55,共4页
根据同源的同类事物连通的本质特性,本文提出保同类事物正确连通通路的模式分类神经网络模型.该模型包括同源的同类事物样本连通连网排序技术、改进的前向掩蔽神经网络模型拓扑结构的连接权值排序学习算法和改进的增量学习算法.本模型... 根据同源的同类事物连通的本质特性,本文提出保同类事物正确连通通路的模式分类神经网络模型.该模型包括同源的同类事物样本连通连网排序技术、改进的前向掩蔽神经网络模型拓扑结构的连接权值排序学习算法和改进的增量学习算法.本模型解决了原来排序学习前向掩蔽神经网络模型和许多传统的模式识别方法存在的共同隐患——把同源的同类事物的个别局部连通通路割断,提高了分类能力.而且,该模型还能对新增样本进行快速增量学习,从而能够在较短的时间内提高该网络模型的分类推广能力,能够在大规模模式识别场合发挥其优势.实验结果表明基于同类事物连通本性的模式识别模型的正确识别率高.本文最大意义在于,用本文思想方法可以改进一些传统的模式识别方法. 展开更多
关键词 模式识别 模式分类 神经网络 模型 算法
在线阅读 下载PDF
基于迹变换和旋转增量调制特征的模糊人脸识别 被引量:9
2
作者 汪宇玲 陈立 +4 位作者 黎明 钟国韵 何月顺 常玉祥 宋伟宁 《电子学报》 EI CAS CSCD 北大核心 2021年第12期2437-2448,共12页
为提高各种不同特殊场景下的模糊人脸识别精确性和鲁棒性,本文提出一种基于迹变换和旋转增量调制编码的特征提取方法.该方法将通信语音编码技术与图像变换技术相结合,首先通过迹线旋转扫描整幅图像,并对迹线上的采样信息进行增量调制编... 为提高各种不同特殊场景下的模糊人脸识别精确性和鲁棒性,本文提出一种基于迹变换和旋转增量调制编码的特征提取方法.该方法将通信语音编码技术与图像变换技术相结合,首先通过迹线旋转扫描整幅图像,并对迹线上的采样信息进行增量调制编码,从而获得多角度的全局有序结构特征,然后用支持向量机对样本图像的这些特征进行训练以分类并识别图像.实验结果表明,在各种不同模糊级的低质量人脸数据库上,本文方法对不同光照变化、不同拍摄角度、不同遮挡等不同场景的人脸图像均能取得较好的识别效果,与一些传统方法相比识别性能大幅提升,相对于VGGNet和Sphereface两种先进方法在三组不同模糊度测试图像集的平均识别率分别提高2.18%和2.20%,具有更高的识别精度和更好的鲁棒性. 展开更多
关键词 模糊人脸识别 特征提取 迹变换 旋转增量调制
在线阅读 下载PDF
少量交互的多视角图像目标分割算法 被引量:4
3
作者 缪君 储珺 张桂梅 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期115-123,共9页
目前,单一图像在人工交互的条件下已能实现准确分割,但如果图像数量大,则需要大量劳动量.而自动分割难以在多图像间构建统一的目标模型.为此,提出一种多视角图像的少量交互分割算法,即仅对其中一幅进行交互,对其他图像进行前景目标一致... 目前,单一图像在人工交互的条件下已能实现准确分割,但如果图像数量大,则需要大量劳动量.而自动分割难以在多图像间构建统一的目标模型.为此,提出一种多视角图像的少量交互分割算法,即仅对其中一幅进行交互,对其他图像进行前景目标一致的自动分割.首先通过构建特征点轨迹图模型,建立其他图像特征点与交互图像特征点之间的连接;然后利用最短路径算法进行特征点的前景/背景分类,获得多图像间的局部对应;最后将已分类特征点作为形状先验,使用测地星凸分割算法实现多视角图像的一致分割.命中率和误报率的比较实验结果表明,文中的算法具有较好的一致分割能力,而且这种局部对应的方式还可以实现多目标的分割. 展开更多
关键词 多视角图像 目标分割 交互 特征点
在线阅读 下载PDF
基于引导滤波和NSST的工业CT图像边缘检测 被引量:3
4
作者 孟天亮 吴一全 吴诗婳 《应用科学学报》 CAS CSCD 北大核心 2016年第4期405-416,共12页
针对传统边缘检测算法不能准确检测有噪工业CT图像边缘的问题,提出一种鲁棒性好、能有效保持细小边缘的边缘检测算法.用引导滤波取代高斯滤波作为边缘检测的预处理,避免Canny算法对边缘的损坏,得到初步检测结果.在此基础上采用非下采样S... 针对传统边缘检测算法不能准确检测有噪工业CT图像边缘的问题,提出一种鲁棒性好、能有效保持细小边缘的边缘检测算法.用引导滤波取代高斯滤波作为边缘检测的预处理,避免Canny算法对边缘的损坏,得到初步检测结果.在此基础上采用非下采样Shearlet变换分解图像,提取包含图像边缘细节信息的各尺度不同方向的高频系数.对每个方向的系数进行模极大值检测,并结合不同分解程度下边缘像素处的系数关系进一步调整模极大值,低频置零并通过反变换得到高频边缘检测结果.将初步检测结果与高频检测结果进行融合,经数学形态学处理得到最终边缘检测图像.实验对比了Canny算子以及近年来提出的同类边缘检测算法的结果,所提算法表现出更好的边缘保持特性,检测的完整性和准确性更高,品质因数比实验中的其他算法平均高出12%,边缘检测效果优越,为工业CT无损检测系统提供了更好的边缘检测方案. 展开更多
关键词 工业CT图像 边缘检测 非下采样Shearlet变换 引导滤波
在线阅读 下载PDF
一种改进的变分水平集的图像分割算法 被引量:4
5
作者 张桂梅 周飞飞 储珺 《图学学报》 CSCD 北大核心 2015年第5期740-746,共7页
为了解决灰度不均匀现象对医学图像的干扰问题,提出了基于局部极性信息的活动轮廓模型。通过引入局部图像信息,该模型能有效地分割灰度不均匀图像。在规则化项中增加的能量惩罚项,使得水平集函数在演化过程中保持为近似的符号距离函数... 为了解决灰度不均匀现象对医学图像的干扰问题,提出了基于局部极性信息的活动轮廓模型。通过引入局部图像信息,该模型能有效地分割灰度不均匀图像。在规则化项中增加的能量惩罚项,使得水平集函数在演化过程中保持为近似的符号距离函数。该算法将图像分割问题归结为曲线能量泛函的最小化,首先建立包含局部灰度信息(极性信息)和改进的符号距离函数的曲线演化能量泛函;然后采用变分水平集方法求解能量函数的最小值,得到最终的分割结果。真实医学图像和人工合成图像的实验结果表明,此方法对灰度不均匀的医学图像有较高的分割精确度,在图像分割速度上有较大提高。由于利用了局部灰度信息,可以有效地分割灰度不均匀的医学图像,而改进后的变分水平集可以完全避免重新初始化,使得图像分割效率大大提高了。 展开更多
关键词 变分水平集 图像分割 符号距离函数 极性信息
在线阅读 下载PDF
分解的二维非对称Tsallis交叉熵图像阈值选取 被引量:3
6
作者 吴诗婳 吴一全 周建江 《图学学报》 CSCD 北大核心 2015年第5期763-770,共8页
现有的Tsallis交叉熵能够度量图像分割前后的差异,但公式复杂,计算效率不高,据此,提出了基于分解的二维非对称Tsallis交叉熵图像阈值选取方法。首先给出了非对称Tsallis交叉熵的定义,提出了一维非对称Tsallis交叉熵阈值选取方法;然后,... 现有的Tsallis交叉熵能够度量图像分割前后的差异,但公式复杂,计算效率不高,据此,提出了基于分解的二维非对称Tsallis交叉熵图像阈值选取方法。首先给出了非对称Tsallis交叉熵的定义,提出了一维非对称Tsallis交叉熵阈值选取方法;然后,将其拓展到二维,推导出相应的阈值选取公式;最后,在此基础上提出了二维非对称Tsallis交叉熵阈值选取的分解算法,使求解二维非对称Tsallis交叉熵阈值法的运算转化到两个一维空间上,将计算复杂度从O(L4)降低为O(L)。大量实验结果表明,与基于混沌粒子群优化的二维Tsallis灰度熵法、二维斜分对称交叉熵法,二维斜分对称Tsallis交叉熵法等方法相比,该方法分割性能优,运行时间短,可望满足实际应用系统对分割的实时要求。 展开更多
关键词 图像分割 阈值选取 非对称Tsallis交叉熵 二维直方图 分解
在线阅读 下载PDF
圆迹变换及图像纹理分析 被引量:3
7
作者 汪宇玲 黎明 《电子学报》 EI CAS CSCD 北大核心 2018年第10期2351-2358,共8页
针对迹变换提取的特征对于含圆弧形纹理图像描述欠佳的问题,提出了圆迹变换及其纹理特征提取方法.圆迹变换使用圆迹线来跟踪图像,并将圆迹线上的泛函结果映射到由半径、长度和角度三个参数生成的空间上,对该结果继续做泛函积分,能得到... 针对迹变换提取的特征对于含圆弧形纹理图像描述欠佳的问题,提出了圆迹变换及其纹理特征提取方法.圆迹变换使用圆迹线来跟踪图像,并将圆迹线上的泛函结果映射到由半径、长度和角度三个参数生成的空间上,对该结果继续做泛函积分,能得到图像四重圆迹空间特征.在圆迹线上使用不同的泛函能得到不同的圆迹变换结果,不同的泛函组合能获得不同的圆迹变换特征,能表示图像不同的纹理性质和更深层次的图像信息,产生多维的圆迹变换纹理特征信息.在Coil-20对象图库及Brodatz纹理库上对含圆弧形图像的分类实验表明,在训练样本较少的情况下,利用圆迹变换提取的纹理特征,其识别能力比迹变换都有明显提升,对于包含圆形、弧线形纹理的图像具备了更好的分辨能力. 展开更多
关键词 图像识别 纹理分析 特征提取 圆迹变换 迹变换
在线阅读 下载PDF
面向遥感图像检索的级联池化自注意力研究 被引量:6
8
作者 吴刚 葛芸 +1 位作者 储珺 叶发茂 《光电工程》 CAS CSCD 北大核心 2022年第12期53-65,共13页
高分辨率遥感图像检索中,由于图像内容复杂,细节信息丰富,以致通过卷积神经网络提取的特征难以有效表达图像的显著信息。针对该问题,提出一种基于级联池化的自注意力模块,用来提高卷积神经网络的特征表达。首先,设计了级联池化自注意力... 高分辨率遥感图像检索中,由于图像内容复杂,细节信息丰富,以致通过卷积神经网络提取的特征难以有效表达图像的显著信息。针对该问题,提出一种基于级联池化的自注意力模块,用来提高卷积神经网络的特征表达。首先,设计了级联池化自注意力模块,自注意力在建立语义依赖关系的基础上,可以学习图像关键的显著特征,级联池化是在小区域最大池化的基础上再进行均值池化,将其用于自注意力模块,能够在关注图像显著信息的同时保留图像重要的细节信息,进而增强特征的判别能力。然后,将级联池化自注意力模块嵌入到卷积神经网络中,进行特征的优化和提取。最后,为了进一步提高检索效率,采用监督核哈希对提取的特征进行降维,并将得到的低维哈希码用于遥感图像检索。在UC Merced、AID和NWPU-RESISC45数据集上的实验结果表明,本文方法能够有效提高检索性能。 展开更多
关键词 遥感图像检索 级联池化 自注意力模块 监督核哈希 卷积神经网络
在线阅读 下载PDF
基于光流与Delaunay三角网格的图像序列运动遮挡检测 被引量:3
9
作者 张聪炫 陈震 +2 位作者 汪明润 黎明 江少锋 《电子学报》 EI CAS CSCD 北大核心 2018年第2期479-485,共7页
针对图像序列运动遮挡检测的准确性与鲁棒性问题,提出一种基于光流与Delaunay三角网格的图像序列运动遮挡检测方法.首先构造基于非局部约束的TV-L1光流估计模型;然后根据图像Delaunay三角网格划分与光流估计结果对图像序列帧间对应像素... 针对图像序列运动遮挡检测的准确性与鲁棒性问题,提出一种基于光流与Delaunay三角网格的图像序列运动遮挡检测方法.首先构造基于非局部约束的TV-L1光流估计模型;然后根据图像Delaunay三角网格划分与光流估计结果对图像序列帧间对应像素点和局部三角形进行运动遮挡判断并检测遮挡区域;最后采用MPI Sintel和Middlebury数据库提供的测试图像集对本文方法与SMOD、GOSF等代表性方法进行对比测试.实验结果表明,本文方法相对于SMOD和GOSF方法在十组测试图像集的平均漏检率和误检率分别降低15.21%与30.57%,说明本文方法针对非刚性运动、复杂场景、弱纹理、光照阴影以及大位移等类型图像序列均具有较高的检测精度和较好的鲁棒性. 展开更多
关键词 图像序列 遮挡检测 光流 Delaunay三角网格
在线阅读 下载PDF
基于多分辨率Trace变换的纹理图像分类 被引量:5
10
作者 黎明 邢冬冬 汪宇玲 《电子学报》 EI CAS CSCD 北大核心 2019年第4期962-969,共8页
针对Trace变换提取的图像特征缺乏对纹理边缘信息描述和计算代价高的问题,利用小波变换对图像轮廓的表征优势,提出了多分辨率Trace变换并应用于纹理图像分类.首先,将小波变换引入到Trace变换中,对纹理图像进行非下采样小波变换,得到不... 针对Trace变换提取的图像特征缺乏对纹理边缘信息描述和计算代价高的问题,利用小波变换对图像轮廓的表征优势,提出了多分辨率Trace变换并应用于纹理图像分类.首先,将小波变换引入到Trace变换中,对纹理图像进行非下采样小波变换,得到不同频率的低频特征子图及高频边缘子图;其次,在各级子图上进行一组泛函的Trace变换,获取纹理图像的融合特征,在获得图像边缘信息的同时避免了Trace变换不同泛函组合计算代价过高的问题;最后,把融合特征送入支持向量机对图像进行分类.实验结果表明,对图像采用多分辨率Trace变换提取的融合特征具有更好的纹理描述能力,相对于传统Trace变换及MCM等对比方法具有更高的鉴别性能,且在时间效率上相对于传统Trace变换有大幅提升. 展开更多
关键词 纹理分类 Trace变换 非下采样小波变换 多分辨率
在线阅读 下载PDF
均值张量成分分析及其在步态识别中的应用 被引量:1
11
作者 贲晛烨 张鹏 +1 位作者 孙成立 孟维晓 《西安交通大学学报》 EI CAS CSCD 北大核心 2015年第12期40-46,共7页
针对步态识别中非负样本数据存在冗余,且未经中心化的多线性主成分分析保持聚类结构的特征向量不能对应最大特征值,导致识别效果下降的问题,提出一种保持原始张量数据均方长度的均值张量成分分析算法。该算法首先对原始样本任一模式下... 针对步态识别中非负样本数据存在冗余,且未经中心化的多线性主成分分析保持聚类结构的特征向量不能对应最大特征值,导致识别效果下降的问题,提出一种保持原始张量数据均方长度的均值张量成分分析算法。该算法首先对原始样本任一模式下内积矩阵进行谱分解,计算该模式下相应的特征值和特征向量;其次,利用获得的特征值和特征向量计算均值向量,并对均值向量值进行降序排列,使较大均值向量值对应的特征向量构成该模式下的低维子空间;最后,将原始样本投影到该低维子空间,形成特征张量。与多线性主成分分析算法相比,该算法不需要对数据去中心化处理,而是保持非负数据均值向量最大均方欧几里德距离和方向。通过在USF步态数据库和TUM GAID步态数据库进行仿真实验,结果表明,经过均值张量成分分析预处理,在2个步态库上的平均识别率分别高达57%和75%,较其他传统方法的识别率有明显提高。 展开更多
关键词 步态识别 均值张量成分分析 均方长度 均值向量
在线阅读 下载PDF
基于分数阶微分的TV-L^1光流模型的图像配准方法研究 被引量:9
12
作者 张桂梅 孙晓旭 +1 位作者 刘建新 储珺 《自动化学报》 EI CSCD 北大核心 2017年第12期2213-2224,共12页
图像的非刚性配准在计算机视觉和医学图像分析中有着重要的作用.TV-L^1(全变分L^1范数、Total variation-L^1)光流模型是解决非刚性配准问题的有效方法,但TV-L^1光流模型的正则项是一阶导数,会导致纹理特征等具有弱导数性质的信息模糊.... 图像的非刚性配准在计算机视觉和医学图像分析中有着重要的作用.TV-L^1(全变分L^1范数、Total variation-L^1)光流模型是解决非刚性配准问题的有效方法,但TV-L^1光流模型的正则项是一阶导数,会导致纹理特征等具有弱导数性质的信息模糊.针对该问题,将G-L(Grünwald-Letnikov)分数阶引入TV-L^1光流模型,提出基于G-L分数阶微分的TV-L^1光流模型,并应用原始–对偶算法求解该模型.新的模型用G-L分数阶微分代替正则项中的一阶导数,由于分数阶微分比整数阶微分具有更好的细节描述能力,并能有效地、非线性地保留具有弱导数性质的纹理特征,从而提高图像的配准精度.另外,通过实验给出了配准精度与G-L分数阶模板参数之间的关系,从而为模板最佳参数的选取提供了依据.尽管不同类型的图像其最佳参数是不同的,但是其最佳配准阶次一般在1~2之间.理论分析和实验结果均表明,提出的新模型能够有效地提高图像配准的精度,适合于包含较多弱纹理和弱边缘信息的医学图像配准,该模型是TV-L^1光流模型的重要延伸和推广. 展开更多
关键词 分数阶微分 Grünwald-Letnikov TV-L^1模型 光流场 弱纹理 非刚性配准
在线阅读 下载PDF
基于YOLOv3与分水岭的直升机桨叶欠曝光图像圆形标记点检测 被引量:5
13
作者 张育斌 熊邦书 +2 位作者 欧巧凤 黄建萍 陈垚锋 《应用科学学报》 CAS CSCD 北大核心 2020年第6期906-915,共10页
针对现有的直升机桨叶欠曝光图像中圆形标记点检测方法存在自适应能力不强、速度慢、精度不高的问题,提出了基于YOLOv3(you only look once)与分水岭的直升机桨叶欠曝光图像圆形标记点检测方法.首先,将采集的真实桨叶欠曝光图像中的圆... 针对现有的直升机桨叶欠曝光图像中圆形标记点检测方法存在自适应能力不强、速度慢、精度不高的问题,提出了基于YOLOv3(you only look once)与分水岭的直升机桨叶欠曝光图像圆形标记点检测方法.首先,将采集的真实桨叶欠曝光图像中的圆形标记点进行标注后,制作成数据集,并训练YOLOv3网络;其次,用训练好的YOLOv3网络检测出圆形标记点区域;再次,改进传统分水岭标记提取方式,采用多线程技术并行在各圆形标记点区域内进行分水岭变换,得到圆形标记点边缘检测结果;最后,采用最小二乘圆拟合和奇异点去除法实现圆形标记点的精确定位.研究者通过对多幅欠曝光桨叶图像中圆形标记点进行检测实验,验证了该方法具有自适应能力强、速度快、精度高的优点,并已将其用于直升机桨叶欠曝光图像圆形标记点的检测. 展开更多
关键词 欠曝光图像 圆形标记点检测 YOLOv3 分水岭变换
在线阅读 下载PDF
基于注意力和多尺度特征交互的遥感图像目标检测 被引量:1
14
作者 范永强 葛芸 胡送惠 《激光杂志》 CAS 北大核心 2023年第10期37-43,共7页
遥感图像目标检测存在目标尺寸变化大、小目标排列密集、背景信息复杂等问题,针对这些问题,提出了端到端的遥感图像目标检测网络AMFI-RetinaNet(Attention and Multi-scale Feature Interactive-RetinaNet)来提高特征的判别能力。首先,... 遥感图像目标检测存在目标尺寸变化大、小目标排列密集、背景信息复杂等问题,针对这些问题,提出了端到端的遥感图像目标检测网络AMFI-RetinaNet(Attention and Multi-scale Feature Interactive-RetinaNet)来提高特征的判别能力。首先,提出了卷积注意力来增强特征的空间信息,并结合通道注意力来增强特征的通道信息,该注意力模块位于特征提取网络的低层,能有效突出关键的细节特征,并提高网络对小目标的检测能力。此外,还提出了多尺度特征交互模板,通过相邻两层特征的交互,使低层特征信息流向高层,在特征金字塔结构后引入该模块,进一步提高了网络对多尺度目标的检测性能。在RSOD数据集和NWPU VHR-10数据集上进行实验,该方法比原RetinaNet网络的平均检测精度分别提升了2%和1.1%,实验结果表明提出的AMFI-RetinaNet网络可以更精确地对遥感图像目标进行检测和定位。 展开更多
关键词 遥感图像目标检测 卷积注意力 通道注意力 多尺度特征交互
在线阅读 下载PDF
一种改进的非局部均值图像去噪算法 被引量:28
15
作者 祝严刚 张桂梅 《计算机工程与应用》 CSCD 北大核心 2017年第18期192-198,共7页
非局部均值滤波算法(Non-Local Means,NLM)有良好的去噪效果,且能保持图像细节。但其复杂度过高引起效率低下,在噪声增大时去噪精度明显下降。快速非局部均值滤波(Fast Non-Local Means,FNLM)虽然提高了算法的效率,但去噪效果没有明显改... 非局部均值滤波算法(Non-Local Means,NLM)有良好的去噪效果,且能保持图像细节。但其复杂度过高引起效率低下,在噪声增大时去噪精度明显下降。快速非局部均值滤波(Fast Non-Local Means,FNLM)虽然提高了算法的效率,但去噪效果没有明显改善,在噪声增大时去噪效果仍不理想。针对该问题,提出一种新的非局部均值滤波算法,算法将Turky型函数与指数型相结合,提出一种新的指数-Turky型权值核函数,替代原NLM算法和FNLM算法中的指数型核函数,同时综合了结构相似性(Structural Similarity,SSIM)和欧氏距离来衡量图像邻域间的相似性,从而使得权值的选取更加合理,有效排除图像中不相似邻域的干扰,提高了算法的去噪性能。通过对添加不同噪声水平的高斯噪声图像进行实验,结果表明提出的算法在去噪性能上与NLM和FNLM相比有较大提高,尤其对于噪声较大的图像效果更为显著,在去噪效率上与NLM相比有明显提高,与FNLM算法的时间复杂度相当,时耗接近略有降低。 展开更多
关键词 图像去噪 非局部均值滤波 积分图 Turky函数 结构相似性
在线阅读 下载PDF
改进的卷积神经网络单幅图像超分辨率重建 被引量:12
16
作者 曾接贤 倪申龙 《计算机工程与应用》 CSCD 北大核心 2019年第13期1-7,共7页
针对经典的基于卷积神经网络的单幅图像超分辨率重建方法网络较浅、提取的特征少、重建图像模糊等问题,提出了一种改进的卷积神经网络的单幅图像超分辨率重建方法,设计了由密集残差网络和反卷积网络组成的新型深度卷积神经网络结构。原... 针对经典的基于卷积神经网络的单幅图像超分辨率重建方法网络较浅、提取的特征少、重建图像模糊等问题,提出了一种改进的卷积神经网络的单幅图像超分辨率重建方法,设计了由密集残差网络和反卷积网络组成的新型深度卷积神经网络结构。原始低分辨率图像输入网络,利用密集残差学习网络获取更丰富的有效特征并加快特征梯度流动,其次通过反卷积层将图像特征上采样到目标图像大小,再利用密集残差学习高维特征,最后融合不同卷积核提取的特征得到最终的重建图像。在Set5和Set14数据集上进行了实验,并和Bicubic、K-SVD、SelfEx、SRCNN等经典重建方法进行了对比,重建出的图像在整体清晰度和边缘锐度方面更好,另外峰值信噪比(PSNR)平均分别提高了2.69dB、1.68dB、0.74dB和0.61dB。实验结果表明,该方法能够获取更丰富的细节信息,得到更好的视觉效果,达到了图像超分辨率的增强任务。 展开更多
关键词 图像超分辨率重建 深度学习 卷积神经网络 密集残差学习 反卷积
在线阅读 下载PDF
基于多尺度聚焦网络的单图像城市场景3D平面重建 被引量:3
17
作者 江瑞祥 缪君 +1 位作者 储珺 葛芸 《小型微型计算机系统》 CSCD 北大核心 2022年第8期1718-1724,共7页
针对基于单图像城市场景中不规则平面3D重建的难题,本文提出了一种基于多尺度聚焦网络的场景3D平面重建算法.该算法以单幅RGB图像为输入,通过单网络、双任务的学习策略,同时输出平面的分割映射以及深度信息.为了根据上下文来自适应的更... 针对基于单图像城市场景中不规则平面3D重建的难题,本文提出了一种基于多尺度聚焦网络的场景3D平面重建算法.该算法以单幅RGB图像为输入,通过单网络、双任务的学习策略,同时输出平面的分割映射以及深度信息.为了根据上下文来自适应的更改有效感受野大小以获取多尺度信息,本文还提出了一种将条状注意力机制嵌入到空洞空间金字塔池化模块的多尺度聚焦模块,使之能够关注城市场景中的条状平面.本文网络模型在SYNTHIA城市场景数据集上进行了训练,在测试集中取得了81.5%SC和4.22%Abs Rel的表现.本文算法相对于现有算法更可靠、重建模型更完整. 展开更多
关键词 平面重建 单幅图像 城市场景 多尺度聚焦模块 条状注意力机制
在线阅读 下载PDF
基于改进k均值与高斯混合模型的宫颈图像分割 被引量:2
18
作者 刘君 余婷婷 石慧娟 《中国生物医学工程学报》 CAS CSCD 北大核心 2018年第2期138-145,共8页
针对宫颈癌智能化筛查系统需要从阴道镜图像中分割出宫颈区域的问题,提出一种改进的k均值与高斯混合模型相结合的图像分割方法。首先根据宫颈区域的代表性颜色和其距离图像中心点的距离,构造出待分类的数据集;其次通过对宫颈区域代表性... 针对宫颈癌智能化筛查系统需要从阴道镜图像中分割出宫颈区域的问题,提出一种改进的k均值与高斯混合模型相结合的图像分割方法。首先根据宫颈区域的代表性颜色和其距离图像中心点的距离,构造出待分类的数据集;其次通过对宫颈区域代表性颜色的重新计算,一种使待分类数据集可随着迭代的进行而动态调整的规则被加入到k均值算法中,使得k均值算法适用于多种光照环境下的目标图像分割;最后利用k均值的聚类结果,初始化高斯混合模型的参数,并得到最终的分割结果。75套来源于不同成像条件下的宫颈图像上的实验结果显示,该方法的平均分割精度达到65.1%,比采用基本k均值算法进行初始化的高斯混合模型算法高出5.5%,比模糊C均值聚类算法高出5.8%,比基本高斯混合模型算法高出8.5%;其均方差达到11.5%,与水平集算法相比降低5.6%。实验结果证明,该方法在阴道镜视野下的宫颈区域分割中是行之有效的。 展开更多
关键词 宫颈癌筛查 宫颈图像分割 K均值算法 高斯混合模型
在线阅读 下载PDF
文本属性激活视觉的广义零样本图像识别
19
作者 闫文尚 张桂梅 《计算机工程与应用》 2025年第21期265-275,共11页
现有的零样本学习方法存在语义信息与视觉特征无法有效对齐,且视觉特征中存在较多冗余信息,导致零样本和广义零样本图像识别精度不佳。针对该问题,提出文本属性激活视觉的广义零样本图像识别方法。借助大语言模型生成判别性语义信息-文... 现有的零样本学习方法存在语义信息与视觉特征无法有效对齐,且视觉特征中存在较多冗余信息,导致零样本和广义零样本图像识别精度不佳。针对该问题,提出文本属性激活视觉的广义零样本图像识别方法。借助大语言模型生成判别性语义信息-文本属性。并引入类先验估计模块,计算每个文本属性的先验权重,以增强文本属性的可解释性,优化模型的性能。利用判别性文本属性激活与其对应的视觉特征,有效去除视觉特征中的冗余信息。在先验权重的引导下,将激活的视觉特征与文本属性进行跨模态对齐,以实现更精准高效的视觉语义交互,提高模型的图像识别精度。在三个基准数据集(AWA2、CUB、SUN)上进行自监督广义零样本图像识别实验,在AWA2和SUN数据集上调和平均值均达到最优,分别比次优值提高了1.1和0.8个百分点,在CUB数据集中取得次优,实验结果证明了提出方法的有效性。 展开更多
关键词 文本属性 先验权重 视觉激活 跨模态对齐
在线阅读 下载PDF
联合深度超参数卷积和交叉关联注意力的大位移光流估计
20
作者 王梓歌 葛利跃 +3 位作者 陈震 张聪炫 王子旭 舒铭奕 《自动化学报》 EI CAS CSCD 北大核心 2024年第8期1631-1645,共15页
针对现有深度学习光流估计模型在大位移场景下的准确性和鲁棒性问题,提出了一种联合深度超参数卷积和交叉关联注意力的图像序列光流估计方法.首先,通过联合深层卷积和标准卷积构建深度超参数卷积以替代普通卷积,提取更多特征并加快光流... 针对现有深度学习光流估计模型在大位移场景下的准确性和鲁棒性问题,提出了一种联合深度超参数卷积和交叉关联注意力的图像序列光流估计方法.首先,通过联合深层卷积和标准卷积构建深度超参数卷积以替代普通卷积,提取更多特征并加快光流估计网络训练的收敛速度,在不增加网络推理量的前提下提高光流估计的准确性;然后,设计基于交叉关联注意力的特征提取编码网络,通过叠加注意力层数获得更大的感受野,以提取多尺度长距离上下文特征信息,增强大位移场景下光流估计的鲁棒性;最后,采用金字塔残差迭代模型构建联合深度超参数卷积和交叉关联注意力的光流估计网络,提升光流估计的整体性能.分别采用MPI-Sintel和KITTI测试图像集对本文方法和现有代表性光流估计方法进行综合对比分析,实验结果表明本文方法取得了较好的光流估计性能,尤其在大位移场景下具有更好的估计准确性与鲁棒性. 展开更多
关键词 光流 大位移 交叉关联注意力 深度超参数卷积 深度学习
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部