期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
基于改进YOLOv5的半监督车辆检测算法 被引量:1
1
作者 高睿 安国成 +1 位作者 邹丹平 裴凌 《计算机工程》 北大核心 2025年第3期300-309,共10页
目前,交通场景中的车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题,且对大规模数据进行完全标注需要较高的成本。针对以上情况,提出一种基于改进YOLOv5的半监督车辆检测算法。引入SimOTA样本匹配方法,优化次优匹配现象,改善目标... 目前,交通场景中的车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题,且对大规模数据进行完全标注需要较高的成本。针对以上情况,提出一种基于改进YOLOv5的半监督车辆检测算法。引入SimOTA样本匹配方法,优化次优匹配现象,改善目标尺度形状变化导致的检测困难;提出一种新的空间金字塔池化网络SPPFA,通过引入LSKA,在增大感受野的同时实现空间和通道的自适应性,缓解大尺度目标和遮挡问题产生的影响;将CIoU替换为SIoU,优化回归损失函数。在此基础上,提出一种改进的半监督深度学习算法,通过优化损失函数设计,增强算法学习未标注样本中有益信息的能力,有效提高模型对车辆的检测精度。实验结果表明,改进后的算法在自制车辆数据集上mAP@0.5指标达到了58.2%,相较YOLOv5n基线模型提升了11.1百分点,且模型体积远小于主流目标检测算法,具有良好的工程应用前景。 展开更多
关键词 YOLOv5 车辆检测 样本匹配 空间金字塔池化 半监督学习
在线阅读 下载PDF
基于SPM-IBOVW模型的自然场景识别 被引量:2
2
作者 章海兵 刘士荣 +1 位作者 张波涛 王坚 《上海交通大学学报》 EI CAS CSCD 北大核心 2016年第6期902-909,共8页
提出一种基于空间金字塔匹配的集成化视觉词典(SPM-IBOVW)模型的自然场景识别方法.对各个类别的特征集合分别聚类形成各类别视觉词包,并连接成为集成化视觉词包(IVV);采用一种新的5层空间金字塔划分方法,相比经典划分方法在降低算法复... 提出一种基于空间金字塔匹配的集成化视觉词典(SPM-IBOVW)模型的自然场景识别方法.对各个类别的特征集合分别聚类形成各类别视觉词包,并连接成为集成化视觉词包(IVV);采用一种新的5层空间金字塔划分方法,相比经典划分方法在降低算法复杂度的同时,提高了场景识别率,并通过15类通用复杂场景的识别实验验证其有效性.结果表明,所提出的方法对复杂场景的识别率达到83.17%. 展开更多
关键词 视觉单词 空间金字塔匹配 集成化视觉词包模型 集成化视觉词典 场景识别
在线阅读 下载PDF
基于LLC与加权SPM的车辆品牌型号识别 被引量:2
3
作者 李熙莹 袁敏贤 +1 位作者 吕硕 江倩殷 《计算机工程》 CAS CSCD 北大核心 2017年第5期210-216,共7页
针对传统车辆识别算法鲁棒性及实时性不强的问题,结合局部线性约束编码(LLC)和加权空间金字塔匹配(SPM)模型,提出一种车辆品牌型号精细识别算法。提取图像方向梯度直方图特征,通过LLC对图像特征进行编码映射,得到具有语义信息的图像表... 针对传统车辆识别算法鲁棒性及实时性不强的问题,结合局部线性约束编码(LLC)和加权空间金字塔匹配(SPM)模型,提出一种车辆品牌型号精细识别算法。提取图像方向梯度直方图特征,通过LLC对图像特征进行编码映射,得到具有语义信息的图像表达向量,以提高识别的准确率。利用加权SPM模型将空间位置信息引入图像表达向量中,并将每个图像的最终表达送入线性支持向量机分类器进行训练与识别。使用交通监控摄像头在不同天气和光照条件下采集150种车辆类型共56 827张图像进行实验,结果表明,该算法可有效改善识别效果,提高识别速度。 展开更多
关键词 车辆品牌型号识别 方向梯度直方图 局部约束线性编码 加权空间金字塔匹配 支持向量机
在线阅读 下载PDF
基于多策略改进蜣螂算法的三维无人机路径规划
4
作者 王紫益 王雷 +2 位作者 徐浩然 张桐彬 夏强强 《南京航空航天大学学报(自然科学版)》 北大核心 2025年第3期475-486,共12页
针对传统的蜣螂算法在三维无人机(Unmanned aerial vehicle, UAV)路径规划中存在求解精度低、收敛速度慢及容易陷入局部最优等问题,提出了一种基于多策略改进的蜣螂算法(Multi-strategy improved dung beetle optimizer, MSIDBO)。该算... 针对传统的蜣螂算法在三维无人机(Unmanned aerial vehicle, UAV)路径规划中存在求解精度低、收敛速度慢及容易陷入局部最优等问题,提出了一种基于多策略改进的蜣螂算法(Multi-strategy improved dung beetle optimizer, MSIDBO)。该算法首先采用空间金字塔匹配(Spatial pyramid matching,SPM)混沌映射与反向学习策略进行种群初始化,以提高初始种群的多样性和质量。其次,引入改进后的边界收敛因子,以实现算法全局探索与局部搜索能力的平衡。然后,融合海鸥优化算法的攻击机制,以提升收敛速度和求解精度。最后,采用t-distribution差分变异策略,以提高算法跳出局部最优解的能力。将改进的蜣螂算法与其他的启发式算法和相关的改进算法进行基准函数测试,MSIDBO算法相较于其他启发式算法和改进算法,在收敛速度与精度方面表现突出;此外,将改进的蜣螂算法应用于三维无人机路径规划仿真,实验仿真结果表明在不同的场景下MSIDBO算法生成的路径代价函数值更小,路径质量更高,平稳性更佳。 展开更多
关键词 蜣螂算法 空间金字塔匹配混沌映射 反向学习 海鸥优化算法 t-distribution差分变异
在线阅读 下载PDF
基于ScSPM-Reranking的高分辨率遥感影像的检索
5
作者 弓永利 朱盼盼 王跃宾 《高技术通讯》 北大核心 2017年第4期335-341,共7页
为了从高分辨率遥感影像中获取详细的地表地物信息,为城市规划、环境监测以及灾情分析提供可靠的数据,进行了高分辨率遥感影像的检索研究,包括对图像的特征提取和图像之间相似度的描述。为了提高图像检索精度,运用了采用稀疏编码(Sc)的... 为了从高分辨率遥感影像中获取详细的地表地物信息,为城市规划、环境监测以及灾情分析提供可靠的数据,进行了高分辨率遥感影像的检索研究,包括对图像的特征提取和图像之间相似度的描述。为了提高图像检索精度,运用了采用稀疏编码(Sc)的空间塔式匹配(Sc SPM)技术和重排序(Reranking)技术,提出了基于Sc SPM结合Reranking(ScSPM-Reranking)的遥感高分辨率影像的检索方法。该方法首先使用Sc SPM提取空间场景的特征,然后结合这些特征使用cityblock距离进行初步检索,最后对初步检索的结果进行Reranking排序,获得高精度的检索结果。同其他检索方法进行了对比实验,实验结果证明,该方法具有较高的检索精度。 展开更多
关键词 高分辨率遥感影像 图像特征描述 图像检索 RERANKING 稀疏编码(Sc) 空间塔式匹配(spm)
在线阅读 下载PDF
基于持续同调的空间金字塔词袋算法
6
作者 易丽莎 彭宁宁 《计算机科学》 北大核心 2025年第11期71-81,共11页
为了解决持续同调从数据中提取的拓扑特征输出形式与机器学习算法的常用输入形式不匹配这一难题,提出了一个新的算法框架——基于持续同调的空间金字塔词袋模型(PHSBoW算法)。该算法将持续同调输出的持续性图(PD图)转换为固定长度的向量... 为了解决持续同调从数据中提取的拓扑特征输出形式与机器学习算法的常用输入形式不匹配这一难题,提出了一个新的算法框架——基于持续同调的空间金字塔词袋模型(PHSBoW算法)。该算法将持续同调输出的持续性图(PD图)转换为固定长度的向量,同时最大限度地保留PD图中所包含的拓扑特征。为提高算法准确率、降低运行时间,在PHSBoW算法的基础上,通过权重优化、聚类模型替代以及词袋模型扩展等改进,进一步发展了PHSsBoW,PHSwBoW,PHSVLAD 3种算法。通过在不同类型和规模的9个数据集上进行实验,将以上4种算法与支持向量机相结合,对数据进行分类。实验结果表明,与传统核函数算法(SWK,PSSK,PWGK)及向量化算法(PBoW,PI,PL)相比,该方法的分类准确率平均提高了3.29个百分点~17.98个百分点,运行时间相较于核函数算法显著降低。这表明,所提出的算法有效解决了持续同调在机器学习中难以结合的问题,同时显著提高了分类准确率和算法运行速度。 展开更多
关键词 持续同调 词袋模型 空间金字塔匹配 机器学习 PD图
在线阅读 下载PDF
基于改进YOLOv8的高速公路服务区车辆违停检测 被引量:7
7
作者 陈伟 王晓龙 +2 位作者 张晏玮 安国成 江波 《计算机工程》 CAS CSCD 北大核心 2024年第4期11-19,共9页
在高速公路服务区违停检测过程中光照、天气变化等复杂环境会使车辆检测精度急剧下降,同时摄像机拍摄角度、车体高度等因素会增加车辆违停检测的误报率和漏报率。为此,提出一种基于改进YOLOv8的高速公路服务区违停检测算法。在YOLOv8网... 在高速公路服务区违停检测过程中光照、天气变化等复杂环境会使车辆检测精度急剧下降,同时摄像机拍摄角度、车体高度等因素会增加车辆违停检测的误报率和漏报率。为此,提出一种基于改进YOLOv8的高速公路服务区违停检测算法。在YOLOv8网络模型的特征金字塔池化层中,构建膨胀空间金字塔池化(DSPP)模块和基于分支注意力机制的膨胀空间金字塔池化(DSPPA)模块,减少特征提取网络中深层语义信息的丢失,同时利用DSPPA中的分支注意力(BA)机制为不同感受野分支特征赋予不同的权重,使模型更关注与目标尺寸相适应的特征。设计基于全局匹配的停车位分配策略,有效降低了视角倾斜、车辆重叠遮挡等情况下违规占用停车位的误报率与漏报率。实验结果表明,改进算法的违停检测误报率从15%下降至8%,违停检测漏报率从7.5%下降至6.1%,具有较好的车辆违停检测效果。 展开更多
关键词 YOLOv8 车辆检测 空间金字塔池化 全局匹配 车辆违停检测
在线阅读 下载PDF
非负局部约束线性编码图像分类算法 被引量:17
8
作者 刘培娜 刘国军 +2 位作者 郭茂祖 刘扬 李盼 《自动化学报》 EI CSCD 北大核心 2015年第7期1235-1243,共9页
基于特征提取的图像分类算法的核心问题是如何对特征进行有效编码.局部约束线性编码(Locality-constrained linear coding,LLC)因其良好的特征重构性与局部平滑稀疏性,已取得了很好的分类性能.然而,LLC编码的分类性能对编码过程中的近邻... 基于特征提取的图像分类算法的核心问题是如何对特征进行有效编码.局部约束线性编码(Locality-constrained linear coding,LLC)因其良好的特征重构性与局部平滑稀疏性,已取得了很好的分类性能.然而,LLC编码的分类性能对编码过程中的近邻数k的大小比较敏感,随着k的增大,编码中的某些负值元素与正值元素的差值绝对值也可能增大,这使得LLC越来越不稳定.本文通过在LLC优化模型的目标方程中引入非负约束,提出了一种新型编码方式,称为非负局部约束线性编码(Non-negative locality-constrained linear coding,NNLLC).该模型一般采取迭代优化算法进行求解,但其计算复杂度较大.因此,本文提出两种近似非负编码算法,其编码速度与LLC一样快速.实验结果表明,在多个广泛使用的图像数据集上,相比于LLC,NNLLC编码方式不仅在分类精确率上提高了近1%~4%,而且对k的选取具有更强的鲁棒性. 展开更多
关键词 局部约束线性编码 非负约束 空间金字塔匹配 图像分类
在线阅读 下载PDF
基于稀疏编码多尺度空间潜在语义分析的图像分类 被引量:27
9
作者 赵仲秋 季海峰 +2 位作者 高隽 胡东辉 吴信东 《计算机学报》 EI CSCD 北大核心 2014年第6期1251-1260,共10页
传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义... 传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义分析获得特征的精确性.为了弥补这些不足,文中提出了一种基于稀疏编码的多尺度空间潜在语义分析的图像分类方法.首先通过空间金字塔方法对图像进行空间多尺度划分,然后利用稀疏编码对每个局部块特征进行软量化以形成共生矩阵,之后结合概率潜在语义分析(PLSA)获得每个局部块的潜在语义信息,再利用权值串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息,最后用支持向量机(SVM)分类器完成图像的场景分类.在常见图像库上的实验表明,本文提出的基于稀疏编码的多尺度空间潜在语义分析方法平均分类精度比现有诸多方法均有明显提高,验证了其有效性和鲁棒性.实验还表明,空间金字塔匹配、稀疏编码共生矩阵以及PLSA降维这3个模块在该文方法中缺一不可,共同提升图像表征和分类性能. 展开更多
关键词 图像分类 稀疏编码 潜在语义分析 空间金字塔
在线阅读 下载PDF
基于LLC与GIST特征的静态人体行为分类 被引量:6
10
作者 王恩德 刘巧英 李勇 《计算机工程》 CAS CSCD 北大核心 2018年第8期268-272,278,共6页
针对静态图像人体行为识别问题,提出一种融合局部约束线性编码(LLC)和全局特征描述子的方法。该方法对图像进行密集采样,提取每个子区域的SIFT特征,利用LLC方法对提取的密集SIFT特征进行编码和池化。为了加入空间信息,采用空间金字塔的... 针对静态图像人体行为识别问题,提出一种融合局部约束线性编码(LLC)和全局特征描述子的方法。该方法对图像进行密集采样,提取每个子区域的SIFT特征,利用LLC方法对提取的密集SIFT特征进行编码和池化。为了加入空间信息,采用空间金字塔的思想,获得具有空间位置信息的LLC池化特征。将LLC池化特征串联通用搜索树(GIST)特征作为图像的最终描述,使用核函数为直方图交叉核函数的支持向量机进行分类。实验结果表明,与利用LLC、空间金字塔匹配特征和GIST特征进行识别的方法相比,该方法识别效果较好。 展开更多
关键词 行为识别 全局特征描述子 局部约束线性编码 空间金字塔匹配 最大池化
在线阅读 下载PDF
基于改进特征袋模型的奶牛识别算法 被引量:13
11
作者 陈娟娟 刘财兴 +1 位作者 高月芳 梁云 《计算机应用》 CSCD 北大核心 2016年第8期2346-2351,共6页
针对特征袋(BOF)模型中存在特征计算耗时、识别精度低的不足,提出一种新的改进BOF模型以提高其目标识别的精度和效率,并将其应用于奶牛个体识别。该算法首先引入优化方向梯度直方图(HOG)特征对图像进行特征提取和描述,然后利用空间金字... 针对特征袋(BOF)模型中存在特征计算耗时、识别精度低的不足,提出一种新的改进BOF模型以提高其目标识别的精度和效率,并将其应用于奶牛个体识别。该算法首先引入优化方向梯度直方图(HOG)特征对图像进行特征提取和描述,然后利用空间金字塔匹配原理(SPM)生成图像基于视觉词典的直方图表示,最后自定义直方图交叉核作为分类器核函数。该算法在项目组自行拍摄的数据集(包含15类奶牛、共7 500张奶牛头部图像)上的实验结果表明,使用基于SPM的BOF模型将算法的识别率平均提高2个百分点;使用直方图交叉核相比使用高斯核将算法的识别率平均提高2.5个百分点;使用优化HOG特征,相比使用传统HOG特征将算法识别率平均提高21.3个百分点,运算效率为其1.68倍;相比使用尺度不变特征变换(SIFT)特征,在保证平均识别精度达95.3%的基础上,运算效率为其7.10倍。分析结果可知,该算法在奶牛个体识别领域具有较好的鲁棒性和实用性。 展开更多
关键词 特征袋模型 图像识别 梯度直方图特征 空间金字塔匹配 尺度不变特征变换特征
在线阅读 下载PDF
基于非负弹性网稀疏编码算法的图像分类方法 被引量:4
12
作者 张勇 张阳阳 +1 位作者 程洪 张艳霞 《计算机工程》 CAS CSCD 北大核心 2017年第7期239-243,249,共6页
为提高图像分类的准确率,提出一种非负弹性网稀疏编码算法。利用非负稀疏编码算法和弹性网模型,在稀疏编码优化模型的目标函数中引入l_2范数正则项,增加编码系数的非负约束,并将该算法与空间金字塔模型相结合应用于图像分类。实验结果表... 为提高图像分类的准确率,提出一种非负弹性网稀疏编码算法。利用非负稀疏编码算法和弹性网模型,在稀疏编码优化模型的目标函数中引入l_2范数正则项,增加编码系数的非负约束,并将该算法与空间金字塔模型相结合应用于图像分类。实验结果表明,与传统的稀疏编码算法相比,该算法不仅能提高编码的判别性与有效性,而且可使相似的特征描述符编码后仍然相似,增强编码的稳定性,具有较高的分类准确度。 展开更多
关键词 图像分类 稀疏编码 空间金字塔匹配 弹性网 字典学习 支持向量机
在线阅读 下载PDF
基于稀疏编码的脑脊液图像快速识别模型 被引量:7
13
作者 黄文明 蔡文正 邓珍荣 《计算机应用》 CSCD 北大核心 2014年第7期2040-2043,2049,共5页
考虑到采用传统的图像分割算法很难准确地分割脑脊液(CSF)细胞图像,提出了一种基于稀疏编码的脑脊液图像快速识别模型。该模型首先利用稀疏编码提取图像中的局部特征以及特征描述子,然后将特征描述子转换成线性空间金字塔匹配(SPM)结构... 考虑到采用传统的图像分割算法很难准确地分割脑脊液(CSF)细胞图像,提出了一种基于稀疏编码的脑脊液图像快速识别模型。该模型首先利用稀疏编码提取图像中的局部特征以及特征描述子,然后将特征描述子转换成线性空间金字塔匹配(SPM)结构,最后将计算结果输入到线性支持向量机(SVM)中进行训练和预测。对脑脊液细胞图像做了异常识别和分类测试,其中异常识别准确率达到了89.4±0.9%,且对每张760×570的图像平均识别时间只需1.3 s,由此可以表明所提出的模型能够有效快速地区分脑脊液细胞是否异常。 展开更多
关键词 稀疏编码 脑脊液 无监督学习 线性空间金字塔匹配 线性支持向量机
在线阅读 下载PDF
采用上下文金字塔特征的场景分类 被引量:14
14
作者 江悦 王润生 王程 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1366-1373,共8页
为了能有效地表述场景图像的语义特性,提出一种基于图像块上下文信息的场景图像分类框架.首先用规则网格将图像分块,并提取每个块的SIFT特征;然后用K均值算法对训练图像的块特征聚类,形成块类型的码本;再根据此码本对图像块进行量化,得... 为了能有效地表述场景图像的语义特性,提出一种基于图像块上下文信息的场景图像分类框架.首先用规则网格将图像分块,并提取每个块的SIFT特征;然后用K均值算法对训练图像的块特征聚类,形成块类型的码本;再根据此码本对图像块进行量化,得到图像的视觉词汇表示,形成视觉词汇图,并在其上建立2类视觉词汇模型:相邻共现的不同视觉词汇对模型和连续共现的相同视觉词汇群模型;最后应用空间金字塔匹配建立视觉词汇的上下文金字塔特征,并采用SVM分类器进行分类.实验结果证明,在常用的场景图像库上,文中方法比已有的典型方法具有更好的场景分类性能. 展开更多
关键词 场景分类 上下文信息 空间金字塔匹配 图像块
在线阅读 下载PDF
基于核拉普拉斯稀疏编码的图像分类 被引量:2
15
作者 张立和 潘磊 +1 位作者 刘涛 马臣 《大连理工大学学报》 EI CAS CSCD 北大核心 2015年第2期192-197,共6页
使用稀疏编码解决计算机视觉问题可以取得良好的效果.然而,以往的稀疏编码都是在原始特征空间进行.受核方法可以获得特征的高维非线性映射的启发,扩展了拉普拉斯稀疏编码(LSc),提出了核拉普拉斯稀疏编码(KLSc),它可以降低特征量化误差,... 使用稀疏编码解决计算机视觉问题可以取得良好的效果.然而,以往的稀疏编码都是在原始特征空间进行.受核方法可以获得特征的高维非线性映射的启发,扩展了拉普拉斯稀疏编码(LSc),提出了核拉普拉斯稀疏编码(KLSc),它可以降低特征量化误差,增强稀疏编码的性能.在3个标准数据集上的实验结果表明,所提出的基于KLSc的图像分类算法具有良好的分类效果,分类正确率优于LSc. 展开更多
关键词 图像分类 稀疏编码 拉普拉斯稀疏编码 核方法 空间金字塔匹配(spm)
在线阅读 下载PDF
基于改进BOF算法的图像识别和分类 被引量:4
16
作者 李康顺 王福滨 +1 位作者 张丽霞 李伟 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期1599-1605,共7页
对bag of features(BOF)算法进行研究与改进,并将其应用到图像识别和分类中。针对传统BOF算法执行效率低以及分类精度不够高等缺陷,提出一种结合SURF(speeded up robust feature)与空间金字塔匹配原理的优化方法相结合的图像识别与分类... 对bag of features(BOF)算法进行研究与改进,并将其应用到图像识别和分类中。针对传统BOF算法执行效率低以及分类精度不够高等缺陷,提出一种结合SURF(speeded up robust feature)与空间金字塔匹配原理的优化方法相结合的图像识别与分类算法。SURF算法可提高执行效率,而空间金字塔匹配原理的优化方法可提高分类精度。首先对分类图像应用SURF算法提取特征描述符并生成视觉词典,该算法提取的视觉词典能更有效地表示图像特征,且能应对多变的尺度;然后应用空间金字塔匹配原理对图像采用视觉词典的直方图表示,进一步提高分类的准确度;最后利用LIBSVM分类器进行分类。在Graz,Caltech-256和Pascal VOC 2012这3个数据集中进行实验测试。研究结果表明:该方法与传统的BOF算法相比提高了执行效率和分类精度。在数据实验中通过与近几年一些相关研究工作在分类准确率方面进行对比,该方法具有很大的优越性。 展开更多
关键词 BAG of features算法 图像识别分类 SURF 空间金字塔匹配
在线阅读 下载PDF
基于稀疏表示的自动年龄估计 被引量:3
17
作者 李玲芝 梁毅雄 +1 位作者 艾玮 刘凌波 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第3期878-885,共8页
将稀疏表示同时应用于人脸图像年龄特征提取和年龄自动估计2个关键环节,提出一种基于稀疏表示的年龄估计新方法。该方法首先对人脸图像进行稠密采样,提取底层的SIFT描述子,训练字典对其进行稀疏编码,再进行空间金字塔表示,并将其作为刻... 将稀疏表示同时应用于人脸图像年龄特征提取和年龄自动估计2个关键环节,提出一种基于稀疏表示的年龄估计新方法。该方法首先对人脸图像进行稠密采样,提取底层的SIFT描述子,训练字典对其进行稀疏编码,再进行空间金字塔表示,并将其作为刻画年龄属性的图像特征,然后采用线性稀疏回归模型同时选择特征进行年龄估计。针对人脸老化过程具有非线性特点,提出一种基于分段线性策略的层次模型,即首先训练若干个分类器将人脸粗分类到不同的年龄段,然后在该年龄段中训练对应的线性模型对年龄进行精确估计。在权威的FG-NET和MORPH人脸库上对该方法的有效性进行实验验证。研究结果表明:所提出的方法在FG-NET人脸库上年龄估计偏差的平均绝对误差为3.79,远比当前最好方法的平均绝对误差低,而在MORPH人脸库上的平均绝对误差为6.46,与当前最好方法的平均绝对误差相当。 展开更多
关键词 模式识别 年龄估计 稀疏表示 空间金字塔匹配 弹性网
在线阅读 下载PDF
基于听觉图像的音乐流派自动分类 被引量:3
18
作者 李锵 李秋颖 关欣 《天津大学学报》 EI CAS CSCD 北大核心 2013年第1期67-72,共6页
音乐流派的自动分类是音乐信息检索系统的重要组成部分.将听觉图像引入音乐流派的分类研究中,用听觉图像模型模拟人耳耳蜗结构,基于音乐流派分类研究常用的GTZAN数据库,将一维音频信号转换为二维听觉图像,对音乐听觉图像进行尺度不变特... 音乐流派的自动分类是音乐信息检索系统的重要组成部分.将听觉图像引入音乐流派的分类研究中,用听觉图像模型模拟人耳耳蜗结构,基于音乐流派分类研究常用的GTZAN数据库,将一维音频信号转换为二维听觉图像,对音乐听觉图像进行尺度不变特征转换(SIFT)及空间金字塔匹配(SPM),从局部到整体地提取图像的纹理特征,最后采用LibSVM中线性核函数的支持向量机对音乐流派进行分类.实验结果表明,与同样基于人耳耳蜗结构提出的美尔频率倒谱系数(MFCC)流派分类方法相比,基于听觉图像的流派分类正确率提高15%. 展开更多
关键词 音乐流派分类 听觉图像 尺度不变特征转换 空间金字塔匹配
在线阅读 下载PDF
基于互信息的多通道联合稀疏模型及其组织病理图像分类 被引量:4
19
作者 汤红忠 李骁 +1 位作者 张小刚 张东波 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第8期1514-1521,共8页
针对传统联合稀疏模型中共有分量与独有分量都采用相同的字典进行特征表示,导致编码系数判别性低的问题,提出一种基于互信息的多通道联合稀疏模型,并将其应用于组织病理图像的分类.该模型通过K均值对样本特征进行聚类,分别得到R,G与B通... 针对传统联合稀疏模型中共有分量与独有分量都采用相同的字典进行特征表示,导致编码系数判别性低的问题,提出一种基于互信息的多通道联合稀疏模型,并将其应用于组织病理图像的分类.该模型通过K均值对样本特征进行聚类,分别得到R,G与B通道的字典;其次利用样本特征与3个字典之间的互信息,剔除弱相关原子且构造了1个共有字典与3个独有字典,以此为基础建立了多通道联合稀疏模型;同时引入图像的空间信息,结合空间金字塔匹配模型对不同层次的图像特征进行联合稀疏编码,利用编码系数训练SVM分类器.实验结果表明,该模型具有更好的特征表示能力,大大提高了编码系数的判别性,获得了较好的分类性能与较强的鲁棒性. 展开更多
关键词 互信息 多通道联合稀疏模型 空间金字塔匹配 组织病理图像分类
在线阅读 下载PDF
整合局部特征和滤波器特征的空间金字塔匹配模型 被引量:9
20
作者 高常鑫 桑农 《电子学报》 EI CAS CSCD 北大核心 2011年第9期2034-2038,共5页
本文提出一种场景分类方法,通过整合局部特征和滤波器特征获得丰富的表征信息,并利用空间金字塔匹配模型提取空间上下文信息.该方法有如下四个特点:(1)通过转换将滤波器很好地嵌入空间金字塔匹配模型中;(2)在滤波器特征转换的过程中,采... 本文提出一种场景分类方法,通过整合局部特征和滤波器特征获得丰富的表征信息,并利用空间金字塔匹配模型提取空间上下文信息.该方法有如下四个特点:(1)通过转换将滤波器很好地嵌入空间金字塔匹配模型中;(2)在滤波器特征转换的过程中,采用降采样和平均操作,在空间密度和空间范围两者之间取得了很好的折衷;(3)将滤波器特征和局部特征组合起来,获得了更强的描述能力;(4)捕获了像素域和调制域的互补信息.同时,在三个数据库上的实验证明了该方法的有效性. 展开更多
关键词 基于上下文的表征 空间金字塔匹配 像素域 调制域 场景分类
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部