期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
LBAM神经网络及其在图像识别中的应用 被引量:4
1
作者 沈定刚 戚飞虎 《上海交通大学学报》 EI CAS CSCD 北大核心 1994年第3期58-63,共6页
本文提出了一种用于图像识别的神经网络.它由映射网络MN(MappingNetwork)和LBAM(LikedBidirectionalAssociatedMemory)网络组成.MN中使用了不变性变换法,降低了图像样... 本文提出了一种用于图像识别的神经网络.它由映射网络MN(MappingNetwork)和LBAM(LikedBidirectionalAssociatedMemory)网络组成.MN中使用了不变性变换法,降低了图像样本的维数且保持分类距离不变.在设计LBAM网络时,通过全局考虑,使得网络的吸引点和吸引区域满足实际全局最优之需要.LBAM具有网络结构简单和收敛速度快的优点,计算机模拟证实。 展开更多
关键词 图像识别 神经网络 不变性变换
在线阅读 下载PDF
基于SOM和SVM的遥感图像目标识别 被引量:9
2
作者 张艳宁 郑江滨 +1 位作者 候云舒 赵荣椿 《系统工程与电子技术》 EI CSCD 北大核心 2002年第7期9-11,共3页
提出了一种基于自组织特征映射 (SOM)神经网络和支撑矢量机 (SVM)相结合的遥感图像目标识别方法。该方法首先利用SOM对目标进行聚类 ,然后应用SVM方法对其进行分类识别。最后将该方法应用于二值遥感图像的目标识别 ,与仅用支撑矢量机方... 提出了一种基于自组织特征映射 (SOM)神经网络和支撑矢量机 (SVM)相结合的遥感图像目标识别方法。该方法首先利用SOM对目标进行聚类 ,然后应用SVM方法对其进行分类识别。最后将该方法应用于二值遥感图像的目标识别 ,与仅用支撑矢量机方法的识别结果进行了比较 ,结果表明 ,这一方法对二值遥感图像目标具有很好的分类识别效果 ,且训练时间大幅度缩短。 展开更多
关键词 SOM SVM 遥感图像 目标识别 图像识别 支撑矢量机 自组织特征映射神经网络
在线阅读 下载PDF
基于不变矩特征和神经网络的图像模式模糊分类 被引量:12
3
作者 范立南 徐心和 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第8期738-741,共4页
提出了一种基于不变矩特征和神经网络的医学图像识别模型·所设计的识别模型包括不变矩特征提取、不变矩矢量标准化、模糊化预处理、BP网络与竞争选择·利用不变矩方法提取医学图像的特征矢量,能有效检测出具有平移、旋转和比... 提出了一种基于不变矩特征和神经网络的医学图像识别模型·所设计的识别模型包括不变矩特征提取、不变矩矢量标准化、模糊化预处理、BP网络与竞争选择·利用不变矩方法提取医学图像的特征矢量,能有效检测出具有平移、旋转和比例变化的图像,利用神经网络作为分类器对提取的特征矢量分类,使用模糊化的方法先对输入特征数据做预处理再进行识别,每一个图像模式归属于某一类是以0到1的数字代表其归属程度·实验结果验证了模型的有效性,训练好的网络有很好的分类能力· 展开更多
关键词 医学图像 不变矩 矢量标准化 神经网络 模式识别 模糊分类
在线阅读 下载PDF
基于无人机图像的多尺度感知麦穗计数方法 被引量:16
4
作者 孙俊 杨锴锋 +3 位作者 罗元秋 沈继锋 武小红 钱磊 《农业工程学报》 EI CAS CSCD 北大核心 2021年第23期136-144,共9页
小麦是世界上重要的粮食作物,其产量的及时、准确预估对世界粮食安全至关重要,小麦穗数是估产的重要数据,因此该研究通过构建普适麦穗计数网络(Wheat Ear Counting Network,WECnet)对灌浆期小麦进行精准的计数与密度预估。选用多个国家... 小麦是世界上重要的粮食作物,其产量的及时、准确预估对世界粮食安全至关重要,小麦穗数是估产的重要数据,因此该研究通过构建普适麦穗计数网络(Wheat Ear Counting Network,WECnet)对灌浆期小麦进行精准的计数与密度预估。选用多个国家不同品种的麦穗图像进行训练,并且对数据集进行增强,以保证麦穗多样性。在原始人群计数网络CSRnet基础上,针对小麦图像特点构建WECnet网络。在网络前端,通过使用VGG19的前12层进行特征提取,同时与上下文语义特征进行融合,充分提取麦穗的特征信息。后端网络使用不同空洞率的卷积加大感受野,输出高质量的密度图。为了验证模型的可迁移性与普适性,该研究通过基于全球小麦数据集训练好的模型对无人机实拍的麦田图像进行计数。试验结果表明:在全球小麦数据集上,WECnet训练模型的决定系数、均方根误差(Root Mean Square Error,RMSE)与平均绝对误差(Mean Absolute Error,MAE)分别达到了0.95、6.1、4.78。在无人机拍摄图像计数中,决定系数达到0.886,整体错误率仅为0.23%,平均单幅小麦图像计数时间为32 ms,计数速度与精度均表现优异。普适田间小麦计数模型WECnet可以对无人机获取图像中小麦的准确计数及密度预估提供数据参考。 展开更多
关键词 无人机 图像识别 麦穗计数 卷积神经网络 高质量密度图 多尺度感知 线性滤波
在线阅读 下载PDF
低分辨人脸识别综述 被引量:20
5
作者 张凯兵 郑冬冬 景军锋 《计算机工程与应用》 CSCD 北大核心 2019年第22期14-24,共11页
全面综述了低分辨(Low-Resolution,LR)人脸识别技术的研究进展,并对相关亟需解决的关键问题进行了讨论。对LR人脸识别系统的概念、待解决问题、系统结构、已有不同识别方法进行了分类阐述。根据高、低分辨率人脸图像空间特征维度的不匹... 全面综述了低分辨(Low-Resolution,LR)人脸识别技术的研究进展,并对相关亟需解决的关键问题进行了讨论。对LR人脸识别系统的概念、待解决问题、系统结构、已有不同识别方法进行了分类阐述。根据高、低分辨率人脸图像空间特征维度的不匹配问题,分别对基于重构超分辨(Super-Resolution,SR)图像和基于公共特征子空间两类LR人脸识别方法进行了详细介绍。对每类方法按照不同的实现过程,进一步划分为三种不同的类型分别介绍,并对每类方法模型的主要思想和核心问题进行了分析和讨论。简单介绍了九种标准人脸数据库,从识别性能、平均运行时间和多人脸库实验结果比较等方面对每类代表性方法进行了分析。对LR人脸识别技术在未来发展中需要解决的难点问题给予了展望。 展开更多
关键词 低分辨人脸识别 图像超分辨 耦合映射 字典学习 稀疏表示 神经网络
在线阅读 下载PDF
基于改进的SOM神经网络的医学图像分割算法 被引量:16
6
作者 邹瑜 帅仁俊 《计算机工程与设计》 北大核心 2016年第9期2533-2537,F0003,共6页
针对SOM网络分割图像,随着神经元数量增加,分割性能变差且无法分割噪声强度过大图像的问题,提出一种用于医学图像分割的基于神经网络的方法。提出一个改进的自组织映射(SOM)网络,FIR-SOM网络将有限脉冲响应(FIR)加入SOM中,把每个神经元... 针对SOM网络分割图像,随着神经元数量增加,分割性能变差且无法分割噪声强度过大图像的问题,提出一种用于医学图像分割的基于神经网络的方法。提出一个改进的自组织映射(SOM)网络,FIR-SOM网络将有限脉冲响应(FIR)加入SOM中,把每个神经元作为FIR系统,在FIR-SOM方法分割后,通过合并聚类法把联合聚类的对象连接在一起。乳腺超声检查图像(BUS)的分割结果表明,该算法能够有效分割肿瘤区域,分割效果优于基于SOM的方法。 展开更多
关键词 人工神经网络 医学图像分割 模式识别 合并聚类 自组织映射
在线阅读 下载PDF
融合STN和DenseNet的深度学习网络及其应用 被引量:5
7
作者 张锡英 宋宇鹏 +1 位作者 陈曦 边继龙 《计算机工程与应用》 CSCD 北大核心 2019年第17期131-136,共6页
图像识别是计算机视觉的重要分支之一,具有重要的理论和实践意义。近年来,以深度卷积神经网络为代表的图像分类方法被成功地应用到各个领域。针对神经网络对输入数据敏感、训练时间长等问题,结合空间映射网络(Spatial Transform Network... 图像识别是计算机视觉的重要分支之一,具有重要的理论和实践意义。近年来,以深度卷积神经网络为代表的图像分类方法被成功地应用到各个领域。针对神经网络对输入数据敏感、训练时间长等问题,结合空间映射网络(Spatial Transform Network,STN)和密集神经网络(Dense Neural Network,DenseNet)两者的特性,提出一种新型网络结构ST-DenseNet。该网络能够对输入图片作不变性归一化处理,解决数据敏感问题的同时提高图像识别效果。在树种叶片公开数据集Leafsnap上实现了90.43%的识别准确率、87.75%的召回率和89.07%的F-Measure的实验结果,模型ST-DenseNet明显优于其他网络模型。 展开更多
关键词 图像识别 深度卷积神经网络 空间映射网络 密集神经网络 树种识别
在线阅读 下载PDF
挖掘机器人铲斗不变矩及改进BP网络识别方法 被引量:1
8
作者 王福斌 刘杰 +1 位作者 陈至坤 王静波 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第3期426-430,共5页
在利用视觉信息跟踪、识别挖掘机器人铲斗目标时,实时采集的铲斗图像存在旋转、平移、缩放等情况.为提高对铲斗目标的识别能力,提出了基于不变矩和神经网络相结合的铲斗目标识别方法.提取铲斗图像对于平移、旋转、缩放具有不变性能的7... 在利用视觉信息跟踪、识别挖掘机器人铲斗目标时,实时采集的铲斗图像存在旋转、平移、缩放等情况.为提高对铲斗目标的识别能力,提出了基于不变矩和神经网络相结合的铲斗目标识别方法.提取铲斗图像对于平移、旋转、缩放具有不变性能的7个不变矩特征向量,归一化后作为改进BP神经网络的训练样本及测试样本.应用训练后的神经网络对铲斗目标进行识别,仿真表明该方法具有较好的识别能力. 展开更多
关键词 挖掘机器人 不变矩 神经网络 图像 识别
在线阅读 下载PDF
用于图像识别的新型神经元网络 被引量:3
9
作者 沈定刚 戚飞虎 《上海交通大学学报》 EI CAS CSCD 北大核心 1993年第6期14-18,共5页
提出了一种用于图像识别的映射正交神经元网络。在一般情况下待识别的样本空间的维数相当大,为了有效地进行识别,必须把样本空间的维数降下来。目前常用的方法就是特征提取法,本文采用映射正交过程把样本空间映射成正交分类空间,并在此... 提出了一种用于图像识别的映射正交神经元网络。在一般情况下待识别的样本空间的维数相当大,为了有效地进行识别,必须把样本空间的维数降下来。目前常用的方法就是特征提取法,本文采用映射正交过程把样本空间映射成正交分类空间,并在此基础上,采用Hopfield网络进行图像分类。计算机上模拟结果表明,此网络具有对缺损和噪声图像进行正确识别的能力。 展开更多
关键词 神经元网络 映射正交 模式识别
在线阅读 下载PDF
基于PReLUs-Softplus非线性激励函数的卷积神经网络 被引量:13
10
作者 郜丽鹏 郑辉 《沈阳工业大学学报》 EI CAS 北大核心 2018年第1期54-59,共6页
针对卷积神经网络表达能力和识别效果受卷积层激励函数影响的问题,提出了一种新型非线性激励函数PRe LUs-Softplus,并将其应用于神经网络卷积层.对新型神经网络和采用传统激励函数的神经网络在MNIST和CIFAR-10标准数据库上进行了图像识... 针对卷积神经网络表达能力和识别效果受卷积层激励函数影响的问题,提出了一种新型非线性激励函数PRe LUs-Softplus,并将其应用于神经网络卷积层.对新型神经网络和采用传统激励函数的神经网络在MNIST和CIFAR-10标准数据库上进行了图像识别对比实验,结果表明,相比于采用传统激励函数的神经网络,使用PRe LUs-Softplus激励函数的卷积神经网络在不同的池化方式下图像识别计算收敛速度更快,显著降低了识别的错误率. 展开更多
关键词 深度学习 卷积神经网络 激励函数 模式识别 非线性映射 池化 网络结构 图像识别
在线阅读 下载PDF
图像分割算法在肉鸡深度图集上的研究 被引量:2
11
作者 李西明 赵泽勇 +3 位作者 吴精乙 黄永鼎 高月芳 温嘉勇 《广东农业科学》 CAS 2022年第1期159-166,共8页
【目的】针对在复杂环境背景中难以识别分割多只肉鸡的问题,探讨基于深度学习实现对多只肉鸡深度图像分割的方法。【方法】利用深度相机,通过不同的拍摄角度(俯视、正视、侧视)在自然环境下采集肉鸡不同姿势(站立、俯卧、抬头、低头等)... 【目的】针对在复杂环境背景中难以识别分割多只肉鸡的问题,探讨基于深度学习实现对多只肉鸡深度图像分割的方法。【方法】利用深度相机,通过不同的拍摄角度(俯视、正视、侧视)在自然环境下采集肉鸡不同姿势(站立、俯卧、抬头、低头等)形态的深度图像,并使用CVAT标注软件对深度图像进行精确标注,建立肉鸡深度图数据集(含4 058张深度图像)。利用FCN、U-Net、PSPNet、DeepLab和Mask R-CNN等5种神经网络实现肉鸡深度图像的识别与分割,根据测试集得到预测结果,比较与评估不同模型的性能,实现对肉鸡深度图像的识别与分割。【结果】基于Mask R-CNN神经网络模型的识别分割准确率为98.96%,召回率为97.78%,调和平均数为95.03%,交并比为94.69%,4个指标值均为5个模型中的最优值。【结论】基于Mask R-CNN神经网络的算法简单快速,且能准确实现肉鸡的自动识别与分割,对肉鸡遮挡有较佳的鲁棒性,基本可以满足养殖场鸡群均匀度预测的识别分割要求。促进了计算机视觉在现代农业的应用,可为鸡群计数、鸡群均匀度预测以及肉鸡福利饲养等鸡场作业提供理论和实践基础。 展开更多
关键词 图像识别 图像分割 深度学习 深度图像 神经网络模型
在线阅读 下载PDF
基于图像不变矩和神经网络的零件位姿自动识别 被引量:1
12
作者 赵金才 刘书桂 《传感技术学报》 CAS CSCD 北大核心 2006年第6期2682-2686,共5页
零件位置的自动识别是智能三坐标测量机检测系统中极为关键的技术.根据零件可能的放置方式形成零件的多幅虚拟图像,利用CCD摄像机采集零件的实际图像.将图像不变矩理论应用于图像匹配技术中,以虚拟图像的矩不变量及其对应模式进行BP神... 零件位置的自动识别是智能三坐标测量机检测系统中极为关键的技术.根据零件可能的放置方式形成零件的多幅虚拟图像,利用CCD摄像机采集零件的实际图像.将图像不变矩理论应用于图像匹配技术中,以虚拟图像的矩不变量及其对应模式进行BP神经网络的训练,将训练好的网络作为分类器,根据实际采集图像的矩不变量进行零件姿态的识别;由采集图像的不变矩计算零件在像平面内的位置和方向,并经坐标转换得到零件在机器坐标系中的位置和方向.实验结果表明本文零件位置自动识别方法是智能且高效的. 展开更多
关键词 三坐标测量机 位姿 自动识别 虚拟图像 矩不变量 BP神经网络
在线阅读 下载PDF
基于视频的驾驶疲劳检测技术的研究 被引量:5
13
作者 邓正宏 黄一杰 +1 位作者 李翔 张天凡 《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第6期1001-1006,共6页
疲劳驾驶已经成为交通事故的重要因素,若能及时监测驾驶员疲劳程度并且对其进行警告,则可降低此类交通事故的发生率。在图像处理的基础上从驾驶员实际状况出发,从背景中分离驾驶员面部区域,分别采用优化等照度线法和优化mouthmap法提取... 疲劳驾驶已经成为交通事故的重要因素,若能及时监测驾驶员疲劳程度并且对其进行警告,则可降低此类交通事故的发生率。在图像处理的基础上从驾驶员实际状况出发,从背景中分离驾驶员面部区域,分别采用优化等照度线法和优化mouthmap法提取眼睛和嘴巴特征参数,先在模糊神经网络的基础上建立疲劳分类器识别驾驶员疲劳程度,再在DSP系统上去实现疲劳驾驶检测系统。实验结果表明,该系统满足了一般疲劳的动态识别要求,具有较强的实用性。 展开更多
关键词 疲劳驾驶 面部特征 面部识别 眼睛监测
在线阅读 下载PDF
基于深度学习的蘑菇种类识别算法研究 被引量:4
14
作者 罗奇 《中国食用菌》 北大核心 2019年第6期26-29,33,共5页
深度学习已广泛地应用于植物图像识别分类中.由于蘑菇图像的识别分类难度较大,针对如何提高识别模型的准确率和泛化能力,提出了单一背景下的蘑菇图像识别方法.针对传统的卷积神经网络中存在的空间冗余问题,采用了一种降梯度卷积训练模型... 深度学习已广泛地应用于植物图像识别分类中.由于蘑菇图像的识别分类难度较大,针对如何提高识别模型的准确率和泛化能力,提出了单一背景下的蘑菇图像识别方法.针对传统的卷积神经网络中存在的空间冗余问题,采用了一种降梯度卷积训练模型,有效提高了蘑菇分类图像的识别性能.通过一个包含8123个样本的蘑菇数据集测试,降梯度卷积训练模型的平均耗费时间为0.985 s,第1张图像的平均命中准确率达到了91.6%,实验结果表明:降梯度卷积训练模型在单一背景、数据量较大的情况下,识别速度和准确率均优于传统的传统卷积神经网络. 展开更多
关键词 深度学习 卷积神经网络 图像识别 图像频率 特征图
在线阅读 下载PDF
基于三阶相关量的目标图像不变性识别技术 被引量:3
15
作者 祝奇 郑链 王克勇 《兵工学报》 EI CAS CSCD 北大核心 1999年第1期39-42,共4页
重点在于应用基于三阶相关量的人工神经网络方法解决目标图像的平移 (Translation)、尺度变换 (Scale)、旋转 (Rotationin plane)不变性 (Invariant)识别问题 (TSRI)。该方法通过计算“零片”三阶相关量 ,对数极坐标变换和计算Fourier... 重点在于应用基于三阶相关量的人工神经网络方法解决目标图像的平移 (Translation)、尺度变换 (Scale)、旋转 (Rotationin plane)不变性 (Invariant)识别问题 (TSRI)。该方法通过计算“零片”三阶相关量 ,对数极坐标变换和计算Fourier变换幅度谱 ,得到TSRI特征 ,并作为模式分类器的输入信号 ;模式分类器采用单层感知机。理论分析和对 3类飞机目标的实验结果表明 ,该法具有抗噪声 ,高识别率 ,处理速度快 ,结构简单等特点 。 展开更多
关键词 图像识别 不变性模式识别 TSRI 飞机 目标识别
在线阅读 下载PDF
基于双网络级联卷积神经网络的设计 被引量:7
16
作者 潘兵 曾上游 +2 位作者 杨远飞 周悦 冯燕燕 《电光与控制》 CSCD 北大核心 2019年第2期57-61,共5页
传统的卷积神经网络通常采用单一的网络结构进行特征提取,但是单一网络结构提取的特征不够充分,导致图片分类的精度不高。针对这个问题提出了采用两种网络同时进行特征提取,再将两种网络级联在一起,得到两种网络的融合特征,使提取的特... 传统的卷积神经网络通常采用单一的网络结构进行特征提取,但是单一网络结构提取的特征不够充分,导致图片分类的精度不高。针对这个问题提出了采用两种网络同时进行特征提取,再将两种网络级联在一起,得到两种网络的融合特征,使提取的特征更具有辨别性。双网络级联是采用两条支路进行特征提取,一条支路为传统的CNN,另一条支路为在传统的CNN基础上加上残差操作,在下一次特征图降维前通过级联操作将两条不同的网络支路结合在一起。本网络实验采用101_food和caltech256数据集进行测试,将级联后的网络和两条支路网络进行对比,实验最后表现出较好的结果。 展开更多
关键词 图像识别 卷积神经网络 网络级联 特征图
在线阅读 下载PDF
一种图像目标实时识别系统
17
作者 刘伏虎 任世宏 朱贵明 《北京理工大学学报》 EI CAS CSCD 1997年第6期717-722,共6页
以TMS320C40为主处理器,选用不变矩为目标特征,采用以积分方法为基础的一种不变矩快速算法.对极点的计算提出了具体算法.给出了各种极点的叠加分量.并采用BP神经网络对目标进行分类,实现了一种图像目标实时识别系统.... 以TMS320C40为主处理器,选用不变矩为目标特征,采用以积分方法为基础的一种不变矩快速算法.对极点的计算提出了具体算法.给出了各种极点的叠加分量.并采用BP神经网络对目标进行分类,实现了一种图像目标实时识别系统.实验表明,识别效果良好. 展开更多
关键词 图像处理 实时目标识别 神经网络 图像分割
在线阅读 下载PDF
基于深度迁移学习的输电线路涉鸟故障危害鸟种图像识别 被引量:13
18
作者 邱志斌 石大寨 +2 位作者 况燕军 廖才波 朱轩 《高电压技术》 EI CAS CSCD 北大核心 2021年第11期3785-3794,共10页
为了实现输电线路渉鸟故障的差异化防治,提出一种基于深度迁移学习的危害鸟种图像识别方法。根据历史渉鸟故障的鸟种信息及输电走廊周边鸟种调查结果,建立88种相关鸟类图像数据集,采用类激活映射进行图像预处理,滤除复杂背景噪声。基于... 为了实现输电线路渉鸟故障的差异化防治,提出一种基于深度迁移学习的危害鸟种图像识别方法。根据历史渉鸟故障的鸟种信息及输电走廊周边鸟种调查结果,建立88种相关鸟类图像数据集,采用类激活映射进行图像预处理,滤除复杂背景噪声。基于迁移学习的思想,首先利用AlexNet、VGG16、ResNet50、Inception V3这4种深度卷积网络架构建立学习模型,采用ImageNet图像数据集对其进行预训练,通过对微调预训练后的网络结构进行模型迁移,使其匹配鸟种图像识别任务。然后,利用鸟种图像样本集对迁移学习模型进行训练与测试,对比4种网络模型的识别准确率。最后,借鉴Delphi法的思想,建立一种融合多卷积神经网络的渉鸟故障危害鸟种识别模型。算例验证结果表明,该模型对88种危害鸟种的识别准确率可达91.21%,能够有效实现架空输电线路巡检图像中的鸟种识别,进而为渉鸟故障防治提供参考。 展开更多
关键词 输电线路 渉鸟故障 深度迁移学习 类激活映射 卷积神经网络 鸟种图像识别
在线阅读 下载PDF
多茶类CNN图像识别的数据增强优化及类激活映射量化评价 被引量:4
19
作者 章展熠 张宝荃 +5 位作者 王周立 杨垚 范冬梅 何卫中 马军辉 林杰 《茶叶科学》 CAS CSCD 北大核心 2023年第3期411-423,共13页
我国茶叶种类繁多,识别难度大。卷积神经网络(Convolutionalneuralnetwork,CNN)图像识别具有客观性、适应复杂图片背景且可移植于移动端的优势。但当前茶叶CNN图像识别缺乏对数据增强优化和识别准确性客观评价的研究,限制了模型识别的... 我国茶叶种类繁多,识别难度大。卷积神经网络(Convolutionalneuralnetwork,CNN)图像识别具有客观性、适应复杂图片背景且可移植于移动端的优势。但当前茶叶CNN图像识别缺乏对数据增强优化和识别准确性客观评价的研究,限制了模型识别的鲁棒性和泛化能力。采集29种常见茶类共6 123张图像构建数据集,对比了10种图像数据增强方法的ResNet-18(Residual network-18)训练效果;为了客观评价模型识别区域的准确性,构建了2个梯度加权类激活映射(Gradient-weighted class activation mapping,Grad-CAM)量化评价指标(IOB和MPI)。结果表明,网格擦除(Ratio=0.3)、分辨率扰动和HSV(Hue,Saturation,Value)颜色空间扰动是较优的数据增强方法,准确率(Accuracy)、损失值(Loss)、IOB和MPI等4个指标综合表现较优。进一步通过消融实验,得到了最佳的数据增强方法组合—水平镜像翻转+网格擦除(Ratio=0.3)+HSV颜色空间扰动,其模型测试准确率达到了99.82%、损失值仅有0.64,且IOB、MPI指标也表现较优,体现了较好的图像识别区域准确性。本研究对茶叶图像数据增强方法进行了优化,训练得到了高鲁棒性的多茶类CNN图像识别模型,构建的量化指标IOB和MPI也解决了CAM识别区域准确性客观评价的问题。 展开更多
关键词 茶类识别 卷积神经网络 图像识别 数据增强 类激活映射
在线阅读 下载PDF
基于因果干预与不变性的卷积预训练模型优化研究
20
作者 胡璇 邢凯 +2 位作者 李亚鸣 王志勇 邓洪武 《计算机工程》 CAS CSCD 北大核心 2022年第4期89-98,共10页
基于卷积神经网络(CNN)的深度模型在图像识别与分类领域应用广泛,但在全局特征控制、概念层次特征不变性提取和变量之间的因果关系确定方面仍存在不足,使得深度模型缺乏灵活性、适应性及泛化性。基于因果干预和不变性,提出一种基于CNN... 基于卷积神经网络(CNN)的深度模型在图像识别与分类领域应用广泛,但在全局特征控制、概念层次特征不变性提取和变量之间的因果关系确定方面仍存在不足,使得深度模型缺乏灵活性、适应性及泛化性。基于因果干预和不变性,提出一种基于CNN深度模型的定向修剪和网络结构优化方法。通过对模型输入进行基于不变性的干预调制,根据生成的调制图片序列分析预训练网络卷积子结构的输出分布,筛选和定向修剪噪声敏感子结构。构建基于类间区分度的目标函数,借助经济学领域中的资本资产定价模型构建网络的层间连接,生成在单分类任务下能增大类间区分度的网络拓扑结构,逐层优化构建概念层次的稳定特征。在ImageNet-2012数据集上的实验结果表明,优化后的深度模型相比于ResNet50基线预训练模型的分类准确率约提升了5个百分点,并大幅降低了训练集规模。 展开更多
关键词 图像识别与分类 卷积神经网络 因果干预 不变性 资本资产定价模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部