期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
仿真假体视觉下基于深度图像的手势识别研究 被引量:2
1
作者 赵瑛 王冬晖 +2 位作者 李琦 于爱萍 谷宇 《现代电子技术》 北大核心 2019年第16期131-135,139,共6页
针对仿真假体视觉下彩色图像和深度图像对于手势识别的不同效果,研究使用Kinect获取彩色图像以及深度图像进行手势识别。通过Kinect提取的骨骼信息与提取的深度图像结合,将人体与背景图像分离,对OpenCV库分离后的图像进行降噪,并进行像... 针对仿真假体视觉下彩色图像和深度图像对于手势识别的不同效果,研究使用Kinect获取彩色图像以及深度图像进行手势识别。通过Kinect提取的骨骼信息与提取的深度图像结合,将人体与背景图像分离,对OpenCV库分离后的图像进行降噪,并进行像素化处理。在不同分辨率(32×32,48×48,64×64)下进行彩色图像和深度图像的手势识别实验。实验结果表明,随着分辨率的增加,手势识别的准确率也不断增加。同一分辨率下,深度图像下的手势识别率总体高于彩色图像下的手势识别率,且在32×32分辨率下,二者差异显著。 展开更多
关键词 视觉假体 手势识别 深度图像 骨骼信息 图像降噪 像素化处理
在线阅读 下载PDF
基于知识蒸馏改进U-Net网络模型用于分割CT图像中的口腔颌面部肿瘤 被引量:2
2
作者 王芳 王熙 +6 位作者 兰文娟 杨智超 孙碧婷 刘颖 谷宇 白洁 唐思源 《中国医学影像技术》 CSCD 北大核心 2024年第4期591-597,共7页
目的 观察基于知识蒸馏改进U-Net网络模型用于分割CT图像中的口腔颌面部肿瘤的价值。方法 收集2个医疗中心121例口腔颌面部肿瘤患者共609幅CT图像;于公开数据集HECKTOR2020搜集254例口腔颌面部肿瘤患者共1 977幅CT图像。向U-Net网络模... 目的 观察基于知识蒸馏改进U-Net网络模型用于分割CT图像中的口腔颌面部肿瘤的价值。方法 收集2个医疗中心121例口腔颌面部肿瘤患者共609幅CT图像;于公开数据集HECKTOR2020搜集254例口腔颌面部肿瘤患者共1 977幅CT图像。向U-Net网络模型中引入多尺度和注意力机制,加入残差网络,建立改进U-Net模型;采用知识蒸馏技术生成学生模型,观察模型分割CT图像中的口腔颌面部肿瘤的效能。结果 改进U-Net模型大小为89.30 MB,参数数量为17.82 M,计算量为22.13 GFlops;其分割CT所示口腔颌面部肿瘤的精确率(Precision)、召回率(Recall)、戴斯相似系数和交并比分别为0.835、0.787、0.812及0.761,优于既往结合常规损失函数(Dice Loss function)所获模型及未改进模型;且除Precision之外,学生模型与教师模型差异较小。结论 基于知识蒸馏改进U-Net网络模型用于分割CT图像中的口腔颌面部肿瘤具有较高价值。 展开更多
关键词 口腔疾病 颌面部疾病 肿瘤 神经网络 计算机 体层摄影术 X线计算机 知识蒸馏
在线阅读 下载PDF
基于轻量化生成对抗网络的遥感图像超分辨率重建 被引量:3
3
作者 张鹏婴 张明 +1 位作者 李建军 张宝华 《激光杂志》 CAS 北大核心 2024年第4期114-120,共7页
针对ESRGAN模型复杂度高、特征提取与表示性能欠佳的问题,提出了一种基于轻量化生成对抗网络(Light weight Generative Adversarial Network, LwGAN)的遥感图像超分辨率重建算法。该算法以改进残差密集模块(Improved Residual Dense Blo... 针对ESRGAN模型复杂度高、特征提取与表示性能欠佳的问题,提出了一种基于轻量化生成对抗网络(Light weight Generative Adversarial Network, LwGAN)的遥感图像超分辨率重建算法。该算法以改进残差密集模块(Improved Residual Dense Block, IRDB)为基础块构建生成网络的高阶特征提取部分,提取了丰富的多样化特征,同时建立了特征的通道及长距离位置关系,在降低模型参数量的同时提升了模型的特征提取与表示性能。通过在UC MERCED和NWPU-RESISC45数据集上的实验结果表明,与ESRGAN相比,LwGAN获取了更大的峰值信噪比和结构相似度,显著提升了遥感图像的超分辨率重建性能,可视化结果表明重建图像恢复了更多的纹理细节信息,同时模型参数量仅为原始ESRGAN的约三分之一,大幅地提高了模型的运行效率,为后续遥感图像的分析处理奠定了基础。 展开更多
关键词 超分辨率重建 遥感图像 生成对抗网络 残差密集 坐标注意力
在线阅读 下载PDF
改进YOLOv8模型实现多类型肺结节检测 被引量:2
4
作者 包强强 唐思源 +7 位作者 李擎乾 王乃钰 杨敏 谷宇 赵金亮 高婧博 王嘉欣 曲禹涵 《计算机科学与探索》 北大核心 2025年第2期429-442,共14页
目前,肺结节检测通常是对实性肺结节的单一型检测,不同类型肺结节对应多种肺癌类型,多类型检测有助于提高肺癌的整体检出率,提升治愈率。为实现对实性、混合型、磨玻璃型多类型肺结节检测,对YOLOv8模型进行针对性改进。提出RepViTCAA模... 目前,肺结节检测通常是对实性肺结节的单一型检测,不同类型肺结节对应多种肺癌类型,多类型检测有助于提高肺癌的整体检出率,提升治愈率。为实现对实性、混合型、磨玻璃型多类型肺结节检测,对YOLOv8模型进行针对性改进。提出RepViTCAA模块对主干部分的C2f模块进行改进,提升微小肺结节检测精度并对模型进行轻量化设计。提出ECLA-HSFPN模块,重建模型特征融合部分,提升尺度不固定肺结节检测精度。将KAN网络融入模型当中,基于KAN网络非线性特征学习能力强的特性,进一步提升微小肺结节检测精度,增强模型泛化能力。基于Inner-IoU辅助框思想,对CIoU损失函数进行改进,进一步解决肺结节尺度不固定问题,提升模型检测精度。在LUNA16数据集中进行测试,改进模型相比原模型及YOLOv9、RT-DETR等主流模型各项评价指标均有提升。在4种类型(实性、磨玻璃型、混合型、微小型)肺结节的专项数据集中测试,改进模型检测效果优于原模型。在LUNA16与本地医院的混合数据集中进行泛化性测试,改进模型具有较强的泛化能力。针对多类型肺结节检测任务,模型的改进较为有效,可以准确检测不同类型的肺结节。 展开更多
关键词 多类型肺结节检测 YOLOv8 RepViTCAA ECLA-HSFPN KAN Inner-IoU
在线阅读 下载PDF
软多标签和深度特征融合的无监督行人重识别 被引量:7
5
作者 张宝华 朱思雨 +6 位作者 吕晓琪 谷宇 王月明 刘新 任彦 李建军 张明 《光电工程》 CAS CSCD 北大核心 2020年第12期13-22,共10页
跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算... 跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算法。为了提高标签匹配精度,首先利用软多标签逼近真实标签,通过计算参考数据集和参考代理在软多标签函数中的损失函数,预训练参考数据集,并构建预训练与训练结果的映射模型。再通过生成数据和真实数据分布的最小距离的期望即简化的2-Wasserstein距离计算相机视图中软多标签均值和标准差得到损失函数,解决跨视域标签一致性问题。为了提高软多标签对未标记目标数据集的有效性,计算联合嵌入损失,挖掘不同类别间的相似对,纠正跨域分布错位。针对残差网络训练时长和无监督学习精度低的问题,通过结合压缩激励网络(SENet)和多层级深度特征融合改进残差网络的结构,提高训练速度和精度。实验结果表明,该方法在标准数据集下的首位命中率和平均精度均值优于先进相关算法。 展开更多
关键词 残差网络 行人重识别 软多标签 无监督 深度特征
在线阅读 下载PDF
基于改进残差网络和动态ReLU肺癌病理图像分类 被引量:2
6
作者 谷宇 李思敏 +5 位作者 张宝华 杨立东 吕晓琪 张祥松 贾成一 贺群 《激光杂志》 CAS 北大核心 2023年第5期154-161,共8页
为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高... 为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高模型性能。实验结果表明,该网络模型在肺良性图像、肺腺癌图像和肺鳞状细胞癌图像准确率分别达到100.00%、99.96%、99.96%,整个数据集准确率达到99.96%。因此,表明本实验所改进的网络模型可以有效地提高肺癌病理图像分类的准确率。 展开更多
关键词 肺癌病理图像 残差网络 注意力机制 图像分类
在线阅读 下载PDF
深度双重注意力的生成与判别联合学习的行人重识别 被引量:6
7
作者 张晓艳 张宝华 +5 位作者 吕晓琪 谷宇 王月明 刘新 任彦 李建军 《光电工程》 CAS CSCD 北大核心 2021年第5期54-62,共9页
在行人重识别任务中存在数据集标注难度大,样本量少,特征提取后细节特征缺失等问题。针对以上问题提出深度双重注意力的生成与判别联合学习的行人重识别。首先,构建联合学习框架,将判别模块嵌入生成模块,实现图像生成和判别端到端的训练... 在行人重识别任务中存在数据集标注难度大,样本量少,特征提取后细节特征缺失等问题。针对以上问题提出深度双重注意力的生成与判别联合学习的行人重识别。首先,构建联合学习框架,将判别模块嵌入生成模块,实现图像生成和判别端到端的训练,及时将生成图像反馈给判别模块,同时优化生成模块与判别模块。其次,通过相邻的通道注意力模块间连接和相邻空间注意力模块间连接,融合所有通道特征和空间特征,构建深度双重注意力模块,将其嵌入教师模型,使模型能更好地提取行人细节身份特征,提高模型识别能力。实验结果表明,该算法在Market-1501和DukeMTMC-ReID数据集上具有较好的鲁棒性、判别性。 展开更多
关键词 行人重识别 图像生成 联合学习 注意力机制 深度学习
在线阅读 下载PDF
基于改进ConvNeXt的皮肤镜图像分类方法 被引量:9
8
作者 李建威 吕晓琪 谷宇 《计算机工程》 CAS CSCD 北大核心 2023年第10期239-246,254,共9页
皮肤癌是最致命的癌症之一,对皮肤镜图像进行精确分类尤为关键,然而现有的皮肤镜图像存在形态复杂、样本数量较少的问题,导致现有的自动分类方法难以提取图像特征信息,误判率较高。提出一种改进ConvNeXt的方法,并构建SE-SimAM-ConvNeXt... 皮肤癌是最致命的癌症之一,对皮肤镜图像进行精确分类尤为关键,然而现有的皮肤镜图像存在形态复杂、样本数量较少的问题,导致现有的自动分类方法难以提取图像特征信息,误判率较高。提出一种改进ConvNeXt的方法,并构建SE-SimAM-ConvNeXt模型。以ConvNeXt为基础网络,加入SimAM无参注意力模块,提升网络的特征提取能力,并在基础网络中引入通道注意力机制,增强ConvNeXt对潜在关键特征的挖掘能力。在训练初始时加入预热机制Cosine Warmup,在该过程中使用余弦函数值进行学习率的衰减,进一步加速ConvNeXt的收敛,提高ConvNeXt模型的分类能力。在HAM10000皮肤数据集上的实验结果表明,该模型的分类准确率、精确度、召回率、特异性分别为92.9%、85.3%、78.0%、97.5%,具有较好的皮肤镜图像分类能力,对皮肤癌病变的辅助诊断有一定程度的应用价值,可帮助皮肤科医生对皮肤癌做进一步的诊断。 展开更多
关键词 皮肤镜图像分类 ConvNeXt网络 通道注意力机制 SimAM无参注意力 预热机制
在线阅读 下载PDF
基于单目RGB图像的三维手势跟踪算法综述 被引量:7
9
作者 张继凯 李琦 +1 位作者 王月明 吕晓琪 《计算机科学》 CSCD 北大核心 2022年第4期174-187,共14页
鉴于人机交互(Human-Computer Interaction,HCI)系统和虚拟现实(Virtual Reality,VR)系统的应用需要,三维手势跟踪领域的理论和方法研究已成为国内外广泛关注的热点课题之一。近年来,基于计算机视觉的三维手势跟踪算法迅速发展,其中成... 鉴于人机交互(Human-Computer Interaction,HCI)系统和虚拟现实(Virtual Reality,VR)系统的应用需要,三维手势跟踪领域的理论和方法研究已成为国内外广泛关注的热点课题之一。近年来,基于计算机视觉的三维手势跟踪算法迅速发展,其中成本较低且较为普遍的单目RGB相机最具潜力,它是三维手势跟踪应用得以照进现实的重要工具和途径,成为了研究者们的研究重点。为了解在此基础上的手势跟踪算法的发展现状,辅助该领域的研究者们进行更深入的探索,文中首先在与传统方法的对比中引出了基于单目RGB图像的三维手势跟踪算法,并将其分为判别法、生成法和混合法3类,概括了其相应的优缺点;其次讨论了RGB图像特点对三维手势跟踪的影响,并归纳了缓解图像深度模糊性的方法;然后根据分类着重分析了以RGB为输入数据的代表性算法,通过可视化的性能评估指标比较了相关算法的具体优势和不足;最后总结了当前三维手势跟踪算法面临的难题并对未来的发展进行了展望。 展开更多
关键词 人机交互 虚拟现实 RGB图像 三维手势跟踪 计算机视觉
在线阅读 下载PDF
基于改进ResNeXt的肺癌病理图像分类 被引量:2
10
作者 李思敏 谷宇 +3 位作者 张宝华 迟靖千 刘佳琪 贺群 《计算机工程与设计》 北大核心 2023年第8期2439-2446,共8页
针对肺癌病理图像的自动分类,提出一种改进的卷积神经网络,引入一种新型卷积结构。以ResNeXt残差网络作为基础网络模型,使用新型卷积involution替代部分传统卷积层,解决传统卷积核的感受野小和通道之间信息比较冗余的问题。实验结果表明... 针对肺癌病理图像的自动分类,提出一种改进的卷积神经网络,引入一种新型卷积结构。以ResNeXt残差网络作为基础网络模型,使用新型卷积involution替代部分传统卷积层,解决传统卷积核的感受野小和通道之间信息比较冗余的问题。实验结果表明,该网络模型在LC25000数据集的肺癌病理图像分类任务中,肺良性图像、肺腺癌图像和肺鳞状细胞癌图像准确率分别达到100.00%、99.47%、99.47%,整个数据集准确率达到99.47%,表明改进的网络模型可以提高对肺癌病理图像分类的准确率。 展开更多
关键词 肺癌病理图像 卷积神经网络 残差网络 新型卷积 感受野 通道 图像分类
在线阅读 下载PDF
基于改进残差和注意力的CT肺癌辅助诊断 被引量:2
11
作者 谷宇 迟靖千 +3 位作者 张宝华 杨立东 李建军 唐思源 《传感器与微系统》 CSCD 北大核心 2024年第9期30-34,共5页
为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和... 为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和大小的结节特征的能力。实验结果表明:该模型在DSB数据集上表现良好,结节检测的灵敏度和特异性分别达到了99.15%和99.99%,肺癌诊断的准确率和AUC值分别达到了80.43%和0.86。可见,本文方法对于多种多样的结节特征具有高度敏感性,具有一定的临床价值。 展开更多
关键词 肺结节辅助检测 肺癌辅助诊断 CT图像 卷积神经网络 ResNeXt模块 注意力机制
在线阅读 下载PDF
基于拆分残差网络的糖尿病视网膜病变分类 被引量:2
12
作者 肖宇庭 吕晓琪 +1 位作者 谷宇 刘传强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期91-101,共11页
糖尿病视网膜病变是一种常见的糖尿病并发症。为提高糖尿病视网膜病变图像分级准确率,本文提出基于拆分残差网络的分级算法。通过融合归一化注意力,增强识别关键特征信息能力,使模型对病灶特征信息提取更具有针对性;利用全局上下文模块... 糖尿病视网膜病变是一种常见的糖尿病并发症。为提高糖尿病视网膜病变图像分级准确率,本文提出基于拆分残差网络的分级算法。通过融合归一化注意力,增强识别关键特征信息能力,使模型对病灶特征信息提取更具有针对性;利用全局上下文模块综合考虑不同尺度及网络层学习到的特征信息,进一步联系不同时期糖尿病视网膜病灶特点,增强模型表达能力;输出分类器设计多分支结构进行图像分级,提升多类别图像分级精度。实验结果得出模型准确率为94.86%,其他评价指标相比原主干网络模型均有提高。本文模型性能良好,实现了较高精度诊断分级糖尿病视网膜病变图像。 展开更多
关键词 医学图像处理 深度学习 糖尿病视网膜病变 注意力机制 拆分残差网络
在线阅读 下载PDF
深度学习检测肺结节难点问题综述 被引量:2
13
作者 包强强 唐思源 谷宇 《计算机工程与应用》 CSCD 北大核心 2024年第19期18-31,共14页
肺癌在全球范围内是致命性最高的癌症之一,肺结节是肺癌的早期表现形式,基于深度学习的肺结节检测模型因较高的检测准确率与效率逐渐成为辅助医生检测肺结节的有效方法。但是目前基于深度学习的肺结节检测模型仍有不足,一些重难点问题... 肺癌在全球范围内是致命性最高的癌症之一,肺结节是肺癌的早期表现形式,基于深度学习的肺结节检测模型因较高的检测准确率与效率逐渐成为辅助医生检测肺结节的有效方法。但是目前基于深度学习的肺结节检测模型仍有不足,一些重难点问题需要解决。第一,基于迁移学习、GAN网络、半监督学习与无监督学习解决模型训练时肺结节数据不足与类别不平衡问题;第二,增强模型特征提取能力提升对肺结节检测的敏感度与准确度;第三,提升模型假阳性肺结节筛查能力降低假阳性率;第四,加强模型检测肺结节的可解释能力;第五,基于大模型技术解决以上4个难点问题。最后,介绍检测模型训练与测试所需的数据集与评价指标并对未来肺结节检测优化方向进行讨论。 展开更多
关键词 肺癌 肺结节检测 深度学习 计算机辅助检测系统
在线阅读 下载PDF
改进知识蒸馏Transformer的新冠肺炎医学影像分类
14
作者 白浩田 谷宇 +7 位作者 杨立东 张宝华 李建军 吕晓琪 唐思源 张祥松 贾成一 贺群 《激光杂志》 CAS 北大核心 2024年第2期152-160,共9页
针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches... 针对在筛查新型冠状病毒感染肺炎患者时核酸检测假阴性率较高的问题,提出了一种DRPL-ViT计算机辅助诊断网络。在Vision Transformer的基础上首先引入知识蒸馏机制,使Transformer结构在小数据集上训练取得更好的拟合效果;然后,在patches的位置信息编码上,通过更适合视觉任务的相对位置编码方式,使tokens之间的依赖关系能够被更好地捕捉;为了关注到更多的局部特征,在Transformer Encoder模块中引入了传统的卷积模块提取局部特征。实验在四分类测试集上平均分类准确率达到92.11%,对新冠肺炎分类准确率达到97.85%。实验结果表明,所提出的网络对新冠肺炎及其他肺部病变分类准确率较高,有一定的临床应用价值。 展开更多
关键词 医学图像分类 Vision Transformer架构 深度学习 计算机X线摄影 新冠肺炎
在线阅读 下载PDF
融合注意力特征及动态卷积的肺结节辅助诊断 被引量:6
15
作者 谷宇 刘佳琪 +3 位作者 杨立东 张宝华 张祥松 贾成一 《科学技术与工程》 北大核心 2023年第16期6834-6844,共11页
针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating atten... 针对肺结节关键影像征象信息不易获取,部分卷积神经网络(convolutional neural networks,CNN)模型对肺结节的识别率不高的问题,提出一种融合注意力特征的动态卷积残差网络(dynamic convolutional residual networks incorporating attention features,DcANet),并在有效实现肺结节良恶性分类的基础上对所提模型的诊断结果进行可视化分析。此网络以适应肺结节三维小尺寸输入特点的残差网络为基本框架,在DcABlock部分使用可以自适应调整卷积参数的动态卷积以及迭代注意特征融合模块,使模型能够更准确地获取肺结节信息,提高模型的表征能力。此外,还使用类激活映射将三维图像的各层切片进行可视化分析。实验在最终测试集上的准确率为85.87%,平衡F分数(F1)值为82.67%,敏感度和特异性的综合指标Gmean值为85.51%。实验结果表明:该网络可以提升对肺结节良恶性分类的准确性,诊断结果具有可信性,有一定的临床应用价值。 展开更多
关键词 肺结节辅助诊断 动态卷积 迭代注意特征融合模块 深度学习 类激活映射
在线阅读 下载PDF
多模态3D卷积神经网络脑部胶质瘤分割方法 被引量:4
16
作者 谷宇 吕晓琪 +7 位作者 李菁 任国印 喻大华 赵瑛 吴凉 张文莉 郝小静 黄显武 《科学技术与工程》 北大核心 2018年第7期18-24,共7页
由于大多数脑部胶质瘤边界有水肿且内部结构复杂,分割胶质瘤及瘤内结构难度较大。提出一种新的基于多模态MRI 3D卷积神经网络(CNN)脑部胶质瘤及瘤内各结构的自动分割算法。首先,标准化由T1、T1c、T2、FLAIR 4个MRI模态组成的输入图像。... 由于大多数脑部胶质瘤边界有水肿且内部结构复杂,分割胶质瘤及瘤内结构难度较大。提出一种新的基于多模态MRI 3D卷积神经网络(CNN)脑部胶质瘤及瘤内各结构的自动分割算法。首先,标准化由T1、T1c、T2、FLAIR 4个MRI模态组成的输入图像。其次,构建10个卷积层,2个全连接层的3D CNN。卷积层采用3×3×3的3D卷积核;全连接层采用PRe Lu激励函数,并结合dropout技术防止过拟合。构建的3D CNN分割胶质瘤和瘤内各结构精度高,与专家手动分割的结果接近。实验结果表明,构建的多模态3D CNN能够准确地分割MRI多模态图像脑部胶质瘤及瘤内各结构,具有重要的临床意义。 展开更多
关键词 脑部胶质瘤 瘤内结构 多模态MRI 3D卷积神经网络 图像分割
在线阅读 下载PDF
基于去雾增强和张量恢复的红外小目标检测 被引量:5
17
作者 王亚平 周裕丰 张宝华 《红外与激光工程》 EI CSCD 北大核心 2022年第4期419-427,共9页
为解决红外块张量模型中利用核范数难以找到张量秩的非凸逼近,得到的非最优解进而影响红外小目标检测,提出了一种基于去雾增强和张量恢复的红外小目标检测算法。首先,利用改进后的暗通道算法对红外图像去雾增强,提高清晰度的同时间接增... 为解决红外块张量模型中利用核范数难以找到张量秩的非凸逼近,得到的非最优解进而影响红外小目标检测,提出了一种基于去雾增强和张量恢复的红外小目标检测算法。首先,利用改进后的暗通道算法对红外图像去雾增强,提高清晰度的同时间接增强了红外图像中背景的低秩性;其次,筛选匹配的张量正面切片去构建红外块张量模型,在张量奇异值分解的框架下,将检测任务转化为张量恢复问题;最后,设计一种快速算法恢复出红外图像中的低秩成分和稀疏成分,运算简单降低算法复杂度。相较于滤波和人类视觉系统的方法,该算法在复杂背景下的误检率平均下降16.6%,在常见的高亮背景区域中检测性能良好,误检率可降低33%。实验结果表明:该算法可以适用于复杂场景,剔除潜在的虚警点。 展开更多
关键词 红外小目标 去雾增强 红外块张量模型 张量恢复
在线阅读 下载PDF
仿真假体视觉下神经网络算法的应用研究 被引量:2
18
作者 赵瑛 李琦 +2 位作者 王冬晖 于爱萍 谷宇 《现代电子技术》 北大核心 2020年第4期164-166,172,共4页
尽管已有多种图像处理策略被应用到视觉假体的仿真研究中并提高了被试的识别表现,但在植入电极数量有限的情况下,如何保证盲人获得足够的拓扑信息是视觉假体仍需解决的问题。在此背景下,本文将两种神经网络算法应用到仿真假体视觉中对... 尽管已有多种图像处理策略被应用到视觉假体的仿真研究中并提高了被试的识别表现,但在植入电极数量有限的情况下,如何保证盲人获得足够的拓扑信息是视觉假体仍需解决的问题。在此背景下,本文将两种神经网络算法应用到仿真假体视觉中对图像进行前景目标提取和像素化处理,首先利用图像分割数据集训练一个U-net网络得到前景提取后的结果,将其像素化之后与提取前的原图配对,再利用配对后的数据集训练一个Pix2Pix网络从而实现了将彩色图像"翻译"为像素化图像的目标。实验结果表明,与传统图像处理算法相比U-net网络具有更准确的目标提取效果,且经Pix2pix网络"翻译"后的图像也与标签图像更相似,有助于提高假体佩戴者的识别准确率。 展开更多
关键词 仿真假体视觉 神经网络算法 前景目标提取 像素化处理 数据集训练 图像配对
在线阅读 下载PDF
基于双流卷积网络的宫颈细胞细粒度分类
19
作者 王倩 吕晓琪 +1 位作者 谷宇 张明 《科学技术与工程》 北大核心 2022年第30期13378-13387,共10页
为了实现对宫颈细胞图像相近类别的准确自动分类,提出了一种双流卷积神经网络算法。算法以DenseNet121网络和Xception网络为基础并对其进行改进,以提高算法对宫颈细胞进行细粒度分类的识别准确率。首先,在DenseNet121中引入DropBlock模... 为了实现对宫颈细胞图像相近类别的准确自动分类,提出了一种双流卷积神经网络算法。算法以DenseNet121网络和Xception网络为基础并对其进行改进,以提高算法对宫颈细胞进行细粒度分类的识别准确率。首先,在DenseNet121中引入DropBlock模块进行网络正则化,用于提高模型的泛化能力;其次,在Xception中加入SE(squeeze-and-excitation)模块调整通道权重,以增强网络提取有效特征的能力;最后,将两个网络输出的特征图进行拼接构建双流网络,来获取宫颈细胞更全面的特征信息。实验结果表明,该网络在Herlev数据集以及SIPaKMeD数据集上各性能指标都表现良好,且都达到了99%的准确率,优于改进融合前的网络,提出的算法在宫颈细胞的细粒度分类中具有较高识别率。 展开更多
关键词 图像处理 细粒度分类 双流卷积网络 宫颈细胞 深度学习
在线阅读 下载PDF
仿真假体视觉下的单目测距研究
20
作者 赵瑛 张阳 +1 位作者 郝大帅 王冬晖 《现代电子技术》 北大核心 2020年第20期79-82,共4页
为了研究假体佩戴者是否具有异常的立体视觉,影响目标定位,在现实场景中开展仿真假体视觉下单目测距研究。实验采用蒙眼测距方法,被试者佩戴头戴式显示器模拟在仿真假体单眼,仿真假体双眼以及在正常单眼情况观察判断放在地板上不同位置(... 为了研究假体佩戴者是否具有异常的立体视觉,影响目标定位,在现实场景中开展仿真假体视觉下单目测距研究。实验采用蒙眼测距方法,被试者佩戴头戴式显示器模拟在仿真假体单眼,仿真假体双眼以及在正常单眼情况观察判断放在地板上不同位置(3.51 m,4.92 m,6.33 m)的目标物体,通过蒙着眼睛轻快地走到他/她所判断的地方,记录并统计分析行走距离。实验结果发现,在三种观察条件下,正常单眼感知精度最高,仿真假体单眼最低。随着物体放置距离的增加,准确度也有细微下降。经统计分析发现,仿真假体单眼与正常单眼对距离判断没显著性差异,说明假体植入者能准确定位地面上的目标。 展开更多
关键词 仿真假体 单目测距 蒙眼测距 目标定位 距离感知 实验分析
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部