期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于融合语义信息的上下文感知图像修复
1
作者 祖奕 张孙杰 +1 位作者 吴鹏 马悦恒 《数据采集与处理》 北大核心 2025年第2期401-416,共16页
近年来,生成对抗网络广泛应用于图像修复领域并取得了不错的效果。但目前的方法并没有考虑在高分辨率图像(512×512)中会产生模糊的结构以及纹理的问题,这些问题主要来源于缺乏有效特征信息。针对此问题,提出一种将图像特征与语义... 近年来,生成对抗网络广泛应用于图像修复领域并取得了不错的效果。但目前的方法并没有考虑在高分辨率图像(512×512)中会产生模糊的结构以及纹理的问题,这些问题主要来源于缺乏有效特征信息。针对此问题,提出一种将图像特征与语义信息相结合的生成对抗网络。主要基于语义信息,提出一种上下文感知的图像修复模型,该模型自适应地将语义信息与图像特征融合,并且提出自适应卷积替代传统卷积,以及在解码器后增添一个多尺度上下文聚合模块捕捉远距离信息来进行上下文推理。在Places2、CelebA⁃HQ、Paris Street View和Openlogo数据集上进行实验,实验结果表明,在L1损失、峰值信噪比(PSNR)和结构相似度(SSIM)上所提方法与现有方法对比均有所提升。 展开更多
关键词 图像修复 语义信息 图像特征 多尺度上下文特征聚合
在线阅读 下载PDF
DepthMamba:多尺度VisionMamba架构的单目深度估计
2
作者 徐志斌 张孙杰 《计算机应用研究》 北大核心 2025年第3期944-948,共5页
在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效... 在单目深度估计领域,虽然基于CNN和Transformer的模型已经得到了广泛的研究,但是CNN全局特征提取不足,Transformer则具有二次计算复杂性。为了克服这些限制,提出了一种用于单目深度估计的端到端模型,命名为DepthMamba。该模型能够高效地捕捉全局信息并减少计算负担。具体地,该方法引入了视觉状态空间(VSS)模块构建编码器-解码器架构,以提高模型提取多尺度信息和全局信息的能力。此外,还设计了MLPBins深度预测模块,旨在优化深度图的平滑性和整洁性。最后在室内场景NYU_Depth V2数据集和室外场景KITTI数据集上进行了综合实验,实验结果表明:与基于视觉Transformer架构的Depthformer相比,该方法网络参数量减少了27.75%,RMSE分别减少了6.09%和2.63%,验证了算法的高效性和优越性。 展开更多
关键词 单目深度估计 Vmamba Bins深度预测 状态空间模型
在线阅读 下载PDF
基于高效加性注意力的级联式特征融合息肉分割网络
3
作者 李萌 张孙杰 《中国生物医学工程学报》 北大核心 2025年第4期447-456,共10页
为解决大多数息肉分割方法存在的局部和全局信息交互不足、相邻层不同深度间的特征弱相关性问题,本研究提出了一种基于金字塔视觉Transformer和自注意力机制级联解码器的网络模型(PVT-SMCD)。首先,以PVTv2为骨干网络提取图像特征,通过... 为解决大多数息肉分割方法存在的局部和全局信息交互不足、相邻层不同深度间的特征弱相关性问题,本研究提出了一种基于金字塔视觉Transformer和自注意力机制级联解码器的网络模型(PVT-SMCD)。首先,以PVTv2为骨干网络提取图像特征,通过高效加性注意力获取关键信息,捕捉长距离依赖关系;其次,引入多核卷积增强块定位息肉的高级语义特征,将其输入到级联解码器中实现局部和全局间的信息交互;最后,利用特征融合模块自上而下逐步融合相邻层间的特征以减少高维特征与低维特征间的信息差距。所提出模型在5个息肉分割数据集上与其他8种医学图像分割网络进行对比,其中在Kvasir和CVC-ClinicDB数据集上,mDice分别为92.3%、94.5%,mIoU为87.1%、89.9%,MAE分别为0.021和0.006;在CVC-300上,mDice和mIoU分别达到了90%和83.3%,MAE为0.007;在CVC-ColonDB上mDice为81.5%,mIoU为73.5%,MAE为0.028;在ETIS数据集上,mDice为78.9%,mIoU为71.3%,MAE为0.019。实验结果表明,PVT-SMCD在绝大多数评价指标上均优于对比模型,展现出更优异的学习能力和泛化性能,能够实现更精准的息肉分割效果。 展开更多
关键词 息肉分割 金字塔视觉Transformer 级联解码器 高效加性注意力
在线阅读 下载PDF
一种多尺度自适应池化的小样本分类方法
4
作者 柳占强 张孙杰 +1 位作者 董驰静 刘梓玉 《小型微型计算机系统》 北大核心 2025年第7期1692-1698,共7页
通过有限的训练样本训练分类器,小样本学习能够对新的视觉对象进行分类,但普遍存在提取特征信息丢失,判别能力较差等问题.本文基于多尺度克罗内克积关系网络(MsKPRN)模型框架,提出一种新颖的Adaptive Atrous Spatial Pyra-mid Pooling(A... 通过有限的训练样本训练分类器,小样本学习能够对新的视觉对象进行分类,但普遍存在提取特征信息丢失,判别能力较差等问题.本文基于多尺度克罗内克积关系网络(MsKPRN)模型框架,提出一种新颖的Adaptive Atrous Spatial Pyra-mid Pooling(Adaptive-ASPP)模块.首先,通过对特征信息进行四种不同感受野的扩张,提取不同视野的特征图信息,并利用四种不同膨胀率特征融合方法将不同感受野的信息进行融合,以缓解特征信息丢失的问题.接着,采用微调的通道注意力和空间注意力相结合的方法,专注于通道级别的特征细节信息,以提高特征的判别能力和分类的准确性.最后,利用克罗内克积关系网络生成空间相关图,以更清晰地捕捉特征位置的相关性,从而提高分类的准确性.本文所提出模型在miniImageNet、Stanford Cars、Stanford Dogs、CUB-200数据集上与常见的方法进行比较,相比于MsKPRN模型在1-shot上分别提高0.7%、5.8%、1.1%、10.6%;在5-shot上分别提高0.9%、2.5%、0.7%、9.3%,有效提高关系网络算法在小样本条件下的分类准确性. 展开更多
关键词 小样本学习 多尺度特征 注意力机制 关系网络
在线阅读 下载PDF
基于创新实践能力培养的精准分层教学 被引量:59
5
作者 王永雄 丁德瑞 +1 位作者 宋燕 张孙杰 《中国电化教育》 CSSCI 北大核心 2017年第12期109-114,共6页
创新实践能力培养是当今高等教育的重要目标,特别是机器人、人工智能等跨多专业的新工科的快速发展,对现有的教学和培养模式提出了更高的要求。精准教学是面向知识教学的精准、系统的评估方法。该文借助精准教学的精准评估策略和良好的... 创新实践能力培养是当今高等教育的重要目标,特别是机器人、人工智能等跨多专业的新工科的快速发展,对现有的教学和培养模式提出了更高的要求。精准教学是面向知识教学的精准、系统的评估方法。该文借助精准教学的精准评估策略和良好的教学效果,结合传统集中式高效的授课方式,将精准教学与传统的集中教学模式实现无缝对接,提出了"分组+阶段+模块"的分层精准教学模式,"分组"进行广度上的专业基础知识教学,"阶段"进行深度上的知识学习,"模块"实施功能导向式的培养。同时差异化分组策略可以激发学生的竞争意识,提升学习兴趣,有助于形成良好的学习和研究氛围,从而提高学生的解决问题和创新实践能力。 展开更多
关键词 精准教学 创新实践 分层教学 教学模式
在线阅读 下载PDF
融合交互信息和能量特征的三维复杂人体行为识别 被引量:4
6
作者 王永雄 曾艳 +3 位作者 李璇 尹钟 张孙杰 刘丽 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1828-1834,共7页
基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能... 基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能、姿态势能、关节点位置等构建了局部特征矩阵,并聚类为词袋(Bag Of Word,BOW),与交互物体特征构成最终的组合特征;为了自动分割交互物体,我们提出了基于Harris角点的种子区域生长法,快速完整地分割手持物体;最后利用RBFSVM方法进行人体行为识别.实验结果表明融合交互物体信息和能量特征的三维人体行为识别方法具有较高的识别率,尤其能够较大幅度降低易混淆复杂动作的误识别率. 展开更多
关键词 人体行为识别 HU矩 能量特征 词袋 SVM
在线阅读 下载PDF
基于改进的YOLOv3及其在遥感图像中的检测 被引量:9
7
作者 陈磊 张孙杰 王永雄 《小型微型计算机系统》 CSCD 北大核心 2020年第11期2321-2324,共4页
为进一步提高遥感图像的小目标识别率,本文提出一种基于双向金字塔特征融合的卷积神经网络.首先将网络最后一层的卷积层特征输出与相邻上一层的卷积层特征输出相结合,构成自顶向下的金字塔特征层,还考虑将浅层的卷积层特征输出与相邻下... 为进一步提高遥感图像的小目标识别率,本文提出一种基于双向金字塔特征融合的卷积神经网络.首先将网络最后一层的卷积层特征输出与相邻上一层的卷积层特征输出相结合,构成自顶向下的金字塔特征层,还考虑将浅层的卷积层特征输出与相邻下一层的卷积层特征输出相结合,构成自底向上的金字塔特征层,融合双向结合的金字塔特征.其次为保留更多小目标空间位置信息,将网络的第一个降采样层改为两个3×3的卷积层.此外利用K-means++聚类算法对目标候选框的个数和宽高比进行聚类分析.最后采用1×1的卷积减小网络模型的维度,提高网络的检测速度.在VEDAI和NWPU VHR-10公开数据集的识别实验结果表明,改进后的YOLOv3识别准确率要高于原网络模型,且检测速度几乎保持不变. 展开更多
关键词 遥感图像 融合双向金字塔特征 卷积神经网络 K-means++
在线阅读 下载PDF
融合多尺度特征的工业缺陷检测模型 被引量:5
8
作者 何思锐 张孙杰 王永雄 《小型微型计算机系统》 CSCD 北大核心 2023年第5期1029-1034,共6页
利用照相机成像对工业环境中的物体进行表面缺陷检测是自动检测的主要应用之一.近年来,生产规模的扩大对缺陷的快速检测提出了要求,传统方法难以达到较高的效率.同时,缺陷检测更注重对纹理特征的提取,通用的深度卷积网络不能直接应用于... 利用照相机成像对工业环境中的物体进行表面缺陷检测是自动检测的主要应用之一.近年来,生产规模的扩大对缺陷的快速检测提出了要求,传统方法难以达到较高的效率.同时,缺陷检测更注重对纹理特征的提取,通用的深度卷积网络不能直接应用于该任务.为了克服以上挑战,本文提出了一种基于单阶段目标检测算法的表面缺陷检测模型,通过更宽的骨干网络提取丰富的上下文信息,进行多尺度特征融合,针对不同的检测目标采用差异化的检测头部;同时引入注意力机制,提高特征利用率;为了验证所提出方法的有效性,在3个数据集上进行了实验,取得了较好的性能,并与其他模型进行比较,表明所提出的方法优于现有方法. 展开更多
关键词 卷积神经网络 缺陷检测 多尺度特征融合 注意力机制
在线阅读 下载PDF
基于多任务学习CNN辅助Transformer的手部mesh重建 被引量:2
9
作者 谢苏 张孙杰 +1 位作者 王永雄 颜婷丽 《计算机应用研究》 CSCD 北大核心 2022年第12期3830-3836,共7页
针对当前手势姿态估计算法未充分利用2D信息辅助3D手部mesh重建的问题,首次在手部Mask、2D热力图的基础上提出引入RGB图像的HOG特征图,通过多任务学习CNN的框架对2D信息进行特征提取,并针对手的拓扑结构进行信息融合增强。为了解决Trans... 针对当前手势姿态估计算法未充分利用2D信息辅助3D手部mesh重建的问题,首次在手部Mask、2D热力图的基础上提出引入RGB图像的HOG特征图,通过多任务学习CNN的框架对2D信息进行特征提取,并针对手的拓扑结构进行信息融合增强。为了解决Transformer encoder中的隐层embeddings维度一致性以及参数过大问题,设计了一种新的MLP(multi-layer perception)模块嵌入Transformer encoder之间,达到embeddings的数量渐进增加以及其维度渐进减少的目的,从而完成手部mesh精细化的预测。实验结果表明该CNN与Transformer混合的新框架在FreiHAND和RHD数据集均取得了较好效果。 展开更多
关键词 手势姿态估计 手部mesh重建 HOG特征 多任务学习 TRANSFORMER
在线阅读 下载PDF
一种改进U型神经网络的医学细胞核图像分割方法 被引量:5
10
作者 周志 张孙杰 张晓玥 《小型微型计算机系统》 CSCD 北大核心 2023年第1期110-116,共7页
在细胞核分割任务中,存在细胞核的边缘轮廓信息模糊以及细胞核和背景的对比度低造成难以分割的问题.针对此问题,常规的U-Net模型通过跳跃连接在降采样和上采样过程中结合高低层次的信息,具有较好的分割效果.但是,在细胞核边界的分割上... 在细胞核分割任务中,存在细胞核的边缘轮廓信息模糊以及细胞核和背景的对比度低造成难以分割的问题.针对此问题,常规的U-Net模型通过跳跃连接在降采样和上采样过程中结合高低层次的信息,具有较好的分割效果.但是,在细胞核边界的分割上仍旧存在着一定程度的过分割、欠分割等缺陷.由此本文提出一种改进的U-Net网络模型.首先,该模型采用深度特征聚合结构和高级监督的学习方法,巧妙融合不同层级的信息,达到对目标的精准分割;其次在其架构上创新性的加入层次交融模块,该模块学习各个不同层次的重要性,将学到的权重加载到分割图上;同时在嵌套的卷积块中加入注意力机制,抑制冗余特征,使得细胞核和背景更好的分割开来;最后使用改进的混合损失函数解决类不平衡的问题.在dsb2018数据集上进行测试,本方法得到Dice系数为0.8719,交并比达到0.8853.结果表明本方法能够对细胞核进行更好的分割. 展开更多
关键词 深度学习 细胞核分割 自注意力机制 HBM模块 U-Net
在线阅读 下载PDF
融合视频时空域运动信息的3D CNN人体行为识别 被引量:11
11
作者 刘嘉莹 张孙杰 《电子测量技术》 2018年第7期43-49,共7页
为更好地获取视频中人体行为的运动和时间序列信息,提出了一种新颖的融合时空域运动信息的3D卷积神经网络(3DCNN)用于视频的人体行为识别。该网络采用2个连续3D卷积层,再连接池化层,以获得更细致的特征描述,网络同时包含3个Dropout层... 为更好地获取视频中人体行为的运动和时间序列信息,提出了一种新颖的融合时空域运动信息的3D卷积神经网络(3DCNN)用于视频的人体行为识别。该网络采用2个连续3D卷积层,再连接池化层,以获得更细致的特征描述,网络同时包含3个Dropout层,防止网络的过拟合。利用Flatten层实现多维特征输入一维化,提高网络的通用性。使用Adam优化算法自主动态调整学习率和更新权值,并在网络输入层融合了人体运动的4种信息,分别是原始视频段、基于Farnebck的x和y方向光流场以及基于帧差法的视频帧差。3D CNN的多通道自动获取了人体行为视频中基于光流的运动信息和基于帧差的运动目标信息。在KTH和UCF101两个通用人体行为视频数据集的实验结果,验证了提出的融合运动信息通道和运动目标通道的新3D CNN与普通CNN、单通道的3D CNN相比,识别率明显的提高、训练速度明显加快,证明了附加的运动和姿态变化信息对人体行为识别效果有明显的提高。 展开更多
关键词 人体行为识别 3D CNN Farnebck光流 帧差法
在线阅读 下载PDF
基于CAFPN和细化双头解耦的遥感图像目标检测 被引量:4
12
作者 熊娟 张孙杰 +1 位作者 阚亚亚 陈家豪 《应用科学学报》 CAS CSCD 北大核心 2023年第6期989-1003,共15页
针对遥感图像背景的复杂性和图中目标尺寸小、方向任意性导致漏检或错检的问题,提出了一种新颖的目标检测算法。首先,提出一种基于上下文信息增强的特征金字塔网络。在特征提取阶段,自适应融合不同感受野,获得具有丰富语义信息的特征,... 针对遥感图像背景的复杂性和图中目标尺寸小、方向任意性导致漏检或错检的问题,提出了一种新颖的目标检测算法。首先,提出一种基于上下文信息增强的特征金字塔网络。在特征提取阶段,自适应融合不同感受野,获得具有丰富语义信息的特征,减少小目标的信息流失。然后,在回归网络中,使用中心点偏移回归机制实现旋转框的检测,降低冗余锚框带来的计算复杂度。最后,结合双头网络将分类和回归特征解耦,通过注意力机制和极化函数引导的特征细化模块构建适应各自任务的重要特征,使网络能准确地检测目标。在遥感数据集DOTA、HRSC2016和UCAS_AOD上验证网络的有效性,对比于Faster RCNN算法,该算法在3个数据集上获得了8.48%、7.60%和3.10%的精度提升,实现了高性能的遥感图像目标检测。 展开更多
关键词 遥感图像 上下文信息增强 注意力机制 极化函数 特征细化
在线阅读 下载PDF
带有注意力模块的反卷积一阶检测算法研究 被引量:3
13
作者 汤彩芸 张孙杰 裴自强 《小型微型计算机系统》 CSCD 北大核心 2021年第6期1199-1205,共7页
本文提出一种新型的带有注意力模块的反卷积一阶检测器,简称做DSSDA(Deconvolutional Single Shot Detector with Attention Module).整个网络架构主要借鉴DSSD模型,在卷积层后加反卷积上采样进行特征融合,再在融合的特征后嵌入注意力模... 本文提出一种新型的带有注意力模块的反卷积一阶检测器,简称做DSSDA(Deconvolutional Single Shot Detector with Attention Module).整个网络架构主要借鉴DSSD模型,在卷积层后加反卷积上采样进行特征融合,再在融合的特征后嵌入注意力模块,以帮助网络将注意力放在目标上并抑制不重要的信息.注意力模块包括通道注意力和空间注意力两个子模块,作用分别是识别物体类型,以及确定物体位置.两个子模块都分别采用最大池化和平均池化获取全局信息.子模块通过串联形式实现拼接.为了节约计算成本,省略原始的DSSD最后一个上采样过程.在PASCAL VOC和MS COCO公开数据集上验证本文提出的带有注意力模块的反卷积一阶检测器的有效性,结果表明所提模型在目标定位和分类上性能都提升显著. 展开更多
关键词 目标检测 注意力机制 反卷积 多尺度检测
在线阅读 下载PDF
结合transformer多尺度实例交互的稀疏集目标检测 被引量:2
14
作者 阚亚亚 张孙杰 +1 位作者 熊娟 祖奕 《应用科学学报》 CAS CSCD 北大核心 2023年第5期777-788,共12页
为改进稀疏集目标检测方法存在的特征图缺乏空间细节信息、目标特征没有做到全局上下文实例交互、全局语义信息没有得到充分学习等问题,设计了一种结合自适应特征增强和实例特征交互的稀疏集目标检测算法。自适应特征增强模块在特征提... 为改进稀疏集目标检测方法存在的特征图缺乏空间细节信息、目标特征没有做到全局上下文实例交互、全局语义信息没有得到充分学习等问题,设计了一种结合自适应特征增强和实例特征交互的稀疏集目标检测算法。自适应特征增强模块在特征提取过程中利用不同尺度的池化和卷积来丰富高级语义信息,减小低级语义信息背景噪声的干扰,降低目标错检率和漏检率。实例特征交互模块在边界框回归设计中结合transformer的多层注意力,并融合通道注意力和动态卷积网络对建议框的通道信息进行增强,改善了目标的边缘信息,提高了网络的实例特征交互效率。最后在COCO2017数据集与原始网络进行实验对比,平均精度提升了4.2%,其中在大目标上提升了4.6%,在PASCAL VOC数据集上提升了2.7%。 展开更多
关键词 稀疏集目标检测 多尺度特征 实例特征交互 TRANSFORMER
在线阅读 下载PDF
一种自适应感受野卷积神经网络模型 被引量:2
15
作者 金勇逸 张孙杰 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1953-1957,共5页
本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信... 本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷.同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重.相较于一些主流的注意力模块而言,在保证性能提升的同时大幅度缩减了参数量.通过在公开数据集上进行图像分类和目标检测实验验证网络的有效性,结果表明本文提出的网络结构在视觉任务上性能都有较大提升. 展开更多
关键词 自适应感受野 注意力机制 目标检测 图像分类
在线阅读 下载PDF
基于感知推理和外部空间先验特征的图像修复
16
作者 吴鹏 张孙杰 +2 位作者 王永雄 陈远峰 覃海旺 《数据采集与处理》 CSCD 北大核心 2024年第4期933-943,共11页
在基于深度学习的图像修复算法中,当存在大面积掩码时,由于缺乏合理的先验信息指导,修复结果往往会出现伪影和模糊纹理等现象。针对此问题,提出将先验特征与图像预测滤波相结合的图像修复算法。该算法包含两个分支:图像滤波核预测分支... 在基于深度学习的图像修复算法中,当存在大面积掩码时,由于缺乏合理的先验信息指导,修复结果往往会出现伪影和模糊纹理等现象。针对此问题,提出将先验特征与图像预测滤波相结合的图像修复算法。该算法包含两个分支:图像滤波核预测分支和特征推理与图像滤波分支。从图像滤波核预测分支的解码器部分提取特征,利用多尺度外部空间特征融合对掩码区域特征进行重建,并传递给另一分支的解码阶段作为先验特征,为图像修复提供更为丰富的语义信息。然后,在特征推理和图像滤波分支部分引入空间特征感知推理块,它能够过滤掉分散注意力的特征,同时捕捉信息丰富的远距离图像上下文进行推理。最后,使用图像预测滤波核进行过滤消除伪影。在CelebA和Places2数据集上与其他修复网络进行对比实验,证明了该方法在修复质量上的优越性。 展开更多
关键词 图像修复 先验特征 图像预测滤波 特征感知推理 外部空间特征融合
在线阅读 下载PDF
ECG-UNet——基于U型结构的轻量化医学图像分割算法 被引量:1
17
作者 裴刚 张孙杰 +1 位作者 张佳鹏 庞俊 《应用科学学报》 CAS CSCD 北大核心 2024年第6期922-933,共12页
近年来,Transformer模型改善了深度神经网络在传统医学图像分割领域性能欠佳的问题,但因庞大的计算参数量而难以应用于移动端,为此提出一种轻量化网络ECG-UNet。首先,在保持模型性能的前提下,在瓶颈处采用线性映射与注意力相结合的策略... 近年来,Transformer模型改善了深度神经网络在传统医学图像分割领域性能欠佳的问题,但因庞大的计算参数量而难以应用于移动端,为此提出一种轻量化网络ECG-UNet。首先,在保持模型性能的前提下,在瓶颈处采用线性映射与注意力相结合的策略替代普通卷积,以减少网络的参数量;同时,在网络中引入轻量化多层感知机模块,从而在图像中学习到关于分割目标更多的位置信息;其次,使用空洞卷积来获取更大的感受野;最后,在跳跃连接上加入门控注意力机制,增强网络中的特征传播,以相对较小的计算代价换取模型性能的进一步提升。在BUSI和ISIC2018两个数据集上对该模型进行验证,结果表明:本文提出的网络结构相较于当前主流算法,在分割性能更佳的情况下大大降低了计算资源的消耗。 展开更多
关键词 医学图像分割 神经网络 轻量化 门控注意力
在线阅读 下载PDF
融合类增强与多尺度自适应的小样本学习方法
18
作者 董驰静 张孙杰 任涵 《数据采集与处理》 CSCD 北大核心 2024年第3期689-698,共10页
为了解决小样本学习存在特征信息提取不足、难以准确地捕获局部明显特征信息的问题,提出了一种融合类增强与多尺度自适应的小样本学习方法。首先在特征的层面上对图像进行类增强,通过将特征图的每次激活与其邻域相关联来编码丰富的语义... 为了解决小样本学习存在特征信息提取不足、难以准确地捕获局部明显特征信息的问题,提出了一种融合类增强与多尺度自适应的小样本学习方法。首先在特征的层面上对图像进行类增强,通过将特征图的每次激活与其邻域相关联来编码丰富的语义结构,使提取后的类内特征明显,更利于当前的分类任务。其次通过多尺度特征生成来提取不同尺度上图像特征的低层表示。最后对每个尺度上的语义相关矩阵进行权重分配与相似元素最大化计算查询图像与各支持集类别图像之间的语义相似度,多尺度信息进行融合后,对目标图像进行分类。在5-way 1-shot和5-way 5-shot设置中,该方法在miniImageNet数据集上的均值平均精度(mean Average precision,mAP)分别为56.83%和75.76%,在常用细粒度图像数据集Stanford Cars和CUB-200-2011分类基准上分别达到了79.33%和93.92%、66.33%和85.78%,均优于现有方法的最好结果。 展开更多
关键词 小样本学习 类增强 多尺度特征生成 自适应任务注意
在线阅读 下载PDF
一种轻量级的因子分解非局部网络
19
作者 唐亮 张孙杰 刘燕 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1185-1190,共6页
在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块.基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块.LFN模块利用捕捉... 在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块.基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块.LFN模块利用捕捉全局依赖性的非局部操作来提升神经网络的性能并应用于计算机视觉领域.LFN模块是对传统非局部操作的因子分解,通过对水平和垂直两个方向进行分解,网络不仅可以捕捉到像素点之间的长距离依赖关系,而且分解后的非局部操作计算量大幅度下降.然后,通过结合LFN模块和残差模块,我们设计RLFN(Residual Lightweight Factorized Non-local)单元,并基于该单元设计两种改良网络结构分别应用于图像分类和语义分割.最后,本文算法在CIFAR-10和PASCAL VOC2012两个数据集上进行分类及语义分割任务,实验结果表现该算法取得十分优越的性能. 展开更多
关键词 非局部 神经网络 图像分类 语义分割
在线阅读 下载PDF
全尺度上下文融合网络用于医学细胞核分割
20
作者 周志 张孙杰 张晓玥 《控制工程》 CSCD 北大核心 2024年第6期1081-1090,共10页
针对细胞核图像边界模糊、对比度低,且细胞间易发生粘连等特点而导致难以准确分割的问题,本文提出了一种全尺度上下文融合网络用于细胞核的精准分割。首先,该模型结合全局上下文信息,设计了一个高级金字塔传导模块,用于对跳跃连接进行重... 针对细胞核图像边界模糊、对比度低,且细胞间易发生粘连等特点而导致难以准确分割的问题,本文提出了一种全尺度上下文融合网络用于细胞核的精准分割。首先,该模型结合全局上下文信息,设计了一个高级金字塔传导模块,用于对跳跃连接进行重构,为解码器提供全局信息传导流;其次,在编码器顶部创新性地加入了尺度聚合模块,该模块通过自学习可以动态地为不同尺度的目标选择合适的感受野,更好地融合多尺度上下文信息;同时,为了更好地利用最有用的特征通道,在上采样阶段加入了通道注意力机制;最后,使用改进的混合损失函数解决类不平衡的问题。在Data Science Bowl 2018和TCGA 2个数据集上进行实验,结果表明,所提出的算法能够提高对细胞核的分割性能。 展开更多
关键词 深度学习 细胞核分割 APC模块 注意力机制 尺度聚合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部