期刊文献+
共找到2,337篇文章
< 1 2 117 >
每页显示 20 50 100
SLAM导航的堆垛式叉车AGV研究与设计
1
作者 张彦 李恒恒 +1 位作者 肖献强 王家恩 《机械设计与制造》 北大核心 2025年第2期354-357,362,共5页
自动导引车(Automatic Guided Vehicle,AGV)作为智能制造系统的重要组成部分之一,为智能制造系统提供柔性物料搬运,其无人化趋势已是必然。针对此,这里研究开发了基于同步定位与建图(Simultaneous Localization and Map⁃ping,SLAM)导航... 自动导引车(Automatic Guided Vehicle,AGV)作为智能制造系统的重要组成部分之一,为智能制造系统提供柔性物料搬运,其无人化趋势已是必然。针对此,这里研究开发了基于同步定位与建图(Simultaneous Localization and Map⁃ping,SLAM)导航的堆垛垛式叉车AGV,提出了一种基于IEPF算法(Iterative End Point Fit,IEPF)以及最小二乘法的雷达点云线段提取方法,在此基础上,研究基于线段特征匹配的SLAM定位算法,并将设计的SLAM导航算法移植到试验车测试。测试结果表明这里设计的基于激光SLAM导航的堆垛式叉车AGV具有较好的稳定性,能够实现横向7mm、纵向13mm的定位误差,为无人叉车的研究提供了技术支撑。 展开更多
关键词 智能制造 激光导航 线段特征 定位算法
在线阅读 下载PDF
融合多元特征的E-TransUNet模型施工道路要素分类
2
作者 胡荣明 张宵宵 +2 位作者 竞霞 廖雨欣 黄旭昆 《遥感信息》 北大核心 2025年第2期11-19,共9页
针对施工道路影像中因背景信息复杂导致道路提取错分、漏分及边缘粗糙的问题,提出了一种融合多元特征的E-TransUNet模型施工道路要素提取方法。E-TransUNet模型通过设计多元特征增强模块对图像特征信息进行增强;在模型下采样中融入空洞... 针对施工道路影像中因背景信息复杂导致道路提取错分、漏分及边缘粗糙的问题,提出了一种融合多元特征的E-TransUNet模型施工道路要素提取方法。E-TransUNet模型通过设计多元特征增强模块对图像特征信息进行增强;在模型下采样中融入空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)模块,增强网络对道路影像多尺度特征的提取能力;跳跃连接部分加入卷积注意力(convolutional block attention module,CBAM)模块,从不同维度上捕获道路特征之间的相关性;最后组合采用Dice loss和CE loss作为损失函数解决样本数量不均衡问题。结果表明,该方法对施工道路要素的提取在OA、MIoU和MPA指标分别达到了93.30%、80.37%和91.19%,相比其他网络U-Net、DeeplabV3+、Swin-Unet、HRNet和SegFormer提取效果更好,为施工道路提供了准确的要素提取方法。 展开更多
关键词 施工道路提取 特征增强 语义分割 TRaNSFORMER 图像处理
在线阅读 下载PDF
基于点线特征的煤矿井下机器人视觉SLAM算法
3
作者 王莉 臧天祥 苏波 《煤炭科学技术》 北大核心 2025年第5期325-337,共13页
煤矿井下视觉同步定位与地图构建SLAM(Simultaneous Localization and Mapping)应用中,光照变化与低纹理场景严重影响特征点的提取和匹配结果,导致位姿估计失败,影响定位精度。提出一种基于改进定向快速旋转二值描述符ORB(Oriented Fast... 煤矿井下视觉同步定位与地图构建SLAM(Simultaneous Localization and Mapping)应用中,光照变化与低纹理场景严重影响特征点的提取和匹配结果,导致位姿估计失败,影响定位精度。提出一种基于改进定向快速旋转二值描述符ORB(Oriented Fast and Rotated Brief)-SLAM3算法的煤矿井下移动机器人双目视觉定位算法SL-SLAM。针对光照变化场景,在前端使用光照稳定性的Super-Point特征点提取网络替换原始ORB特征点提取算法,并提出一种特征点网格限定法,有效剔除无效特征点区域,增加位姿估计稳定性。针对低纹理场景,在前端引入稳定的线段检测器LSD(Line Segment Detector)线特征提取算法,并提出一种点线联合算法,按照特征点网格对线特征进行分组,根据特征点的匹配结果进行线特征匹配,降低线特征匹配复杂度,节约位姿估计时间。构建了点特征和线特征的重投影误差模型,在线特征残差模型中添加角度约束,通过点特征和线特征的位姿增量雅可比矩阵建立点线特征重投影误差统一成本函数。局部建图线程使用ORB-SLAM3经典的局部优化方法调整点、线特征和关键帧位姿,并在后端线程中进行回环修正、子图融合和全局捆绑调整BA(Bundle Adjustment)。在EuRoC数据集上的试验结果表明,SL-SLAM的绝对位姿误差APE(Absolute Pose Error)指标优于其他对比算法,并取得了与真值最接近的轨迹预测结果:均方根误差相较于ORB-SLAM3降低了17.3%。在煤矿井下模拟场景中的试验结果表明,SL-SLAM能适应光照变化和低纹理场景,可以满足煤矿井下移动机器人的定位精度和稳定性要求。 展开更多
关键词 井下机器人 视觉SLaM 双目视觉 SuperPoint特征 LSD线特征
在线阅读 下载PDF
基于自适应阈值的型钢精确角点FAST检测算法
4
作者 包家汉 孙德尚 +1 位作者 黄建中 胡政 《上海交通大学学报》 北大核心 2025年第5期691-702,共12页
基于机器视觉的在线型钢平直度检测中,对型钢图像关键角点快速、准确地提取是实现精确检测的关键技术问题.针对加速分割检验特征提取(FAST)算法需要人工设定角点筛选阈值和角点提取存在大量伪角点的问题,提出一种自适应阈值生成及校正策... 基于机器视觉的在线型钢平直度检测中,对型钢图像关键角点快速、准确地提取是实现精确检测的关键技术问题.针对加速分割检验特征提取(FAST)算法需要人工设定角点筛选阈值和角点提取存在大量伪角点的问题,提出一种自适应阈值生成及校正策略,能够在自动获取初始阈值的基础上,根据角点数是否达到初始角点集要求对阈值实时校正直至达到适当值,以减少关键角点遗漏.在采用FAST提取角点的基础上,利用最小核心值相似区域(SUSAN)算法剔除伪角点,以保证关键角点提取的有效性.试验证明,这种基于自适应阈值的FAST角点检测算法(FAST-A),在检测环境和对象特性发生变化时,仍然可以准确、快速地检测到型钢关键角点,在为型钢平直度检测实时提供精确角点的基础上,提高角点提取的自适应性. 展开更多
关键词 型钢 角点检测 加速分割检验特征提取算法 最小核心值相似区域算法 自适应阈值
在线阅读 下载PDF
基于CNN-Transformer的电子喉镜病灶及器官分割网络
5
作者 李白芽 《计算机工程》 北大核心 2025年第6期327-337,共11页
在电子喉镜检查中,随着镜头的移动,病灶和器官的形态会发生多种变化,同时病灶和器官与黏膜组织的边界不清晰,导致了对病灶和主要喉部器官进行同步图像分割的准确率不理想。为解决这一问题,提出一种CNN-Transformer双流混合网络。双流混... 在电子喉镜检查中,随着镜头的移动,病灶和器官的形态会发生多种变化,同时病灶和器官与黏膜组织的边界不清晰,导致了对病灶和主要喉部器官进行同步图像分割的准确率不理想。为解决这一问题,提出一种CNN-Transformer双流混合网络。双流混合网络中的卷积神经网络(CNN)分支负责提取细粒度特征,而Transformer分支则负责提取全局语义特征。具体来说,混合网络通过CNN对图像中多种尺度下的细粒度特征进行挖掘,然后将提取到的不同尺度下的CNN特征与Transformer分支提取到的相应尺度下的全局语义特征进行融合。这种双流混合结构既能有效实现捕获到特征的浅层次及局部细节信息表现,同时又能对深层特征和全局信息保持敏感。此外,在进行多层次特征融合前,使用暗部特征强化模块来增强阴影区域图像的特征细节,以保证分割的准确率。为验证方法的有效性,使用了来自不同医疗机构的2425张喉镜手术图像进行实验,并与近期提出的9种方法进行了对比分析,实验结果证明了所提出方法的先进性。 展开更多
关键词 电子喉镜 图像分割 双流混合网络 多尺度特征融合 暗部特征增强
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
6
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
融合边缘特征的DeepLabV3+光伏面板语义分割模型研究 被引量:1
7
作者 沈灵鑫 王银 +2 位作者 李杰 李茂环 李小松 《控制工程》 北大核心 2025年第4期707-719,共13页
对无人机采集的光伏面板图像进行准确的分割提取,是提升光伏组件故障检测精度的前提。针对光伏面板红外图像的分割问题,首先对语义分割网络DeepLabV3+的空洞卷积率进行优化并引入深度可分离膨胀卷积,使模型进一步捕获全局和上下文信息;... 对无人机采集的光伏面板图像进行准确的分割提取,是提升光伏组件故障检测精度的前提。针对光伏面板红外图像的分割问题,首先对语义分割网络DeepLabV3+的空洞卷积率进行优化并引入深度可分离膨胀卷积,使模型进一步捕获全局和上下文信息;然后,设计了基于坎尼边缘检测算法和线段检测算法的边缘特征提取模块,获得细化的光伏面板边缘作为分割网络的补充特征,并通过四通道融合网络和并行融合网络实现了光伏面板的精确分割。实验结果表明,2种融合网络对光伏面板红外图像的分割精度高于DeepLabV3+,并且对不同场景下的光伏面板红外图像均能实现准确分割。 展开更多
关键词 语义分割 DeepLabV3+ 边缘特征 光伏面板
在线阅读 下载PDF
Clustering-driven watershed adaptive segmentation of bubble image 被引量:7
8
作者 周开军 阳春华 +1 位作者 桂卫华 许灿辉 《Journal of Central South University》 SCIE EI CAS 2010年第5期1049-1057,共9页
In order to extract froth morphological feature,a bubble image adaptive segmentation method was proposed.Considering the image's low contrast and weak froth edges,froth image was coarsely segmented by using fuzzy ... In order to extract froth morphological feature,a bubble image adaptive segmentation method was proposed.Considering the image's low contrast and weak froth edges,froth image was coarsely segmented by using fuzzy c means(FCM) algorithm. Through the attributes of size and shape pattern spectrum,the optimal morphological structuring element was determined.According to the optimal parameters,some image noises were removed with an improved area opening and closing by reconstruction operation,which consist of image regional markers,and the bubbles were finely separated from each other by watershed transform.The experimental results show that the structural element can be determined adaptively by shape and size pattern spectrum,and the froth image is segmented accurately.Compared with other froth image segmentation method,the proposed method achieves much high accuracy,based on which,the bubble size and shape features are extracted effectively. 展开更多
关键词 FLOTaTION froth image adaptive segmentation pattern spectrum morphological feature
在线阅读 下载PDF
基于CNN和Efficient Transformer的多尺度遥感图像语义分割算法 被引量:1
9
作者 张振利 胡新凯 +2 位作者 李凡 冯志成 陈智超 《浙江大学学报(工学版)》 北大核心 2025年第4期778-786,共9页
针对现有方法存在遥感图像的多尺度地物特征提取困难和目标边缘分割不准确的问题,提出新的语义分割算法.利用CNN和Efficient Transformer构建双编码器,解耦上下文信息和空间信息.提出特征融合模块加强编码器间的信息交互,有效融合全局... 针对现有方法存在遥感图像的多尺度地物特征提取困难和目标边缘分割不准确的问题,提出新的语义分割算法.利用CNN和Efficient Transformer构建双编码器,解耦上下文信息和空间信息.提出特征融合模块加强编码器间的信息交互,有效融合全局上下文信息和局部细节信息.构建分层Transformer结构提取不同尺度的特征信息,使编码器有效专注不同尺度的物体.提出边缘细化损失函数,缓解遥感图像目标边缘分割不准确的问题.实验结果表明,在ISPRS Vaihingen和ISPRS Potsdam数据集上,所提算法的平均交并比(MIoU)分别为72.45%和82.29%.在SAMRS数据集中的SOTA、SIOR和FAST子集上,所提算法的MIoU分别为88.81%、97.29%和86.65%,总体精度和平均交并比指标均优于对比模型.所提算法在各类不同尺度的目标上有较好的分割性能. 展开更多
关键词 遥感图像 语义分割 双编码器结构 特征融合 Efficient Transformer
在线阅读 下载PDF
基于Deeplabv3+和LK光流的动态视觉SLAM算法
10
作者 周若轩 张瑞乾 +2 位作者 陈勇 袁旭浩 秦慧军 《电子测量技术》 北大核心 2025年第9期149-155,共7页
传统ORB-SLAM3系统在静态环境中表现优秀,但存在动态特征时会引入不必要的噪声,造成特征匹配出现错误,而现有动态SLAM算法难以完整判断潜在动态特征,出现漏检或误检导致定位精度下降。针对这些问题,将语义分割网络Deeplabv3+与LK光流法... 传统ORB-SLAM3系统在静态环境中表现优秀,但存在动态特征时会引入不必要的噪声,造成特征匹配出现错误,而现有动态SLAM算法难以完整判断潜在动态特征,出现漏检或误检导致定位精度下降。针对这些问题,将语义分割网络Deeplabv3+与LK光流法融合进ORB-SLAM3的跟踪线程,首先将Deeplabv3+的主干网络替换为Mobilenetv3,提高语义分割的精度,然后使用语义分割获取潜在动态目标掩码,初步滤除动态特征点,对剩余特征点进行LK光流计算,将光流平均误差作为阈值防止剩余静态特征点过少导致位姿估计失败。相比于原ORB-SLAM3,本文改进的算法在TUM高动态序列的定位精度平均提升了47.92%,与现有优秀动态SLAM算法相比,本文算法在TUM数据集的Walking_static序列取得了最高的定位精度。 展开更多
关键词 同时定位与地图构建 动态环境 语义分割 光流法
在线阅读 下载PDF
基于ASPP模块及特征图加权融合的图像语义分割算法
11
作者 祁新 杜洪波 朱立军 《计算机应用与软件》 北大核心 2025年第3期227-232,267,共7页
针对现有语义分割算法对特征图进行高级语义信息提取时存在部分低、中层级细节信息丢失的问题,提出基于ASPP模块及特征图加权融合的图像语义分割算法。改进算法借助“残差思想”,建立特征提取网络与ASPP模块之间的跳跃连接,融合特征图加... 针对现有语义分割算法对特征图进行高级语义信息提取时存在部分低、中层级细节信息丢失的问题,提出基于ASPP模块及特征图加权融合的图像语义分割算法。改进算法借助“残差思想”,建立特征提取网络与ASPP模块之间的跳跃连接,融合特征图加权,增加ASPP模块提取图像语义信息的能力,减少低、中层部分细节信息丢失,并在相应卷积层后进行批归一化,缓解梯度消失的问题,提高模型的分割性能和运行效率。实验结果表明,特征图的合理融合使得语义分割图边缘细节更好地保留,改进算法分割精度提高,其平均交并比比原模型提高6.8%,频率加权交并比提高5.33%。 展开更多
关键词 语义分割 aSPP模块 特征图加权 平均交并比 频率加权交并比
在线阅读 下载PDF
基于SAM2的腹腔镜手术多目标自动分割方法
12
作者 刘成 张家意 +2 位作者 袁烽 张睿 高欣 《图学学报》 北大核心 2025年第5期969-979,共11页
腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运... 腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运动伪影和烟雾遮挡等干扰进一步影响术中多目标完整分割的鲁棒性。为此,提出基于视觉大模型SAM2的腹腔镜手术多目标自动分割方法(SAM2-MSNet)。采用LoRA+微调策略优化SAM2图像编码器,高效适配腹腔镜图像的纹理特征表达;设计跨尺度特征同步提取模块,实现多尺度目标的精确分割;构建特征关系全局感知模块,增强网络对运动伪影及烟雾遮挡等干扰的鲁棒性;并引入方向梯度直方图驱动的伪标签辅助监督机制,显著提升目标边缘分割精度。实验结果表明,SAM2-MSNet在Endovis2018和AutoLaparo数据集上分别取得了70.2%和69.6%的平均交并比(mIoU),和78.5%和75.0%的平均Dice系数(mDice)。在推理速度与SAM2-UNet相当(23帧/秒VS.25帧/秒)的前提下,其分割精度显著提升了3.0%和6.7%(mIoU)和2.8%和6.8%(mDice)。SAM2-MSNet实现了对腹腔镜手术场景高精度全自动分割,为手术机器人自主化进程提供了关键技术支撑。 展开更多
关键词 腹腔镜手术场景分割 视觉大模型 跨尺度特征同步提取 特征关系全局感知 伪标签辅助监督
在线阅读 下载PDF
融合CNN和Transformer的三维冠状动脉CT图像分割
13
作者 潘成龙 刘立程 潘丹 《电子测量技术》 北大核心 2025年第6期143-151,共9页
冠状动脉的分割有利于医生快速诊断心血管疾病,针对冠状动脉复杂结构和其它血管组织干扰带来的难分割,造成大量碎片分割的问题,保证模型对不同形态结构冠脉分割的自适应能力,提出了一种新的三维冠状动脉分割网络模型CA-SegNet。融合CNN... 冠状动脉的分割有利于医生快速诊断心血管疾病,针对冠状动脉复杂结构和其它血管组织干扰带来的难分割,造成大量碎片分割的问题,保证模型对不同形态结构冠脉分割的自适应能力,提出了一种新的三维冠状动脉分割网络模型CA-SegNet。融合CNN和Transformer为骨干网络,利用其优势和互补性,充分提取冠状动脉的局部和全局特征。通过提出多尺度特征交互模块,提取冠脉多尺度特征的同时进行特征通道之间的交互。在解码阶段,提出注意力加权特征融合模块,分别从空间和通道的角度对特征进行加权融合,使模型更加关注冠状动脉区域。实验结果表明,提出的模型在Dice相似系数、Recall、Precision和HD95值分别达到了81.96%、84.24%、80.11%和14.94,优于当前流行的分割网络模型,验证了CA-SegNet的有效性。 展开更多
关键词 冠状动脉分割 卷积神经网络 TRaNSFORMER 特征融合 注意力机制 多尺度特征
在线阅读 下载PDF
一种基于Transformer特征金字塔的自蒸馏目标分割方法
14
作者 陈雷 杨吉斌 +5 位作者 曹铁勇 郑云飞 王杨 张波 林振华 李文斌 《电子与信息学报》 北大核心 2025年第2期551-560,共10页
为在不增加网络参数规模的情况下提升目标分割性能,该文提出一种基于Transformer特征金字塔的自蒸馏目标分割方法,提升了Transformer分割模型的实用性。首先,以Swin Transformer为主干网构建了像素级的目标分割模型;然后,设计了适合Tran... 为在不增加网络参数规模的情况下提升目标分割性能,该文提出一种基于Transformer特征金字塔的自蒸馏目标分割方法,提升了Transformer分割模型的实用性。首先,以Swin Transformer为主干网构建了像素级的目标分割模型;然后,设计了适合Transformer的蒸馏辅助分支,该分支由密集连接空间空洞金字塔(Dense ASPP)、相邻特征融合模块(AFFM)和得分模块构建而成,通过自蒸馏方式指导主干网络学习蒸馏知识;最后,利用自上而下的学习策略指导模型学习,以保证自蒸馏学习的一致性。实验表明,在4个公开数据集上所提方法均能有效提升目标分割精度,在伪装目标检测(COD)数据集上比次优的Transformer知识蒸馏(TKD)方法的Fβ值提高了约2.29%。 展开更多
关键词 自蒸馏 TRaNSFORMER 目标分割 特征金字塔
在线阅读 下载PDF
基于特征过滤法和Stacking集成学习的无人机影像作物精细分类
15
作者 刘朝辉 杨风暴 张琳 《现代电子技术》 北大核心 2025年第7期1-10,共10页
针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取... 针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取不同作物的颜色和纹理特征,进而计算单类作物特征系数和作物间特征差异系数,实现各典型作物的分类特征过滤法优选;最后,构建融合多种机器学习算法的Stacking集成学习作物分类模型,其中第一层的基学习器选择随机森林、支持向量机、K⁃最近邻算法,第二层的元学习器选择逻辑回归模型,实现多种典型作物精细分类。实验结果表明,所提方法对7种典型作物的总体分类精度和Kappa系数分别为85.2%和83.34%,相比于未进行特征选择的分类结果分别提升了2.18%和3.68%,具有较高的分类精度,为多种典型作物的精细分类提供了新方法。 展开更多
关键词 作物分类 特征选择 Stacking集成学习 植被指数 阈值分割 衍生特征
在线阅读 下载PDF
结合CNN-Transformer的跨模态透明物体分割 被引量:1
16
作者 潘惟兰 张荣芬 +2 位作者 刘宇红 张吉友 孙龙 《计算机工程与应用》 北大核心 2025年第4期222-229,共8页
透明物体具有高透明度、光泽度和特殊质地等视觉特性,这些特性使得物体与背景之间的边界往往模糊不清,导致传统的图像分割算法难以准确识别和分割,因此提出结合CNN-Transformer的跨模态透明物体语义分割算法CTNet。该算法采用CNN和Trans... 透明物体具有高透明度、光泽度和特殊质地等视觉特性,这些特性使得物体与背景之间的边界往往模糊不清,导致传统的图像分割算法难以准确识别和分割,因此提出结合CNN-Transformer的跨模态透明物体语义分割算法CTNet。该算法采用CNN和Transformer混合网络的编码-解码结构跨模态对透明物体类别和位置进行预测,CNN用于提取图像特征,Transformer用于多模态融合(multimodal fusion transformer,MFT);设计边界特征增强注意力模块(enhanced boundary attention module,EBAM),提升图像边缘分割能力;提出多尺度融合解码结构,减少模糊特征。CTNet在RGB-T-Glass数据集上的平均绝对误差(mean absolute error,MAE)为3.3%,交并比(intersection over union,IOU)在包含透明物体和不含透明物体的测试集上分别为90.18%和95.00%;在GDD数据集上,MAE为6.9%,IOU为87.6%。实验结果表明,CTNet利用可见光和热红外图像成功实现了对透明物体的准确分割,满足目标任务中对透明物体分割时的精确性和鲁棒性要求。 展开更多
关键词 CNN-Transformer 多模态 透明物体 语义分割 特征融合
在线阅读 下载PDF
基于Transformer的报纸版面分割方法研究
17
作者 朱一凡 高华 业宁 《南京师大学报(自然科学版)》 北大核心 2025年第1期109-118,共10页
大数据背景下信息的检索与研究对海量传统纸媒的数字化提出了挑战,得益于不断发展的计算机视觉与人工智能方法,DETR模型可被应用于报纸版面分割.针对原模型在版面分割中存在的检测速度慢、参数量大及分类不精准等问题,本文提出了采用Shu... 大数据背景下信息的检索与研究对海量传统纸媒的数字化提出了挑战,得益于不断发展的计算机视觉与人工智能方法,DETR模型可被应用于报纸版面分割.针对原模型在版面分割中存在的检测速度慢、参数量大及分类不精准等问题,本文提出了采用ShuffleNet V2轻量级主干网络的改进模型,该方法可有效提升计算效率并减少模型参数量,从而缓解Transformer结构的计算压力.同时,通过特征金字塔结构,该模型能够充分融合全局信息及细节信息,显著增强多尺度目标的识别能力.此外,该模型还引入高效通道注意力(ECA)模块来提取关键目标特征,以此有效抑制无关背景信息,在保证分割性能的同时实现轻量化设计.实验结果表明,改进模型在报纸版面分割任务中的参数量为38.5 M,帧率(FPS)高达47.5 img/s,mAP_(0.5)达到了0.806.与原DETR模型相比,改进模型在参数量上减少了2.8 M,帧率提高了28.3 img/s,mAP_(0.5)提升了3.2%.本文提出的模型还可以为报纸版面的OCR识别提供前期技术支持. 展开更多
关键词 版面分割 DETR ShuffleNet V2 特征金字塔 ECa通道注意力
在线阅读 下载PDF
基于多尺度聚合与高分辨率增强的CTA脑血管分割模型
18
作者 张天旭 黄慧 +5 位作者 黄丙仓 马燕 徐傲 李晓艳 周孝雯 刘之之 《计算机工程》 北大核心 2025年第4期37-46,共10页
在颅脑CT血管造影(CTA)图像中,脑血管形态各异、分布分散且不同患者之间差异较大。这导致利用U-Net进行血管分割时对血管局部形态的适应性不足,容易忽略分散目标之间的相关性,且在下采样过程中会丢失小尺度血管信息。针对以上问题,在U-... 在颅脑CT血管造影(CTA)图像中,脑血管形态各异、分布分散且不同患者之间差异较大。这导致利用U-Net进行血管分割时对血管局部形态的适应性不足,容易忽略分散目标之间的相关性,且在下采样过程中会丢失小尺度血管信息。针对以上问题,在U-Net的基础上进行改进,提出一种基于多尺度聚合和高分辨率增强的血管分割网络BVU-Net。在编码器的瓶颈层设计一种结合空洞变形金字塔(DDP)路径与全局注意力(GA)路径的多尺度特征聚合(MSFA)模块,旨在同时捕获血管的不同尺度的局部形态特征和全局空间相关性特征。在跳跃连接路径中设计高分辨率特征增强(HRFE)模块,使模型能充分利用语义信息更丰富的高级特征,提高浅层高分辨率特征的表征能力,补充小血管信息,进一步提升血管分割精度。BVU-Net模型在公开数据集3D-IRCADb和私有数据集GLCTA上进行实验验证,Dice指标分别达到0.787 2和0.924 8,平均交并比(MIoU)指标分别达到0.832 2和0.932 1。上述结果表明,BVU-Net模型的表现优于其他基于U-Net的改进分割模型,具有一定泛化能力,为后续的临床治疗和预后分析提供了更有力的参考。 展开更多
关键词 脑血管分割 急性缺血性卒中 多尺度特征聚合 高分辨率增强 可变形卷积
在线阅读 下载PDF
基于DeepLabV3+的语义分割算法研究
19
作者 谢生龙 邵金菊 +2 位作者 韦翔普 孙福昌 单少飞 《重庆理工大学学报(自然科学)》 北大核心 2025年第5期20-28,共9页
针对现有道路场景语义分割算法存在准确性和实时性不兼容的问题,在DeepLabV3+基础上提出一种引入注意力机制的高效语义分割算法。提出一种并行主干特征提取网络来并行提取输入图像的语义信息和空间细节信息;改进通道域和空间域注意力机... 针对现有道路场景语义分割算法存在准确性和实时性不兼容的问题,在DeepLabV3+基础上提出一种引入注意力机制的高效语义分割算法。提出一种并行主干特征提取网络来并行提取输入图像的语义信息和空间细节信息;改进通道域和空间域注意力机制模块并应用于主干特征提取网络之后;提出一个特征融合及上采样模块获取最终的图像分割结果。在Cityscapes数据集上验证所提算法的性能,结果表明:所提算法的平均交并比mIoU为74.54%,平均像素精度mPA为84.93%,处理一张图片的时间仅需45 ms;在模型分割精度和分割速度上达到更好的均衡,满足了自动驾驶系统对道路场景分割的要求。 展开更多
关键词 道路场景 语义分割 并行特征提取网络 注意力机制
在线阅读 下载PDF
基于DB-PATNet的棉布瑕疵小样本语义分割
20
作者 杨正达 李波 +2 位作者 苏莲花 姚为 田淙文 《计算机工程与设计》 北大核心 2025年第6期1803-1809,共7页
针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块... 针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块,增强模型对新类样本和新域样本的泛化能力。实验结果表明,DB-PATNet网络的mIoU在5-shot设置中相较于PATNet网络提升了2.67%,相比RePRI网络提升了8.84%。在跨域实验中,mIoU在1-shot设置中达到了57.61%,在5-shot设置中达到了64.43%,接近常规语义分割网络的性能。 展开更多
关键词 棉布瑕疵 小样本学习 语义分割 双分支解码器结构 双向指导策略 自注意力 特征转换
在线阅读 下载PDF
上一页 1 2 117 下一页 到第
使用帮助 返回顶部