期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
基于Mask R-CNN的复杂环境下辣椒识别方法研究 被引量:4
1
作者 付晓鸽 李涵 +1 位作者 左治江 杜铮 《中国农机化学报》 北大核心 2024年第9期215-219,共5页
针对辣椒采摘机器人在真实场景中辣椒簇状、粘连和光照不均导致无法精准采摘辣椒的问题,提出一种基于Mask R-CNN实例分割网络模型的辣椒识别方法。以真实场景下的辣椒为研究对象,采集自然生长的辣椒图像4496张,对其中的4000张进行数据... 针对辣椒采摘机器人在真实场景中辣椒簇状、粘连和光照不均导致无法精准采摘辣椒的问题,提出一种基于Mask R-CNN实例分割网络模型的辣椒识别方法。以真实场景下的辣椒为研究对象,采集自然生长的辣椒图像4496张,对其中的4000张进行数据标注作为数据集,通过设置不同的学习率、训练周期和模型网络层对数据集进行训练。试验结果表明,Mask R-CNN网络模型对真实场景下辣椒的识别和分割效果较好,平均准确率达到90.34%,平均速度达到0.82 s/幅,为智能辣椒采摘机器人的辣椒分割识别和定位提供有力的技术支撑。 展开更多
关键词 辣椒识别 实例分割 mask r-cnn 神经网络 采摘机器人
在线阅读 下载PDF
基于改进Mask R-CNN的堆积式袋装炸药识别方法研究
2
作者 付晓鸽 左治江 李涵 《中国测试》 CAS 北大核心 2024年第10期81-86,共6页
针对爆破场景下,光照变化、袋装炸药紧密堆积以及袋与袋粘连导致边界模糊等问题,提出一种基于改进Mask R-CNN的堆积式袋装炸药识别方法。该文在Mask R-CNN的基础上采用空洞卷积代替普通卷积,引入“扩张率”参数,使得袋装炸药的边缘特征... 针对爆破场景下,光照变化、袋装炸药紧密堆积以及袋与袋粘连导致边界模糊等问题,提出一种基于改进Mask R-CNN的堆积式袋装炸药识别方法。该文在Mask R-CNN的基础上采用空洞卷积代替普通卷积,引入“扩张率”参数,使得袋装炸药的边缘特征得到充分保留。利用Faster R-CNN网络模型、FCN网络模型、Mask R-CNN网络模型和改进Mask R-CNN网络模型对相同的数据集进行检测,对比袋装炸药边缘分割的效果。实验结果表明:该文提出基于改进Mask R-CNN的堆积式袋装炸药识别方法对袋装炸药边缘信息保存较为完整,平均准确率达到90.42%,平均速度达到0.67 s/piece,为袋装炸药装卸搬运实现更高程度的自动化提供有力的技术支撑。 展开更多
关键词 实例分割 mask r-cnn 堆积式袋装炸药 神经网络
在线阅读 下载PDF
基于Mask R-CNN的柑橘主叶脉显微图像实例分割模型 被引量:7
3
作者 翁海勇 李效彬 +3 位作者 肖康松 丁若晗 贾良权 叶大鹏 《农业机械学报》 EI CAS CSCD 北大核心 2023年第7期252-258,271,共8页
针对目前植物解剖表型的测量与分析过程自动化低,难以应对复杂解剖表型的提取和识别的问题,以柑橘主叶脉为研究对象,提出了一种基于掩膜区域卷积神经网络(Mask region convolutional neural network,Mask R-CNN)的主叶脉显微图像实例分... 针对目前植物解剖表型的测量与分析过程自动化低,难以应对复杂解剖表型的提取和识别的问题,以柑橘主叶脉为研究对象,提出了一种基于掩膜区域卷积神经网络(Mask region convolutional neural network,Mask R-CNN)的主叶脉显微图像实例分割模型,以残差网络ResNet50和特征金字塔(Feature pyramid network,FPN)为主干特征提取网络,在掩膜(Mask)分支上添加一个新的感兴趣区域对齐层(Region of interest Align,RoI-Align),提升Mask分支的分割精度。结果表明,该网络架构能够精准地对柑橘主叶脉横切面中的髓部、木质部、韧皮部和皮层细胞进行识别分割。Mask R-CNN模型对髓部、木质部、韧皮部和皮层细胞的分割平均精确率(交并比(IoU)为0.50)分别为98.9%、89.8%、95.7%和97.2%,对4个组织区域的分割平均精确率均值(IoU为0.50)为95.4%。与未在Mask分支添加RoI-Align的Mask R-CNN相比,精度提升1.6个百分点。研究结果表明,Mask R-CNN模型对柑橘主叶脉各类组织区域具有良好的识别分割效果,可为柑橘微观表型研究提供技术支持与研究基础。 展开更多
关键词 柑橘主叶脉 显微图像 掩膜区域卷积神经网络 实例分割 微观表型
在线阅读 下载PDF
人体关键点检测的Mask R-CNN网络模型改进研究 被引量:8
4
作者 宋玲 夏智敏 《计算机工程与应用》 CSCD 北大核心 2021年第1期150-160,共11页
由于在现有的人体关键点检测问题中,深度学习解决方案采用的掩膜区域卷积神经网络Mask R-CNN存在参数量大导致计算成本过高、迭代次数多导致训练时间过长等问题,提出了一种基于重组通道网络ShuffleNet改进Mask R-CNN网络模型。通过引入S... 由于在现有的人体关键点检测问题中,深度学习解决方案采用的掩膜区域卷积神经网络Mask R-CNN存在参数量大导致计算成本过高、迭代次数多导致训练时间过长等问题,提出了一种基于重组通道网络ShuffleNet改进Mask R-CNN网络模型。通过引入ShuffleNet的网络结构,使用分组逐点卷积与通道重排的操作与联合边框回归和掩膜分割的计算结果对Mask R-CNN进行轻量化改进。使用该方法改进网络模型在进行单人或多人情况下的人体关键点检测中,在保留精度的前提下,可以加快运行速度,减少检测时间。 展开更多
关键词 深度学习 卷积神经网络(CNN) 掩膜区域卷积神经网络(mask r-cnn) 重组通道网络 人体关键点检测
在线阅读 下载PDF
基于Mask R-CNN的铁谱磨粒智能分割与识别 被引量:6
5
作者 安超 魏海军 +2 位作者 刘竑 梁麒立 汪璐璐 《润滑与密封》 CAS CSCD 北大核心 2020年第3期107-112,共6页
针对铁谱图像因背景复杂、尺寸分布广、颗粒重叠等导致难以精确分割与识别的问题,以相似度高的疲劳剥块、严重滑动磨粒、层状磨粒共3种异常磨粒作为研究对象,提出基于深度神经网络模型Mask R-CNN的对多目标铁谱磨粒进行智能分割与识别... 针对铁谱图像因背景复杂、尺寸分布广、颗粒重叠等导致难以精确分割与识别的问题,以相似度高的疲劳剥块、严重滑动磨粒、层状磨粒共3种异常磨粒作为研究对象,提出基于深度神经网络模型Mask R-CNN的对多目标铁谱磨粒进行智能分割与识别的方法,并对特征提取层分别选用深度不同的残差网络ResNet50和ResNet101进行对比试验。实验结果表明,基于迁移学习方法的Mask R-CNN+ResNet101模型能够在复杂背景下对多目标、多类型、多尺寸的相似磨粒进行有效分割与识别,测试集的平均精度高达76.2%,模型具有较好的泛化能力。 展开更多
关键词 深度神经网络 铁谱磨粒 迁移学习 mask r-cnn 分割与识别
在线阅读 下载PDF
基于改进的Mask R-CNN的染色体图像分割框架 被引量:9
6
作者 冯涛 陈斌 张跃飞 《计算机应用》 CSCD 北大核心 2020年第11期3332-3339,共8页
针对染色体图像的人工分割耗时费力且当前自动分割方法精度不佳的问题,基于改进的Mask R-CNN提出了一种染色体图像分割框架——Mask Oriented R-CNN,引入方向信息对染色体图像进行实例分割。首先,新增有向包围框回归分支,以预测紧实包... 针对染色体图像的人工分割耗时费力且当前自动分割方法精度不佳的问题,基于改进的Mask R-CNN提出了一种染色体图像分割框架——Mask Oriented R-CNN,引入方向信息对染色体图像进行实例分割。首先,新增有向包围框回归分支,以预测紧实包围框并获取方向信息;然后,提出新的交并比(IoU)度量——角度加权交并比(AwIoU),从而结合方向信息与边的关系以改进冗余包围框的判据;最后,实现有向卷积通路结构,通过拷贝掩模分支通路并依据实例的方向信息选择训练路径来减少掩模预测中的干扰。实验结果表明,相较于基准模型Mask R-CNN,Mask Oriented R-CNN在IoU阈值为0.5时的平均精度均值指标提升了10.22个百分点,IoU阈值为0.5~0.95时的平均指标提升了4.91个百分点。研究结果显示,Mask Oriented R-CNN框架相较于基准模型取得了更好的染色体图像分割结果,有助于实现染色体图像自动分割。 展开更多
关键词 卷积神经网络 实例分割 mask r-cnn 染色体图像分割 图像分割 非极大值抑制 交并比
在线阅读 下载PDF
基于改进Mask R-CNN的轨道扣件状态检测方法 被引量:9
7
作者 许贵阳 李金洋 +1 位作者 白堂博 杨建伟 《中国铁道科学》 EI CAS CSCD 北大核心 2022年第1期44-51,共8页
为提高轨道扣件状态检测的准确率,基于K均值聚类算法改进掩膜区域卷积神经网络(Mask R-CNN)实例分割算法中的区域建议网络。进行基于改进Mask R-CNN的轨道扣件状态检测方法研究,并将该方法分别应用于普速铁路有砟轨道2个扣件数据集和高... 为提高轨道扣件状态检测的准确率,基于K均值聚类算法改进掩膜区域卷积神经网络(Mask R-CNN)实例分割算法中的区域建议网络。进行基于改进Mask R-CNN的轨道扣件状态检测方法研究,并将该方法分别应用于普速铁路有砟轨道2个扣件数据集和高速铁路无砟轨道1个扣件数据集上进行轨道扣件状态检测。结果表明:该方法能对普速铁路有砟轨道和高速铁路无砟轨道图像中的扣件状态进行准确检测,扣件的定位准确率和分类准确率平均分别达到97.05%和98.36%,均优于YOLO V3,Faster R-CNN和Mask R-CNN算法;相较于前2种算法,本方法对普速铁路有砟轨道扣件状态检测的优势更为明显。 展开更多
关键词 轨道 扣件 状态检测 掩膜区域卷积神经网络 K均值聚类算法 定位准确率 分类准确率
在线阅读 下载PDF
基于Mask R-CNN网络的磨损颗粒智能识别与应用 被引量:11
8
作者 杨智宏 贺石中 +2 位作者 冯伟 李秋秋 何伟楚 《摩擦学学报》 EI CAS CSCD 北大核心 2021年第1期105-114,共10页
针对设备磨损故障诊断中磨粒识别技术难度高、工作主观经验影响大等问题,采用深度学习技术开展了磨粒智能识别的研究,提出了基于Mask R-CNN卷积神经网络的磨粒数字化表征方法.该方法利用迁移学习训练基于Mask R-CNN网络的磨粒识别模型... 针对设备磨损故障诊断中磨粒识别技术难度高、工作主观经验影响大等问题,采用深度学习技术开展了磨粒智能识别的研究,提出了基于Mask R-CNN卷积神经网络的磨粒数字化表征方法.该方法利用迁移学习训练基于Mask R-CNN网络的磨粒识别模型对图像中磨粒进行识别和实例分割,然后使用Suzuki85算法、迭代算法、等比例计算方法计算出磨粒的真实尺寸,解决了磨粒分析中难定量分析的问题.结果表明:基于Mask R-CNN网络(采用R-101-FPN骨干网络)训练的磨粒识别模型可以对图像中多个异常磨损颗粒进行识别,综合准确率和召回率达到当前图像识别领域的主流水平.辅以上述Suzuki85等算法,成功实现磨粒图像的定量评价分析,对促进设备故障诊断技术的自动化发展和工业应用具有一定的实际应用价值. 展开更多
关键词 卷积神经网络 深度学习 mask r-cnn 磨粒识别 磨粒分析
在线阅读 下载PDF
基于改进的Mask R-CNN的行人细粒度检测算法 被引量:10
9
作者 朱繁 王洪元 张继 《计算机应用》 CSCD 北大核心 2019年第11期3210-3215,共6页
针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2∶5)... 针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2∶5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。 展开更多
关键词 mask r-cnn 行人检测 K-MEANS算法 细粒度 全卷积网络
在线阅读 下载PDF
基于改进的Mask R-CNN的公路裂缝检测算法 被引量:17
10
作者 张跃飞 王敬飞 +2 位作者 陈斌 冯涛 陈志毅 《计算机应用》 CSCD 北大核心 2020年第S02期162-165,共4页
针对复杂场景下,Mask R-CNN检测公路裂缝掩码拟合质量不高的问题,提出一种基于改进的Mask RCNN的路面裂缝检测算法。首先,采用自适应带权重的损失函数,从而以权重的方式让神经网路更加注重细微裂缝的特征;然后,在Mask R-CNN的掩码支路中... 针对复杂场景下,Mask R-CNN检测公路裂缝掩码拟合质量不高的问题,提出一种基于改进的Mask RCNN的路面裂缝检测算法。首先,采用自适应带权重的损失函数,从而以权重的方式让神经网路更加注重细微裂缝的特征;然后,在Mask R-CNN的掩码支路中,添加一个新的比例预测分支来指导损失函数,让神经网路在学习过程中更加注重裂缝的细节信息,进而提升掩码预测的质量。为了验证改进算法的有效性,将其与当前具有代表性的实例分割检测方法(如Mask R-CNN、PANet)在相同数据集上进行对比。实验结果表明,改进的算法提升了掩码拟合的质量,增加了检测精度。 展开更多
关键词 公路裂缝检测 深度学习 目标检测 mask r-cnn 实例分割 语义分割
在线阅读 下载PDF
基于LabVIEW和Mask R-CNN的柱塞式制动主缸内槽表面缺陷检测 被引量:6
11
作者 金颖 王学影 段林茂 《现代制造工程》 CSCD 北大核心 2020年第5期125-132,共8页
为了解决传统图像处理方法对于铸铝材料表面缺陷检测通用性不高、准确度低等问题,研究了一种基于Mask R-CNN神经网络的缺陷检测系统。首先,采用自主研发的缺陷检测装置采集柱塞式制动主缸内槽表面图像,对其进行预处理,制作成Microsoft C... 为了解决传统图像处理方法对于铸铝材料表面缺陷检测通用性不高、准确度低等问题,研究了一种基于Mask R-CNN神经网络的缺陷检测系统。首先,采用自主研发的缺陷检测装置采集柱塞式制动主缸内槽表面图像,对其进行预处理,制作成Microsoft COCO格式数据集;其次,搭建适用于该数据集的Mask R-CNN神经网络结构,并绘制训练过程损失函数与平均精度均值曲线;最后,将检测结果与基于SVM和Faster R-CNN模型的检测结果进行比较,统计了3种神经网络模型的单图检测平均时间和识别率。试验结果表明,在相同样本条件下,该方法的识别率比另外2种方法高,达到了93.6%,能够更精确地检测柱塞式制动主缸内槽的表面缺陷。 展开更多
关键词 深度学习 缺陷检测 mask r-cnn 柱塞主缸 卷积神经网络
在线阅读 下载PDF
基于Mask R-CNN的人脸皮肤色斑检测分割方法
12
作者 陈友升 刘桂雄 《激光杂志》 北大核心 2019年第12期19-22,共4页
色斑参数特征是衡量皮肤健康程度的一项重要指标,通过分析国内外研究皮肤色斑图像方法,提出基于Mask R-CNN的人脸皮肤色斑检测分割方法。针对人脸图像中色斑区域小导致的训练样本类别不平衡问题,提出全脸干扰项数据标注方案,有效提高色... 色斑参数特征是衡量皮肤健康程度的一项重要指标,通过分析国内外研究皮肤色斑图像方法,提出基于Mask R-CNN的人脸皮肤色斑检测分割方法。针对人脸图像中色斑区域小导致的训练样本类别不平衡问题,提出全脸干扰项数据标注方案,有效提高色斑检测分割效果;通过分析不同深度的骨干网络对色斑识别效果、时间性能影响,指出ResNet-34骨干网络在色斑识别效果、时间性能达到较佳平衡;基于上述技术构建Mask R-CNN人脸皮肤色斑分割模型并进行实验,结果表明:基于Mask R-CNN的人脸皮肤色斑检测分割方法能够实现不同位置、尺度色斑的检测,J(A,B)值达81.5%。 展开更多
关键词 mask r-cnn 神经网络 深度学习 色斑检测
在线阅读 下载PDF
基于Mask R-CNN倾斜影像筛选的建筑物三维模型高效重建方法 被引量:1
13
作者 樊孝常 梁玉斌 +1 位作者 杨阳 崔铁军 《天津师范大学学报(自然科学版)》 CAS 北大核心 2023年第5期44-50,共7页
为了解决村镇区域建筑实景三维建模效率低下的问题,提出一种基于影像筛选的三维模型重建方法.首先,利用网络开源的建筑检测数据集训练Mask R-CNN神经网络模型;其次,利用训练好的神经网络模型筛选包含建筑的倾斜影像;最后,使用下视影像... 为了解决村镇区域建筑实景三维建模效率低下的问题,提出一种基于影像筛选的三维模型重建方法.首先,利用网络开源的建筑检测数据集训练Mask R-CNN神经网络模型;其次,利用训练好的神经网络模型筛选包含建筑的倾斜影像;最后,使用下视影像和筛选的倾斜影像对研究区进行三维重建.本研究使用Mask R-CNN神经网络模型从9775张无人机影像中自动筛选出7451张包含建筑的影像.实验结果表明,基于影像筛选的增量式三维重建法比常规方法节省了49.4%的数据处理时间,其空三重投影均方根误差和密集重建结果与常规方法一致. 展开更多
关键词 无人机 倾斜摄影测量 mask r-cnn神经网络 影像筛选 运动结构恢复算法
在线阅读 下载PDF
Mask RCNN在雾化背景下的船舶流量检测 被引量:3
14
作者 聂振钢 任静 卢继华 《北京理工大学学报》 EI CAS CSCD 北大核心 2020年第11期1223-1229,共7页
基于掩码区域卷积神经网络(Mask region-convolutional neural network,Mask RCNN)模型检测海域卫星航拍图片中的船舶流量检测,实现雾化与模糊背景下的自动检测船舶数量与船只定位.基于搭建的Mask RCNN网络模型进行训练,依据输出的船只... 基于掩码区域卷积神经网络(Mask region-convolutional neural network,Mask RCNN)模型检测海域卫星航拍图片中的船舶流量检测,实现雾化与模糊背景下的自动检测船舶数量与船只定位.基于搭建的Mask RCNN网络模型进行训练,依据输出的船只位置,与准确位置对比,不断调整模型参数提升准确度,再用训练好的模型参数对测试集中的图片进行检测.训练后进行测试的结果为:重叠度(intersection over union,IOU)取0.5时,边界框位置准确度达85.4%,船只数量检测准确度高达89.9%.上述结果表明,Mask RCNN网络模型可实现高精度的船舶流量监测. 展开更多
关键词 掩码区域卷积神经网络 船只位置 船舶流量 掩码 准确度
在线阅读 下载PDF
基于改进Mask RCNN和Kinect的服务机器人物品识别系统 被引量:27
15
作者 石杰 周亚丽 张奇志 《仪器仪表学报》 EI CAS CSCD 北大核心 2019年第4期216-228,共13页
服务机器人在近年来得到了快速的发展,其应用的算法也在不断地更迭,目标检测算法便是其中之一。在保证目标检测精度的前提下,目标检测速度决定着机器人目标物抓取的效率。因此将远距离小目标场景作为测试场景,改进现有网络模型,目的是... 服务机器人在近年来得到了快速的发展,其应用的算法也在不断地更迭,目标检测算法便是其中之一。在保证目标检测精度的前提下,目标检测速度决定着机器人目标物抓取的效率。因此将远距离小目标场景作为测试场景,改进现有网络模型,目的是在保证检测精度的前提下提升检测速度。掩码区域卷积神经网络(Mask RCNN)是目前目标检测领域应用较广的算法,通过对其网络结构研究发现,掩码分支和过多的全连接层会占用大量网络检测时间;同时,Mask RCNN提取到的特征图具有较高的维度,其会占用大量的计算内存,产生大量的计算任务。为此,Mask RCNN进行改进,如去掉掩码分支和多余的全链接层;将头部轻量化区域卷积神经网络(LH-RCNN)引入到Mask RCNN中;调整区域建议网络(RPN)中锚点(Anchor)的比例。最后,本文在带有KinectⅡ的家庭服务机器人平台上对改进的Mask RCNN进行测试,测试结果表明,与原始的Mask RCNN相比,改进的Mask RCNN在保证检测精度的同时,可以大幅提高算法运行的速度,检测时间缩短2倍以上,提高服务机器人目标抓取任务的效率。 展开更多
关键词 服务机器人 物品识别 改进的掩码区域卷积神经网络 头部轻量化掩码区域卷积神经网络 去掉掩码分支
在线阅读 下载PDF
基于Mask RCNN和视觉技术的玉米种子发芽自动检测方法
16
作者 马启良 杨小明 +2 位作者 胡水星 黄子鸿 祁亨年 《浙江农业学报》 CSCD 北大核心 2023年第8期1927-1936,共10页
种子标准发芽试验中,为获取种子发芽和生长情况,需借助人工定时对种子的发芽率、发芽势、芽长和根长等相关指标进行统计和测量,该测定过程费时费力,且易对发芽的幼苗造成损伤。针对这些问题,该研究基于Mask RCNN(基于区域的卷积神经网络... 种子标准发芽试验中,为获取种子发芽和生长情况,需借助人工定时对种子的发芽率、发芽势、芽长和根长等相关指标进行统计和测量,该测定过程费时费力,且易对发芽的幼苗造成损伤。针对这些问题,该研究基于Mask RCNN(基于区域的卷积神经网络)模型和机器视觉技术设计了一种玉米种子发芽自动检测方法。首先,在玉米种子发芽试验的7 d内,每天采集模型训练和测试所需的图像,并用Labelme工具对种子位置进行标注,再利用标注图像训练种子定位模型;其次,根据模型定位出的玉米种子掩膜区域,设定一个监测种子发芽的椭圆区域,自动识别种子发芽状态;最后,利用骨架提取和深度搜索算法实现发芽种子幼苗主骨架线的提取,通过计算种子掩膜的质心坐标位置,实现芽和根长度的分别统计。结果表明,该方法能够有效识别发芽种子,实现发芽试验中玉米种子的发芽率、发芽势、芽长、根长等指标的自动统计,可为种子发芽试验的自动化管理提供技术参考。 展开更多
关键词 标准发芽试验 发芽率 mask RCNN 玉米 骨架提取 芽长 根长
在线阅读 下载PDF
融合关键区域信息的双流网络视频表情识别
17
作者 孔英会 崔文婷 +1 位作者 张珂 车辚辚 《智能系统学报》 北大核心 2025年第3期658-669,共12页
人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息... 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间-时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间-时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE'05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 展开更多
关键词 视频表情识别 双流网络 注意力机制 光流 卷积神经网络 掩模 特征融合 面部表情识别
在线阅读 下载PDF
自适应卷积注意力与掩码结构协同的显著目标检测
18
作者 朱磊 袁金垚 +1 位作者 王文武 蔡小嫚 《电子与信息学报》 北大核心 2025年第1期260-270,共11页
显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点... 显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点的密集预测方式以获取像素显著值,然而该方式不符合基于人类视觉系统的场景解析机制,即人眼通常对语义区域进行整体分析而非关注像素级信息;(2)增强上下文信息关联在SOD任务中受到广泛关注,但通过Transformer主干结构获取长程关联特征不一定具有优势。SOD应更关注目标在适当区域内其中心-邻域差异性而非全局长程依赖。针对上述问题,该文提出一种新的显著目标检测模型,将CNN形式的自适应注意力和掩码注意力集成到网络中,以提高显著目标检测的性能。该算法设计了基于掩码感知的解码模块,通过将交叉注意力限制在预测的掩码区域来感知图像特征,有助于网络更好地聚焦于显著目标的整体区域。同时,该文设计了基于卷积注意力的上下文特征增强模块,与Transformer逐层建立长程关系不同,该模块仅捕获最高层特征中的适当上下文关联,避免引入无关的全局信息。该文在4个广泛使用的数据集上进行了实验评估,结果表明,该文提出的方法在不同场景下均取得了显著的性能提升,具有良好的泛化能力和稳定性。 展开更多
关键词 显著目标检测 卷积神经网络形式的自适应注意力 掩码注意力 特征增强
在线阅读 下载PDF
基于图神经网络与元学习的小样本关系推理模型
19
作者 刘文杰 陈亮 任智杰 《计算机工程》 北大核心 2025年第5期124-132,共9页
知识图谱关系推理旨在推理实体间缺失的链接,当前知识图谱关系推理模型在小样本关系推理上表现不佳,且难以对训练集中未出现的实体进行关系推理。针对以上问题,提出一种基于图神经网络(GNN)与损失权重元学习的知识图谱小样本关系归纳推... 知识图谱关系推理旨在推理实体间缺失的链接,当前知识图谱关系推理模型在小样本关系推理上表现不佳,且难以对训练集中未出现的实体进行关系推理。针对以上问题,提出一种基于图神经网络(GNN)与损失权重元学习的知识图谱小样本关系归纳推理模型。模型利用图神经网络学习目标实体间的子图模式,从而泛化到新实体的关系推理。通过路径掩码策略降低模型对特定子图模式的依赖,捕捉数据中的关键特征和模式,从而提高模型归纳推理泛化能力。基于元学习方法引入分布均衡的元数据集来学习一个自适应损失函数,调整不同样本的损失权重,使模型更关注难以预测的小样本关系,从而提高模型对小样本关系预测的准确度。最后,在归纳链接预测基准数据集FB15k-237和NELL-995中过滤掉没有子图的三元组,并进行链接预测和三元组分类任务,同时对测试集中属于小样本关系的三元组进行评价。实验结果表明,所提模型在归纳推理基准数据集上具有较好的表现,并且在7个小样本数据集上的性能比目前最优的模型平均提升1%左右。 展开更多
关键词 知识图谱 图神经网络 小样本关系预测 路径掩码 损失权重元学习
在线阅读 下载PDF
基于卷积神经网络的建筑物震害特征提取与识别研究
20
作者 徐俊祖 张方浩 +6 位作者 戈云霞 曹彦波 杜浩国 邓树荣 和仕芳 张原硕 赵正贤 《地震工程学报》 北大核心 2025年第4期851-863,共13页
提出一种基于卷积神经网络(CNN)的建筑物震害特征提取与识别方法,以解决传统震害评估方式的空间局限性和低效性问题。通过对震后建筑物进行边框回归、掩膜生成和特征分类,实现震害特征的有效提取和识别。首先,通过收集云南省2014年鲁甸... 提出一种基于卷积神经网络(CNN)的建筑物震害特征提取与识别方法,以解决传统震害评估方式的空间局限性和低效性问题。通过对震后建筑物进行边框回归、掩膜生成和特征分类,实现震害特征的有效提取和识别。首先,通过收集云南省2014年鲁甸6.5级、景谷6.6级和2021年漾濞6.4级地震的建筑物震后无人机影像数据,并利用数据增强方法扩充样本,构建一套典型的云南历史地震建筑物震害数据集;其次,利用这一震害数据集对CNN进行训练和优化,从而得到能够提取建筑物震害特征并进行识别的模型;最后,通过实际震例对模型进行验证。结果表明,所提出的方法能够有效提取建筑物震害特征并进行识别,识别平均精度达87.28%,平均IoU(交并比)为83%,且各影像IoU值均大于0.5。 展开更多
关键词 卷积神经网络 mask r-cnn 建筑物震害特征 震害识别
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部