期刊文献+
共找到1,098篇文章
< 1 2 55 >
每页显示 20 50 100
基于计算机视觉的城市道路噪声实时估计
1
作者 李响 张瑷霖 +2 位作者 李国正 赖本涛 陈梦君 《仪器仪表学报》 北大核心 2025年第2期196-208,共13页
为了实现城市道路视频监控场景下交通流噪声的快速准确估计,提出一种基于计算机视觉的城市道路噪声实时估计方法。首先,从道路交通噪声产生机理分析入手,提出了一系列基于计算机视觉的城市道路交通噪声相关交通流信息提取方法,改善传统... 为了实现城市道路视频监控场景下交通流噪声的快速准确估计,提出一种基于计算机视觉的城市道路噪声实时估计方法。首先,从道路交通噪声产生机理分析入手,提出了一系列基于计算机视觉的城市道路交通噪声相关交通流信息提取方法,改善传统方法提取交通流信息不够便捷的情况。其次,针对传统算法噪声估计准确度不高的问题,进行城市道路交通噪声影响因素分析,将交通流特征与环境特征相结合,构建了基于机器学习的道路交通噪声估计模型,提高了城市道路噪声估计的准确性。最后,分析城市道路交通噪声短时变化规律,确定其尺度可变的特征提取时间窗口,提出了一整套城市道路交通噪声实时估计方案,提升了城市道路噪声估计的实时性。实验结果表明,所提出的基于计算机视觉的交通流信息提取方法较常用的目标检测和目标追踪算法能够更准确的提取城市道路交通噪声相关信息;所建立的城市道路交通噪声估计模型相比传统噪声估计模型有更高的实时性和准确性,相较于现有基于机器学习的噪声估计方法在不同场景下均有着更为准确的估计结果,提高了城市道路噪声估计的准确性和实时性,确定了时间尺度为3和10 min的噪声估计方法,具有实际应用价值。 展开更多
关键词 计算机视觉 交通噪声 特征提取 噪声估计 机器学习
在线阅读 下载PDF
基于云计算的多类型大规模激光图像快速识别研究
2
作者 李洋 张阳 陶锐 《激光杂志》 北大核心 2025年第2期149-153,共5页
大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有... 大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有强大的计算能力和灵活的资源配置优势,研究基于云计算的多类型大规模激光图像快速识别方法。通过非线性匹配方式处理激光图像,确定激光图像中目标点位姿变化矩阵;将处理后的激光图像,以机器算法作特征筛选,划分不同类型激光图像中的关键特征;采用云计算关联方法,构建快速识别模型,通过模型内目标函数,实现多类型大规模激光图像快速识别。实验结果表明:以两组不同类型的连续帧激光图像作为测试样本,所研究方法可以实现设计方案下的快速识别,具有应用价值。 展开更多
关键词 云计算 多类型 大规模 激光图像 快速识别 匹配方式 关键特征
在线阅读 下载PDF
基于符号变量矩阵的改进样本熵算法
3
作者 李彦阳 罗伟 《科学技术与工程》 北大核心 2025年第5期1913-1919,共7页
针对样本熵算法在相空间重构过程中存在冗余运算的问题,通过构建符号变量矩阵的方法,对样本熵算法的相空间重构过程进行替换,建立改进的样本熵算法。白噪声和粉噪声仿真信号分析表明,改进的样本熵算法能有效提取信号的特征,并且具有较... 针对样本熵算法在相空间重构过程中存在冗余运算的问题,通过构建符号变量矩阵的方法,对样本熵算法的相空间重构过程进行替换,建立改进的样本熵算法。白噪声和粉噪声仿真信号分析表明,改进的样本熵算法能有效提取信号的特征,并且具有较高计算效率。以往复压缩机轴承间隙故障为研究对象,应用改进的样本熵算法对其进行特征提取,并与样本熵进行对比,该方法特征提取结果与样本熵算法保持高度一致,算法的计算效率远高于样本熵算法。 展开更多
关键词 样本熵 改进的样本熵 计算效率 特征提取 往复压缩机
在线阅读 下载PDF
基于图神经网络的B-Rep模型加工特征识别方法
4
作者 胡广华 代志刚 王清辉 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期20-31,共12页
自动特征识别是智能制造的关键技术之一。传统的基于规则的识别算法可扩展性较差,而基于深度卷积网络的方法以离散模型为输入,准确度不高,且识别结果难以精确映射回原始计算机辅助设计(CAD)模型,造成应用不便。针对上述不足,该文提出了... 自动特征识别是智能制造的关键技术之一。传统的基于规则的识别算法可扩展性较差,而基于深度卷积网络的方法以离散模型为输入,准确度不高,且识别结果难以精确映射回原始计算机辅助设计(CAD)模型,造成应用不便。针对上述不足,该文提出了一种基于图神经网络的、能够直接处理边界表示(B-Rep)模型的加工特征识别方法。该方法首先从B-Rep结构中提取有效的属性和几何信息,形成特征描述符;接着根据CAD模型拓扑结构建立具有高级语义信息的邻接图;进而以邻接图为输入,构建高效的图神经网络模型,通过引入可微的广义消息聚合函数和残差连接机制,提升模型的信息聚合及多层级特征捕捉能力,同时采用消息归一化策略确保训练稳定性并加速收敛;训练完成后,网络能对B-Rep模型中的所有面进行分类标注,实现特征识别。将该方法在公共数据集MFCAD++上进行测试,取得了99.53%的准确率和99.15%的平均交并比,说明该方法优于现有的同类研究成果。采用更复杂的测试用例和工程应用中的典型真实CAD案例作进一步检验,结果均表明该方法具有更好的泛化能力以及更强的适应性。 展开更多
关键词 加工特征识别 图神经网络 深度学习 计算机辅助设计
在线阅读 下载PDF
基于多层感知机-注意力模型的功耗预测算法
5
作者 敬超 全育涛 陈艳 《计算机应用》 北大核心 2025年第8期2646-2655,共10页
虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载... 虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载的功耗预测算法。首先,考虑服务器功耗与系统特征,建立一种基于特征的工作负载功耗模型;其次,针对现有的功耗预测算法不能解决系统特征与系统功耗之间的长程依赖的问题,提出一种改进的基于多层感知机-注意力模型的功耗预测算法Prophet,该算法改进多层感知机实现各个时刻的系统特征的提取,并使用注意力机制综合这些特征,从而有效解决系统特征与系统功耗之间的长程依赖问题;最后,在实际系统中开展相关实验,将所提算法分别与MLSTM_PM(Power consumption Model based on Multi-layer Long Short-Term Memory)和ENN_PM(Power consumption Model based on Elman Neural Network)等功耗预测算法对比。实验结果表明,Prophet具有较高的预测精准性,与MLSTM_PM算法相比,在工作负载blk、memtest和busspd上将平均相对误差(MRE)分别降低了1.22、1.01和0.93个百分点,并且具有较低的复杂度,表明了所提算法的有效性及可行性。 展开更多
关键词 异构计算系统 负载特征 多层感知机 注意力机制 功耗预测
在线阅读 下载PDF
基于视线引导的实时动态手势识别方法
6
作者 易月娥 李蔚清 胡鹏 《计算机工程与设计》 北大核心 2025年第8期2342-2349,共8页
针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合... 针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合识别网络进行手势识别。在多个公开数据集与模拟交互场景下进行测试,结果表明,该方法仅使用约0.15M的参数量和3 ms的推理时间,获得了超过主流方法的识别准确率。在模拟场景下的14类和28类动态手势识别任务中,Levenshtein精度分别为95.9%和94.5%,相对于主流方法提高约20%。 展开更多
关键词 动态手势识别 人机交互 视线引导 视线追踪 轻量级 多特征融合识别 交互场景
在线阅读 下载PDF
面向复杂场景的变电设备锈蚀检测方法
7
作者 赵振兵 席悦 +3 位作者 冯烁 赵文清 翟永杰 李冰 《智能系统学报》 北大核心 2025年第3期679-688,共10页
针对复杂场景下变电设备锈蚀检测中存在锈蚀形态差异大、尺度大小不一、特征显著性低等问题,提出了一种面向复杂场景的变电设备锈蚀检测方法。引入了频率通道注意力机制,通过更多的频率分量补充深层网络中的细节特征,优化模型对锈蚀特... 针对复杂场景下变电设备锈蚀检测中存在锈蚀形态差异大、尺度大小不一、特征显著性低等问题,提出了一种面向复杂场景的变电设备锈蚀检测方法。引入了频率通道注意力机制,通过更多的频率分量补充深层网络中的细节特征,优化模型对锈蚀特征的提取;在特征融合网络中使用多尺度特征增强模块重新构建C2f模块,使网络可以更好地捕获不同大小的锈蚀区域;引入附加检测头,缓解模型在特征融合过程中因卷积层下采样造成的锈蚀关键信息丢失的情况,从而提高变电设备锈蚀检测的精度。实验结果表明,改进以后的网络模型相较于原始的YOLOv8m模型,平均检测精度(mAP50)提升了5.1%,检测效果也优于其他主流目标检测模型,为变电设备锈蚀检测提供了新的参考方法。 展开更多
关键词 变电设备 不规则缺陷 锈蚀检测 YOLOv8 注意力机制 多尺度特征 检测头 复杂场景 电力视觉
在线阅读 下载PDF
双域感知下多方显式信息协同的场景端到端文本识别
8
作者 陈平平 林虎 +1 位作者 陈宏辉 谢肇鹏 《电子学报》 北大核心 2025年第3期974-985,共12页
在复杂自然场景的端到端文本识别中,由于文本和背景难以区分,文本检测的位置信息和识别的语义信息不匹配,无法有效利用检测和识别之间的相关性.针对该问题,本文提出双域感知下多方显式信息协同的自然场景端到端文本识别方法(Multi-party... 在复杂自然场景的端到端文本识别中,由于文本和背景难以区分,文本检测的位置信息和识别的语义信息不匹配,无法有效利用检测和识别之间的相关性.针对该问题,本文提出双域感知下多方显式信息协同的自然场景端到端文本识别方法(Multi-party Synergetic explicit Information with Dual-domain Awareness text spotting,MSIDA),通过强化文本区域特征和边缘纹理,利用文本检测和识别特征之间的协同作用提高端到端文本识别性能.首先,设计融合文本空间和方向信息的双域感知模块(Dual-Domain Awareness,DDA),增强文本实例的视觉特征信息;其次,提出多方显式信息协同模块(Multi-party Explicit Information Synergy,MEIS)提取编码特征中的显式信息,通过匹配对齐用于检测和识别的位置、分类和字符多方信息生成候选文本实例;最后,协同特征通过解码器引导可学习的查询序列获得文本检测和识别的结果 .相比最新的DeepSolo(Decoder with explicit points Solo)方法,在Total-Text、ICDAR 2015和CTW1500数据集上,MSIDA模型的准确率分别提升0.8%、0.8%和0.4%.代码和数据集在https://github.com/msida2024/MSIDA.git可以获取. 展开更多
关键词 计算机视觉 场景文本图像 文本检测 端到端文本识别 特征信息关联
在线阅读 下载PDF
LightDiffu-DCE:基于光照强度扩散的低光照图像增强
9
作者 闫光辉 吴佰靖 马龙 《光学精密工程》 北大核心 2025年第7期1114-1129,共16页
针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增... 针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增强模型的泛化能力,提出了基于光源光照强度建模的扩散模型,以生成不同光照强度的训练数据集。设计了边缘特征融合的深度曲线估计网络,能够提取更丰富的低光照图像的多尺度轮廓和细节特征,提升对光照强度估计的准确性。为恢复出光照更加自然的图像,融合大气光估计来计算不同图像区域的光照强度,实现了对光增强曲线和光增强系数的动态微调。在无参考数据集ExDark和有参考数据集LOL上,使用6种评价指标进行实验分析。实验结果表明,相较于基准方法,LightDiffu-DCE在ExDark上的无参考评价指标NIQE,PIQE和RISQ上分别提升了约8.35%,6.20%和21.83%,在LOL数据集上的有参考评价指标PSNR,SSIM和RMSE提升了约12.12%,4.76%和49.89%。该方法可以有效增强低光照图像,且恢复出的低光照图像轮廓更加清晰,色彩鲜明且效果更自然。 展开更多
关键词 计算机视觉 扩散模型 低光照增强 边缘特征 深度曲线估计网络
在线阅读 下载PDF
云计算下智能船舶通信网络入侵攻击特征提取
10
作者 潘俊 《舰船科学技术》 北大核心 2025年第11期160-164,共5页
本文提出云计算下智能船舶通信网络入侵攻击特征提取方法。在云计算环境下,分析智能船舶通信网络信号主特征矢量,重构出通信信号的状态空间,分析重构后的输入输出关系,提取出与入侵信号关联性较高的信号,初步获取入侵攻击信号识别结果;... 本文提出云计算下智能船舶通信网络入侵攻击特征提取方法。在云计算环境下,分析智能船舶通信网络信号主特征矢量,重构出通信信号的状态空间,分析重构后的输入输出关系,提取出与入侵信号关联性较高的信号,初步获取入侵攻击信号识别结果;构建智能船舶通信网络的无向图模型,使用连续小波变换对该模型的攻击信号实施经验模态特征分解处理,建立出入侵攻击信号模型,将该信号模型的最大信息增益特征视为搜索起点,提取出入侵攻击信号特征。实验结果表明,所提方法的信号分解时频表示效果好、入侵攻击信号识别能力强,入侵攻击信号特征提取完整性强。 展开更多
关键词 云计算环境 船舶通信网络 入侵攻击信号 信号特征提取 时域状态空间
在线阅读 下载PDF
基于特征融合和模板更新的孪生网络跟踪算法 被引量:1
11
作者 吴国瑞 王峰 李杰 《电光与控制》 北大核心 2025年第1期41-47,85,共8页
针对现有孪生网络跟踪算法仅使用主干网络最后一层的特征进行相似度匹配,以及缺少有效模板更新策略的问题,提出基于多尺度特征融合和自适应模板更新的孪生网络跟踪算法。首先,结合深度过参数化卷积设计非填充单元,提取更深层的前景特征... 针对现有孪生网络跟踪算法仅使用主干网络最后一层的特征进行相似度匹配,以及缺少有效模板更新策略的问题,提出基于多尺度特征融合和自适应模板更新的孪生网络跟踪算法。首先,结合深度过参数化卷积设计非填充单元,提取更深层的前景特征和语义背景;然后,设计新的全局-局部特征融合模块,充分聚合浅、中层特征的全局和局部信息,捕获丰富的浅层外观特征和中层过渡特征;最后,采用自适应模板更新机制在线更新模板。为验证算法的有效性,在公开数据集上对所提算法进行详尽评估,实验结果显示,所提算法在OTB2015和VOT2018数据集上的精确度分别达到0.878和0.588,GOT10K数据集上平均重叠率达到0.526,优于其他主流算法。 展开更多
关键词 目标跟踪 孪生网络 计算机应用 多层特征融合 模板更新
在线阅读 下载PDF
基于改进型YOLOv8 的木材缺陷检测及分类
12
作者 刘振 张澎涛 +2 位作者 管雪梅 于帅 张宪奇 《森林工程》 北大核心 2025年第4期761-776,共16页
针对木材加工业自动化生产场景中传统缺陷检测方法适应性不足的瓶颈问题,开展基于深度学习的智能检测技术研究,构建涵盖多树种特征及典型缺陷类型的数据集。将目标检测技术用于缺陷检测,利用膨胀感知残差(dilation wise residual,DWR)... 针对木材加工业自动化生产场景中传统缺陷检测方法适应性不足的瓶颈问题,开展基于深度学习的智能检测技术研究,构建涵盖多树种特征及典型缺陷类型的数据集。将目标检测技术用于缺陷检测,利用膨胀感知残差(dilation wise residual,DWR)模块优化C2f模块,并提出任务对齐动态检测头(task aligned dynamic detection head,TADDH)和特征聚焦扩散金字塔网络(focusing spread pyramid network,FSPN),用于改进YOLOv8算法(DFT-YOLO)。试验结果显示,经过改进的模型在精度上取得显著提升,达到了96.8%,相较于原始模型提高7.9%;在关键评价指标平均精度mAP50和mAP50-95上,改进后的模型分别达到93.8%和75.2%,分别提高了6.8%和17.5%;在提高检测精度的同时,模型的参数量减少了约1/6(16.2%)。改进的模型能够为木材缺陷的检测提供一种轻量化的检测方法。 展开更多
关键词 木材缺陷 目标检测 深度学习 YOLOv8 特征提取 多尺度融合 算法优化 智能识别
在线阅读 下载PDF
基于增强CT联合临床特征预测肝内胆管细胞癌神经束侵犯
13
作者 谭智霖 刘子蔚 +3 位作者 张榕 陈新杰 罗纯 胡秋根 《放射学实践》 北大核心 2025年第5期600-607,共8页
目的:探讨基于增强CT联合临床特征术前预测肝内胆管细胞癌(ICC)患者神经束侵犯(PNI)的价值。方法:回顾性搜集2012年1月至2023年5月在南方医科大学第八附属医院(机构1)及佛山市第一人民医院(机构2)经病理确诊为ICC的患者共217例,其中来... 目的:探讨基于增强CT联合临床特征术前预测肝内胆管细胞癌(ICC)患者神经束侵犯(PNI)的价值。方法:回顾性搜集2012年1月至2023年5月在南方医科大学第八附属医院(机构1)及佛山市第一人民医院(机构2)经病理确诊为ICC的患者共217例,其中来自机构1的136例按照7:3的比例随机分为训练集及内部验证集,来自机构2的81例作为外部验证集。通过病理判定将ICC患者分为PNI阳性组和PNI阴性组。在训练集中,比较两组之间的增强CT影像特征、临床特征的统计学差异,通过单因素及多因素Logistic回归分析得到预测PNI的独立危险因素以构建最佳预测模型,并通过列线图模型实现个体化预测。采用受试者工作特征(ROC)曲线分析评价模型的预测效能,并进行内部及外部验证集验证。结果:单因素及多因素logistic回归分析结果显示血小板与淋巴细胞比率(PLR)(OR=1.007;95%CI:1.000~1.013;P=0.043)、肿瘤位置(OR=5.018;95%CI:1.670~15.079;P=0.004)、肿瘤包膜(OR=5.102;95%CI:1.345~19.355;P=0.017)、动脉期肿瘤周围强化(OR=4.013;95%CI:1.468~10.969;P=0.007)是PNI的独立风险因素。ROC曲线分析结果显示最佳预测模型在训练集、内部验证集及外部验证集中的ROC曲线下面积分别为0.822(95%CI:0.729~0.897)、0.838(95%CI:0.684~0.963)、0.754(95%CI:0.643~0.866)。结论:术前增强CT影像联合临床特征可无创性预测ICC患者发生PNI的风险,并通过列线图模型实现个体化预测,为临床手术方案的制定提供参考依据。 展开更多
关键词 肝内胆管细胞癌 神经束侵犯 体层摄影术 X线计算机 临床特征 列线图
在线阅读 下载PDF
多粒度遮挡特征增强的行人搜索算法
14
作者 苗春玲 张红云 +2 位作者 吴卓嘉 张齐贤 苗夺谦 《智能系统学报》 北大核心 2025年第1期230-242,共13页
现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了... 现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。 展开更多
关键词 深度学习 计算机视觉 行人搜索 目标检测 粒计算 数据处理 特征提取 生成对抗网络 对齐
在线阅读 下载PDF
基于RGB与骨骼数据的人体行为识别综述
15
作者 李仝伟 仇大伟 +1 位作者 刘静 逯英航 《计算机工程与应用》 北大核心 2025年第8期62-82,共21页
人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人... 人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人体行为识别方法;按照特征学习方式的不同,分为基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法。介绍了行为识别的基本流程,并总结了公开数据集。详述了基于RGB和骨骼数据模态的识别方法。对于RGB数据,分析了基于2D CNN、RNN和3D CNN的特征提取方法;对于骨骼数据,介绍了自上而下和自下而上的姿态评估算法,重点分析了基于RNN、CNN、GCN、Transformer和混合神经网络的分类算法。最后,展望了未来深度学习在人体行为识别中的五个研究方向。 展开更多
关键词 行为识别 计算机视觉 RGB数据 骨骼数据 特征提取 深度学习
在线阅读 下载PDF
渐进自适应特征融合的轻量化火焰检测算法研究
16
作者 李啸澜 马勇 《计算机科学》 北大核心 2025年第4期64-73,共10页
针对视觉安防系统在边缘计算平台部署火焰检测模型时面临的精度与实时性难以平衡的问题,提出一种渐进自适应特征融合的轻量化火焰检测算法。首先,设计轻量级稀疏卷积算子降低模型计算复杂度与内存访问开销。其次,针对分组卷积的通道间... 针对视觉安防系统在边缘计算平台部署火焰检测模型时面临的精度与实时性难以平衡的问题,提出一种渐进自适应特征融合的轻量化火焰检测算法。首先,设计轻量级稀疏卷积算子降低模型计算复杂度与内存访问开销。其次,针对分组卷积的通道间信息交互缺陷,基于残差思想构建长距离上下文特征增强的轻量级特征提取组件。为解决深度骨干网络中特征丢失及背景干扰问题,创新性地提出基于高频增强的轻量级特征强化机制,优化空间域和通道域参数,缓解背景干扰问题。在此基础上,建立特征增强-渐进自适应特征融合框架,促进不同尺度特征图充分融合,提高特征图利用率,增强对多尺度目标的识别效果。实验结果表明,所提方法在实时推理速度最高达到27.1 FPS的同时,参数量降低至2.1×10^(6),较基准模型减少69.5%,并达到83.4%的mAP@0.5检测精度,显著优于现有主流方法。 展开更多
关键词 深度学习 计算机视觉 目标检测 轻量化神经网络 特征提取网络 特征融合网络 特征增强
在线阅读 下载PDF
改进YOLOv5的工业产品表面缺陷检测方法
17
作者 刘兆英 陈志远 +2 位作者 张婷 时亚南 陈迎春 《郑州大学学报(工学版)》 北大核心 2025年第5期18-25,共8页
针对工业场景下资源受限且表面缺陷图像对比度低的问题,提出了一种改进YOLOv5的工业产品表面缺陷检测方法。首先,在骨干网络中引入感受野增强模块,用于从不同层次的感受野提取更丰富的视觉特征;其次,在特征融合网络中添加混洗注意力模块... 针对工业场景下资源受限且表面缺陷图像对比度低的问题,提出了一种改进YOLOv5的工业产品表面缺陷检测方法。首先,在骨干网络中引入感受野增强模块,用于从不同层次的感受野提取更丰富的视觉特征;其次,在特征融合网络中添加混洗注意力模块,更有效地对不同维度的特征图进行融合;最后,采取了任务解耦检测头,使分类和回归两个任务采用相互独立的网络进行预测,降低彼此的干扰,提升检测精度。实验结果表明:该网络的参数量和计算量均低于YOLOX、YOLOv7、deformable DETR等模型,且在管道数字射线(DR)缺陷图像数据集PDD和NEU-DET数据集上,mAP@0.5分别提高2.23百分点和2.99百分点,兼顾了工业场景下对缺陷检测实时性和精确性的要求。 展开更多
关键词 表面缺陷检测 计算机视觉 多尺度特征提取 注意力机制 解耦检测头
在线阅读 下载PDF
基于注意力机制和跨模态层级特征融合的群养肉牛个体质量估测
18
作者 宋平 杨颖 +3 位作者 刘刚 姚冲 李子若 毛天赐 《农业工程学报》 北大核心 2025年第10期221-231,共11页
为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-g... 为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-green-blue)图像与深度图像,使用引入定向边界框OBB(oriented bounding box)的YOLOv8网络对肉牛进行旋转目标检测和识别,精准定位群养场景中的个体目标;其次,以ResNet50为骨干网络构建双流估重模型,分别提取RGB和深度模态特征,并引入CBAM(convolutional block attention module)注意力机制以增强关键特征表达能力。设计跨模态的层级特征融合,有效结合RGB流和深度流的特征并充分利用浅层特征;第三,引入肉牛的身份信息便于网络学习肉牛身份与其体质量之间的对应关系,为优化模型效率,将全连接层替换为KAN(kolmogorov-arnold networks),显著减少参数量;最后,将双流的输出结果融合,回归肉牛体质量值。在试验中,构建了包含2546对RGB-D图像的数据集,包括2373对训练数据和173对验证数据。结果表明,CMHFF-ResNet在验证集上的平均绝对误差为14.19 kg。与基于RGB和深度的单流模型相比,双流模型在平均绝对误差上分别降低16.943%和26.133%。同时,该方法优于其他现有肉牛体质量估测方法:与多元线性回归、改进MobileNetv2模型、改进DenseNet201模型和改进跨模态特征融合模型CFF-ResNet相比,在平均绝对误差上分别减少57.233%、34.699%、24.761%和20.991%,提升了群养环境下肉牛个体质量估测的精度与泛化性,能够有效地学习跨模态的层级特征表示。该研究为大规模群养环境中肉牛个体质量的高精度估测提供了参考。 展开更多
关键词 模型 计算机视觉 目标检测 体质量估测 注意力机制 跨模态层级特征融合 双流网络
在线阅读 下载PDF
基于复数协方差卷积神经网络的运动想象脑电信号解码方法
19
作者 黄仁慧 张锐锋 +3 位作者 文晓浩 闭金杰 黄守麟 李廷会 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期43-56,共14页
深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基... 深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基于复数协方差特征的三维复值卷积神经网络。首先,构建脑电不同频率下的复数协方差矩阵特征,不仅通过复值表示将幅值和相位信息结合在一起,并且保留分类所需的多变量信息,如幅值、相位、空间位置、频率等。其次,设计针对多复数协方差特征的全复数卷积神经网络,实现运动想象任务的高性能分类。在2个公开数据集上的实验结果表明,本研究提出的方法可获得比现有前沿方法至少高出2.49和1.85个百分点的平均准确率。 展开更多
关键词 脑电信号 脑机接口 幅相信息融合 复数协方差特征 复值卷积神经网络 信息交互
在线阅读 下载PDF
基于X射线和视觉图像融合特征的霉变核桃无损检测
20
作者 宁鑫跃 张慧 +1 位作者 姬帅 赖丽思 《食品科学》 北大核心 2025年第12期287-296,共10页
针对霉变核桃检测难、效率低的问题,提出一种融合X射线和视觉图像的霉变核桃无损检测方法,以准确判别核桃内外皆霉变、内霉外正常、内正常外霉变和内外皆正常4类情况。首先采用灰度共生矩阵提取X射线和视觉图像的纹理特征,并在不同颜色... 针对霉变核桃检测难、效率低的问题,提出一种融合X射线和视觉图像的霉变核桃无损检测方法,以准确判别核桃内外皆霉变、内霉外正常、内正常外霉变和内外皆正常4类情况。首先采用灰度共生矩阵提取X射线和视觉图像的纹理特征,并在不同颜色空间下分别计算视觉图像的一阶矩和二阶矩,以全面捕捉核桃内外部霉变特征,从而构建原始霉变核桃特征集。随后,基于竞争自适应重加权算法和连续投影算法对提取的特征进行优选,构建对不同霉变情况敏感的核桃特征集。在此基础上,分别构建极限学习机和K-最近邻霉变核桃分类模型,并通过实验对比不同特征集下分类模型的性能,验证了融合X射线和视觉图像特征检测霉变核桃的可行性。结果表明,使用连续投影算法优选特征集构建的极限学习机模型性能最优,测试集准确率、召回率、模型精确率和召回率的调和平均值(F1)分别达到90.32%、92.58%和91.29%,平均特异性和Kappa系数分别达到97.02%和88.44%,对多数类和少数类的霉变核桃均有较高的判别能力。本研究可为核桃内外部霉变情况的综合、准备识别以及在线无损检测系统的研发提供理论参考。 展开更多
关键词 X射线 计算机视觉 霉变核桃 特征优选 机器学习
在线阅读 下载PDF
上一页 1 2 55 下一页 到第
使用帮助 返回顶部