期刊文献+
共找到1,108篇文章
< 1 2 56 >
每页显示 20 50 100
基于计算机视觉的城市道路噪声实时估计 被引量:1
1
作者 李响 张瑷霖 +2 位作者 李国正 赖本涛 陈梦君 《仪器仪表学报》 北大核心 2025年第2期196-208,共13页
为了实现城市道路视频监控场景下交通流噪声的快速准确估计,提出一种基于计算机视觉的城市道路噪声实时估计方法。首先,从道路交通噪声产生机理分析入手,提出了一系列基于计算机视觉的城市道路交通噪声相关交通流信息提取方法,改善传统... 为了实现城市道路视频监控场景下交通流噪声的快速准确估计,提出一种基于计算机视觉的城市道路噪声实时估计方法。首先,从道路交通噪声产生机理分析入手,提出了一系列基于计算机视觉的城市道路交通噪声相关交通流信息提取方法,改善传统方法提取交通流信息不够便捷的情况。其次,针对传统算法噪声估计准确度不高的问题,进行城市道路交通噪声影响因素分析,将交通流特征与环境特征相结合,构建了基于机器学习的道路交通噪声估计模型,提高了城市道路噪声估计的准确性。最后,分析城市道路交通噪声短时变化规律,确定其尺度可变的特征提取时间窗口,提出了一整套城市道路交通噪声实时估计方案,提升了城市道路噪声估计的实时性。实验结果表明,所提出的基于计算机视觉的交通流信息提取方法较常用的目标检测和目标追踪算法能够更准确的提取城市道路交通噪声相关信息;所建立的城市道路交通噪声估计模型相比传统噪声估计模型有更高的实时性和准确性,相较于现有基于机器学习的噪声估计方法在不同场景下均有着更为准确的估计结果,提高了城市道路噪声估计的准确性和实时性,确定了时间尺度为3和10 min的噪声估计方法,具有实际应用价值。 展开更多
关键词 计算机视觉 交通噪声 特征提取 噪声估计 机器学习
在线阅读 下载PDF
基于云计算的多类型大规模激光图像快速识别研究
2
作者 李洋 张阳 陶锐 《激光杂志》 北大核心 2025年第2期149-153,共5页
大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有... 大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有强大的计算能力和灵活的资源配置优势,研究基于云计算的多类型大规模激光图像快速识别方法。通过非线性匹配方式处理激光图像,确定激光图像中目标点位姿变化矩阵;将处理后的激光图像,以机器算法作特征筛选,划分不同类型激光图像中的关键特征;采用云计算关联方法,构建快速识别模型,通过模型内目标函数,实现多类型大规模激光图像快速识别。实验结果表明:以两组不同类型的连续帧激光图像作为测试样本,所研究方法可以实现设计方案下的快速识别,具有应用价值。 展开更多
关键词 云计算 多类型 大规模 激光图像 快速识别 匹配方式 关键特征
在线阅读 下载PDF
基于符号变量矩阵的改进样本熵算法
3
作者 李彦阳 罗伟 《科学技术与工程》 北大核心 2025年第5期1913-1919,共7页
针对样本熵算法在相空间重构过程中存在冗余运算的问题,通过构建符号变量矩阵的方法,对样本熵算法的相空间重构过程进行替换,建立改进的样本熵算法。白噪声和粉噪声仿真信号分析表明,改进的样本熵算法能有效提取信号的特征,并且具有较... 针对样本熵算法在相空间重构过程中存在冗余运算的问题,通过构建符号变量矩阵的方法,对样本熵算法的相空间重构过程进行替换,建立改进的样本熵算法。白噪声和粉噪声仿真信号分析表明,改进的样本熵算法能有效提取信号的特征,并且具有较高计算效率。以往复压缩机轴承间隙故障为研究对象,应用改进的样本熵算法对其进行特征提取,并与样本熵进行对比,该方法特征提取结果与样本熵算法保持高度一致,算法的计算效率远高于样本熵算法。 展开更多
关键词 样本熵 改进的样本熵 计算效率 特征提取 往复压缩机
在线阅读 下载PDF
基于图神经网络的B-Rep模型加工特征识别方法
4
作者 胡广华 代志刚 王清辉 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期20-31,共12页
自动特征识别是智能制造的关键技术之一。传统的基于规则的识别算法可扩展性较差,而基于深度卷积网络的方法以离散模型为输入,准确度不高,且识别结果难以精确映射回原始计算机辅助设计(CAD)模型,造成应用不便。针对上述不足,该文提出了... 自动特征识别是智能制造的关键技术之一。传统的基于规则的识别算法可扩展性较差,而基于深度卷积网络的方法以离散模型为输入,准确度不高,且识别结果难以精确映射回原始计算机辅助设计(CAD)模型,造成应用不便。针对上述不足,该文提出了一种基于图神经网络的、能够直接处理边界表示(B-Rep)模型的加工特征识别方法。该方法首先从B-Rep结构中提取有效的属性和几何信息,形成特征描述符;接着根据CAD模型拓扑结构建立具有高级语义信息的邻接图;进而以邻接图为输入,构建高效的图神经网络模型,通过引入可微的广义消息聚合函数和残差连接机制,提升模型的信息聚合及多层级特征捕捉能力,同时采用消息归一化策略确保训练稳定性并加速收敛;训练完成后,网络能对B-Rep模型中的所有面进行分类标注,实现特征识别。将该方法在公共数据集MFCAD++上进行测试,取得了99.53%的准确率和99.15%的平均交并比,说明该方法优于现有的同类研究成果。采用更复杂的测试用例和工程应用中的典型真实CAD案例作进一步检验,结果均表明该方法具有更好的泛化能力以及更强的适应性。 展开更多
关键词 加工特征识别 图神经网络 深度学习 计算机辅助设计
在线阅读 下载PDF
基于多层感知机-注意力模型的功耗预测算法
5
作者 敬超 全育涛 陈艳 《计算机应用》 北大核心 2025年第8期2646-2655,共10页
虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载... 虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载的功耗预测算法。首先,考虑服务器功耗与系统特征,建立一种基于特征的工作负载功耗模型;其次,针对现有的功耗预测算法不能解决系统特征与系统功耗之间的长程依赖的问题,提出一种改进的基于多层感知机-注意力模型的功耗预测算法Prophet,该算法改进多层感知机实现各个时刻的系统特征的提取,并使用注意力机制综合这些特征,从而有效解决系统特征与系统功耗之间的长程依赖问题;最后,在实际系统中开展相关实验,将所提算法分别与MLSTM_PM(Power consumption Model based on Multi-layer Long Short-Term Memory)和ENN_PM(Power consumption Model based on Elman Neural Network)等功耗预测算法对比。实验结果表明,Prophet具有较高的预测精准性,与MLSTM_PM算法相比,在工作负载blk、memtest和busspd上将平均相对误差(MRE)分别降低了1.22、1.01和0.93个百分点,并且具有较低的复杂度,表明了所提算法的有效性及可行性。 展开更多
关键词 异构计算系统 负载特征 多层感知机 注意力机制 功耗预测
在线阅读 下载PDF
基于视线引导的实时动态手势识别方法
6
作者 易月娥 李蔚清 胡鹏 《计算机工程与设计》 北大核心 2025年第8期2342-2349,共8页
针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合... 针对手势识别技术在实际交互场景中存在模型参数量大、误触发率高等问题,提出一种基于视线引导的实时动态手势识别方法。利用视线追踪数据对手部骨架序列进行准确分割,同时对骨架数据从多个维度进行特征预处理,利用轻量级的多特征融合识别网络进行手势识别。在多个公开数据集与模拟交互场景下进行测试,结果表明,该方法仅使用约0.15M的参数量和3 ms的推理时间,获得了超过主流方法的识别准确率。在模拟场景下的14类和28类动态手势识别任务中,Levenshtein精度分别为95.9%和94.5%,相对于主流方法提高约20%。 展开更多
关键词 动态手势识别 人机交互 视线引导 视线追踪 轻量级 多特征融合识别 交互场景
在线阅读 下载PDF
面向复杂场景的变电设备锈蚀检测方法
7
作者 赵振兵 席悦 +3 位作者 冯烁 赵文清 翟永杰 李冰 《智能系统学报》 北大核心 2025年第3期679-688,共10页
针对复杂场景下变电设备锈蚀检测中存在锈蚀形态差异大、尺度大小不一、特征显著性低等问题,提出了一种面向复杂场景的变电设备锈蚀检测方法。引入了频率通道注意力机制,通过更多的频率分量补充深层网络中的细节特征,优化模型对锈蚀特... 针对复杂场景下变电设备锈蚀检测中存在锈蚀形态差异大、尺度大小不一、特征显著性低等问题,提出了一种面向复杂场景的变电设备锈蚀检测方法。引入了频率通道注意力机制,通过更多的频率分量补充深层网络中的细节特征,优化模型对锈蚀特征的提取;在特征融合网络中使用多尺度特征增强模块重新构建C2f模块,使网络可以更好地捕获不同大小的锈蚀区域;引入附加检测头,缓解模型在特征融合过程中因卷积层下采样造成的锈蚀关键信息丢失的情况,从而提高变电设备锈蚀检测的精度。实验结果表明,改进以后的网络模型相较于原始的YOLOv8m模型,平均检测精度(mAP50)提升了5.1%,检测效果也优于其他主流目标检测模型,为变电设备锈蚀检测提供了新的参考方法。 展开更多
关键词 变电设备 不规则缺陷 锈蚀检测 YOLOv8 注意力机制 多尺度特征 检测头 复杂场景 电力视觉
在线阅读 下载PDF
一种轻量化伪装单兵目标检测算法
8
作者 张麟华 李腾 +1 位作者 赵爽 富丽贞 《火力与指挥控制》 北大核心 2025年第8期21-30,共10页
针对已有模型参数量较大、推理速度较慢的问题,提出一种轻量化伪装单兵目标检测算法。其骨干部分以HGNetv2为基础,采用SRepVGG模块进行多尺度特征融合,最后在耦合检测头中组合使用了部分卷积和1×1卷积。提出的深度学习网络与基准模... 针对已有模型参数量较大、推理速度较慢的问题,提出一种轻量化伪装单兵目标检测算法。其骨干部分以HGNetv2为基础,采用SRepVGG模块进行多尺度特征融合,最后在耦合检测头中组合使用了部分卷积和1×1卷积。提出的深度学习网络与基准模型YOLOv8对比,在保证检测精度的同时,参数量减少了35.4%,推理速度提升了18.9%,更适合在算力资源受限的边缘计算设备上运行。 展开更多
关键词 轻量化 伪装 目标检测 边缘计算 骨干网络 特征融合
在线阅读 下载PDF
双域感知下多方显式信息协同的场景端到端文本识别
9
作者 陈平平 林虎 +1 位作者 陈宏辉 谢肇鹏 《电子学报》 北大核心 2025年第3期974-985,共12页
在复杂自然场景的端到端文本识别中,由于文本和背景难以区分,文本检测的位置信息和识别的语义信息不匹配,无法有效利用检测和识别之间的相关性.针对该问题,本文提出双域感知下多方显式信息协同的自然场景端到端文本识别方法(Multi-party... 在复杂自然场景的端到端文本识别中,由于文本和背景难以区分,文本检测的位置信息和识别的语义信息不匹配,无法有效利用检测和识别之间的相关性.针对该问题,本文提出双域感知下多方显式信息协同的自然场景端到端文本识别方法(Multi-party Synergetic explicit Information with Dual-domain Awareness text spotting,MSIDA),通过强化文本区域特征和边缘纹理,利用文本检测和识别特征之间的协同作用提高端到端文本识别性能.首先,设计融合文本空间和方向信息的双域感知模块(Dual-Domain Awareness,DDA),增强文本实例的视觉特征信息;其次,提出多方显式信息协同模块(Multi-party Explicit Information Synergy,MEIS)提取编码特征中的显式信息,通过匹配对齐用于检测和识别的位置、分类和字符多方信息生成候选文本实例;最后,协同特征通过解码器引导可学习的查询序列获得文本检测和识别的结果 .相比最新的DeepSolo(Decoder with explicit points Solo)方法,在Total-Text、ICDAR 2015和CTW1500数据集上,MSIDA模型的准确率分别提升0.8%、0.8%和0.4%.代码和数据集在https://github.com/msida2024/MSIDA.git可以获取. 展开更多
关键词 计算机视觉 场景文本图像 文本检测 端到端文本识别 特征信息关联
在线阅读 下载PDF
LightDiffu-DCE:基于光照强度扩散的低光照图像增强
10
作者 闫光辉 吴佰靖 马龙 《光学精密工程》 北大核心 2025年第7期1114-1129,共16页
针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增... 针对低光照图像中不同光源的光照强度分布不均,在图像增强时造成轮廓特征丢失及效果不自然的问题,提出一种基于光照强度扩散的低光照图像增强方法(Light Diffusion based Zero-DCE Image Enhancement Algorithm,LightDiffu-DCE)。为增强模型的泛化能力,提出了基于光源光照强度建模的扩散模型,以生成不同光照强度的训练数据集。设计了边缘特征融合的深度曲线估计网络,能够提取更丰富的低光照图像的多尺度轮廓和细节特征,提升对光照强度估计的准确性。为恢复出光照更加自然的图像,融合大气光估计来计算不同图像区域的光照强度,实现了对光增强曲线和光增强系数的动态微调。在无参考数据集ExDark和有参考数据集LOL上,使用6种评价指标进行实验分析。实验结果表明,相较于基准方法,LightDiffu-DCE在ExDark上的无参考评价指标NIQE,PIQE和RISQ上分别提升了约8.35%,6.20%和21.83%,在LOL数据集上的有参考评价指标PSNR,SSIM和RMSE提升了约12.12%,4.76%和49.89%。该方法可以有效增强低光照图像,且恢复出的低光照图像轮廓更加清晰,色彩鲜明且效果更自然。 展开更多
关键词 计算机视觉 扩散模型 低光照增强 边缘特征 深度曲线估计网络
在线阅读 下载PDF
云计算下智能船舶通信网络入侵攻击特征提取
11
作者 潘俊 《舰船科学技术》 北大核心 2025年第11期160-164,共5页
本文提出云计算下智能船舶通信网络入侵攻击特征提取方法。在云计算环境下,分析智能船舶通信网络信号主特征矢量,重构出通信信号的状态空间,分析重构后的输入输出关系,提取出与入侵信号关联性较高的信号,初步获取入侵攻击信号识别结果;... 本文提出云计算下智能船舶通信网络入侵攻击特征提取方法。在云计算环境下,分析智能船舶通信网络信号主特征矢量,重构出通信信号的状态空间,分析重构后的输入输出关系,提取出与入侵信号关联性较高的信号,初步获取入侵攻击信号识别结果;构建智能船舶通信网络的无向图模型,使用连续小波变换对该模型的攻击信号实施经验模态特征分解处理,建立出入侵攻击信号模型,将该信号模型的最大信息增益特征视为搜索起点,提取出入侵攻击信号特征。实验结果表明,所提方法的信号分解时频表示效果好、入侵攻击信号识别能力强,入侵攻击信号特征提取完整性强。 展开更多
关键词 云计算环境 船舶通信网络 入侵攻击信号 信号特征提取 时域状态空间
在线阅读 下载PDF
基于特征融合和模板更新的孪生网络跟踪算法 被引量:1
12
作者 吴国瑞 王峰 李杰 《电光与控制》 北大核心 2025年第1期41-47,85,共8页
针对现有孪生网络跟踪算法仅使用主干网络最后一层的特征进行相似度匹配,以及缺少有效模板更新策略的问题,提出基于多尺度特征融合和自适应模板更新的孪生网络跟踪算法。首先,结合深度过参数化卷积设计非填充单元,提取更深层的前景特征... 针对现有孪生网络跟踪算法仅使用主干网络最后一层的特征进行相似度匹配,以及缺少有效模板更新策略的问题,提出基于多尺度特征融合和自适应模板更新的孪生网络跟踪算法。首先,结合深度过参数化卷积设计非填充单元,提取更深层的前景特征和语义背景;然后,设计新的全局-局部特征融合模块,充分聚合浅、中层特征的全局和局部信息,捕获丰富的浅层外观特征和中层过渡特征;最后,采用自适应模板更新机制在线更新模板。为验证算法的有效性,在公开数据集上对所提算法进行详尽评估,实验结果显示,所提算法在OTB2015和VOT2018数据集上的精确度分别达到0.878和0.588,GOT10K数据集上平均重叠率达到0.526,优于其他主流算法。 展开更多
关键词 目标跟踪 孪生网络 计算机应用 多层特征融合 模板更新
在线阅读 下载PDF
基于复数协方差卷积神经网络的运动想象脑电信号解码方法 被引量:1
13
作者 黄仁慧 张锐锋 +3 位作者 文晓浩 闭金杰 黄守麟 李廷会 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期43-56,共14页
深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基... 深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基于复数协方差特征的三维复值卷积神经网络。首先,构建脑电不同频率下的复数协方差矩阵特征,不仅通过复值表示将幅值和相位信息结合在一起,并且保留分类所需的多变量信息,如幅值、相位、空间位置、频率等。其次,设计针对多复数协方差特征的全复数卷积神经网络,实现运动想象任务的高性能分类。在2个公开数据集上的实验结果表明,本研究提出的方法可获得比现有前沿方法至少高出2.49和1.85个百分点的平均准确率。 展开更多
关键词 脑电信号 脑机接口 幅相信息融合 复数协方差特征 复值卷积神经网络 信息交互
在线阅读 下载PDF
基于X射线和视觉图像融合特征的霉变核桃无损检测 被引量:1
14
作者 宁鑫跃 张慧 +1 位作者 姬帅 赖丽思 《食品科学》 北大核心 2025年第12期287-296,共10页
针对霉变核桃检测难、效率低的问题,提出一种融合X射线和视觉图像的霉变核桃无损检测方法,以准确判别核桃内外皆霉变、内霉外正常、内正常外霉变和内外皆正常4类情况。首先采用灰度共生矩阵提取X射线和视觉图像的纹理特征,并在不同颜色... 针对霉变核桃检测难、效率低的问题,提出一种融合X射线和视觉图像的霉变核桃无损检测方法,以准确判别核桃内外皆霉变、内霉外正常、内正常外霉变和内外皆正常4类情况。首先采用灰度共生矩阵提取X射线和视觉图像的纹理特征,并在不同颜色空间下分别计算视觉图像的一阶矩和二阶矩,以全面捕捉核桃内外部霉变特征,从而构建原始霉变核桃特征集。随后,基于竞争自适应重加权算法和连续投影算法对提取的特征进行优选,构建对不同霉变情况敏感的核桃特征集。在此基础上,分别构建极限学习机和K-最近邻霉变核桃分类模型,并通过实验对比不同特征集下分类模型的性能,验证了融合X射线和视觉图像特征检测霉变核桃的可行性。结果表明,使用连续投影算法优选特征集构建的极限学习机模型性能最优,测试集准确率、召回率、模型精确率和召回率的调和平均值(F1)分别达到90.32%、92.58%和91.29%,平均特异性和Kappa系数分别达到97.02%和88.44%,对多数类和少数类的霉变核桃均有较高的判别能力。本研究可为核桃内外部霉变情况的综合、准备识别以及在线无损检测系统的研发提供理论参考。 展开更多
关键词 X射线 计算机视觉 霉变核桃 特征优选 机器学习
在线阅读 下载PDF
基于改进YOLOv8和Byte Track的鲈鱼个体运动特征提取方法 被引量:1
15
作者 于佳禾 刘丽伟 +2 位作者 徐玲 于辉辉 陈英义 《农业工程学报》 北大核心 2025年第5期182-190,共9页
鱼类个体运动特征提取是分析鱼类行为的重要环节,为进一步解决鲈鱼行为识别中存在小目标个体和复杂背景导致检测难,以及在多条鲈鱼跟踪过程中因遮挡和非线性运动而频繁发生的ID错误切换问题,该研究提出了一种基于改进YOLOv8和ByteTrack... 鱼类个体运动特征提取是分析鱼类行为的重要环节,为进一步解决鲈鱼行为识别中存在小目标个体和复杂背景导致检测难,以及在多条鲈鱼跟踪过程中因遮挡和非线性运动而频繁发生的ID错误切换问题,该研究提出了一种基于改进YOLOv8和ByteTrack的鱼类个体运动特征提取方法。首先对YOLOv8n模型进行了轻量化优化,用ODConv替换了主干网络的下采样卷积,并用Wise-IoUv3 Loss代替了原有的CIoU Loss,以此降低模型大小并提高检测速度和精度。然后对ByteTrack算法分别进行优化,通过应用扩展和线性卡尔曼滤波来适应目标的非线性运动和加速变化,以及引入高斯轨迹插值后处理策略,减少了遮挡情况下的错误身份切换。改进后的YOLOv8算法在模型大小和参数上与原YOLOv8模型分别降低了约2/3,精度、召回率分别提升了0.4和0.5个百分点,具有较高的检测精度及良好的鲁棒性和实时性。改进后的ByteTrack算法平均多目标跟踪准确率(multiple object tracking accuracy,MOTA)为88.7%,多目标跟踪精度(multiple object tracking precision,MOTP)为83.8%,平均每个测试视频的ID切换次数(identity switches,IDs)仅为37,帧率(frames per second,FPS)为95帧/s,能够满足实时跟踪需求。该研究提出的改进YOLOv8和ByteTrack的鲈鱼个体运动特征提取方法能够在实际养殖场景下实现较为稳定的鲈鱼个体实时跟踪,可为大规模无接触式实际水产养殖监测提供技术支持。 展开更多
关键词 计算机视觉 深度学习 特征提取 目标检测 多目标跟踪
在线阅读 下载PDF
YOLO-BFEPS:一种高效注意力增强的跨尺度YOLOv10火灾检测模型 被引量:1
16
作者 高均益 张伟 李泽麟 《计算机科学》 北大核心 2025年第S1期412-420,共9页
为解决传统火灾检测模型在处理复杂场景时,特征提取不充分和模型复杂度过高导致预警延迟及识别精度下降的问题,提出一种可部署到终端设备上的基于改进YOLOv10的新型火灾检测模型YOLO-BFEPS(YOLO Bi-directional Fusion with Enhanced Pa... 为解决传统火灾检测模型在处理复杂场景时,特征提取不充分和模型复杂度过高导致预警延迟及识别精度下降的问题,提出一种可部署到终端设备上的基于改进YOLOv10的新型火灾检测模型YOLO-BFEPS(YOLO Bi-directional Fusion with Enhanced Partial Self-Attention),实现了同时对烟雾与火灾的快速准确检测。首先,改进PSA模块,加强空间语义特征提取,解决通道降维建模跨通道关系时带来的信息丢失与计算复杂度增加的问题,提高检测精度,并将改进后的模块记为E-PSA(Enhanced Partial Self-Attention);其次,基于BiFPN提出特征层双向跨连接的思想进行尺度融合,重新设计了YOLOv10的颈部结构,并创新性地增加来自低特征层信息的融合,在保持准确度的同时大大减少了模型参数以及计算复杂度;引入Faster Block结构替换C2f模块的Bottleneck结构,实现模型的轻量化设计,并将其称为C2f-Faster。最后,通过在多个数据集上进行实验验证了所提模型的有效性,其在参数量减少35.5%、计算复杂度降低17.6%的基础上,将检测精度(Precision)和mAP@0.5分别提升了5.9%和1.4%。 展开更多
关键词 高效注意力 多尺度特征 加权双向特征金字塔 火灾检测 YOLOv10 轻量化 计算机视觉 深度学习
在线阅读 下载PDF
基于改进型YOLOv8 的木材缺陷检测及分类
17
作者 刘振 张澎涛 +2 位作者 管雪梅 于帅 张宪奇 《森林工程》 北大核心 2025年第4期761-776,共16页
针对木材加工业自动化生产场景中传统缺陷检测方法适应性不足的瓶颈问题,开展基于深度学习的智能检测技术研究,构建涵盖多树种特征及典型缺陷类型的数据集。将目标检测技术用于缺陷检测,利用膨胀感知残差(dilation wise residual,DWR)... 针对木材加工业自动化生产场景中传统缺陷检测方法适应性不足的瓶颈问题,开展基于深度学习的智能检测技术研究,构建涵盖多树种特征及典型缺陷类型的数据集。将目标检测技术用于缺陷检测,利用膨胀感知残差(dilation wise residual,DWR)模块优化C2f模块,并提出任务对齐动态检测头(task aligned dynamic detection head,TADDH)和特征聚焦扩散金字塔网络(focusing spread pyramid network,FSPN),用于改进YOLOv8算法(DFT-YOLO)。试验结果显示,经过改进的模型在精度上取得显著提升,达到了96.8%,相较于原始模型提高7.9%;在关键评价指标平均精度mAP50和mAP50-95上,改进后的模型分别达到93.8%和75.2%,分别提高了6.8%和17.5%;在提高检测精度的同时,模型的参数量减少了约1/6(16.2%)。改进的模型能够为木材缺陷的检测提供一种轻量化的检测方法。 展开更多
关键词 木材缺陷 目标检测 深度学习 YOLOv8 特征提取 多尺度融合 算法优化 智能识别
在线阅读 下载PDF
基于增强CT联合临床特征预测肝内胆管细胞癌神经束侵犯
18
作者 谭智霖 刘子蔚 +3 位作者 张榕 陈新杰 罗纯 胡秋根 《放射学实践》 北大核心 2025年第5期600-607,共8页
目的:探讨基于增强CT联合临床特征术前预测肝内胆管细胞癌(ICC)患者神经束侵犯(PNI)的价值。方法:回顾性搜集2012年1月至2023年5月在南方医科大学第八附属医院(机构1)及佛山市第一人民医院(机构2)经病理确诊为ICC的患者共217例,其中来... 目的:探讨基于增强CT联合临床特征术前预测肝内胆管细胞癌(ICC)患者神经束侵犯(PNI)的价值。方法:回顾性搜集2012年1月至2023年5月在南方医科大学第八附属医院(机构1)及佛山市第一人民医院(机构2)经病理确诊为ICC的患者共217例,其中来自机构1的136例按照7:3的比例随机分为训练集及内部验证集,来自机构2的81例作为外部验证集。通过病理判定将ICC患者分为PNI阳性组和PNI阴性组。在训练集中,比较两组之间的增强CT影像特征、临床特征的统计学差异,通过单因素及多因素Logistic回归分析得到预测PNI的独立危险因素以构建最佳预测模型,并通过列线图模型实现个体化预测。采用受试者工作特征(ROC)曲线分析评价模型的预测效能,并进行内部及外部验证集验证。结果:单因素及多因素logistic回归分析结果显示血小板与淋巴细胞比率(PLR)(OR=1.007;95%CI:1.000~1.013;P=0.043)、肿瘤位置(OR=5.018;95%CI:1.670~15.079;P=0.004)、肿瘤包膜(OR=5.102;95%CI:1.345~19.355;P=0.017)、动脉期肿瘤周围强化(OR=4.013;95%CI:1.468~10.969;P=0.007)是PNI的独立风险因素。ROC曲线分析结果显示最佳预测模型在训练集、内部验证集及外部验证集中的ROC曲线下面积分别为0.822(95%CI:0.729~0.897)、0.838(95%CI:0.684~0.963)、0.754(95%CI:0.643~0.866)。结论:术前增强CT影像联合临床特征可无创性预测ICC患者发生PNI的风险,并通过列线图模型实现个体化预测,为临床手术方案的制定提供参考依据。 展开更多
关键词 肝内胆管细胞癌 神经束侵犯 体层摄影术 X线计算机 临床特征 列线图
在线阅读 下载PDF
多粒度遮挡特征增强的行人搜索算法
19
作者 苗春玲 张红云 +2 位作者 吴卓嘉 张齐贤 苗夺谦 《智能系统学报》 北大核心 2025年第1期230-242,共13页
现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了... 现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。 展开更多
关键词 深度学习 计算机视觉 行人搜索 目标检测 粒计算 数据处理 特征提取 生成对抗网络 对齐
在线阅读 下载PDF
基于RGB与骨骼数据的人体行为识别综述
20
作者 李仝伟 仇大伟 +1 位作者 刘静 逯英航 《计算机工程与应用》 北大核心 2025年第8期62-82,共21页
人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人... 人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人体行为识别方法;按照特征学习方式的不同,分为基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法。介绍了行为识别的基本流程,并总结了公开数据集。详述了基于RGB和骨骼数据模态的识别方法。对于RGB数据,分析了基于2D CNN、RNN和3D CNN的特征提取方法;对于骨骼数据,介绍了自上而下和自下而上的姿态评估算法,重点分析了基于RNN、CNN、GCN、Transformer和混合神经网络的分类算法。最后,展望了未来深度学习在人体行为识别中的五个研究方向。 展开更多
关键词 行为识别 计算机视觉 RGB数据 骨骼数据 特征提取 深度学习
在线阅读 下载PDF
上一页 1 2 56 下一页 到第
使用帮助 返回顶部