期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于区块链的版权保护研究综述
1
作者 赵楷 胡煜环 +2 位作者 闫俊桥 毕雪华 张琳琳 《计算机工程》 北大核心 2025年第8期1-15,共15页
区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可... 区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。 展开更多
关键词 区块链 数字版权保护 智能合约 密码学 侵权溯源
在线阅读 下载PDF
远距离情形下的改进YOLOv8行人检测算法 被引量:2
2
作者 汤静雯 赖惠成 王同官 《计算机工程》 北大核心 2025年第4期303-313,共11页
智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生,然而面对遮挡和远距离行人的情景,现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题,提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取... 智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生,然而面对遮挡和远距离行人的情景,现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题,提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM),使得网络更好地学习行人特征和捕捉行人特点,在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块,重新整合后的检测层增强了网络对小目标的识别能力,有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络,即双向扩张残差-特征金字塔网络(BDR-FPN),利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征,缓解网络对遮挡行人不敏感问题。实验结果表明,在CityPersons数据集上进行训练和验证,相比原算法YOLOv8,ME-YOLO算法的AP_(50)提高了5.6百分点,模型参数量减少了41%,模型大小压缩了40%,在TinyPerson数据集上验证算法的有效性和泛化性,AP_(50)提高了4.1百分点,AP_(50∶95)提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时,有效提高了检测精度,在智慧社区场景中有较好的应用价值。 展开更多
关键词 行人检测 智慧社区 小目标行人 特征金字塔网络 YOLOv8算法
在线阅读 下载PDF
多领域多模态融合网络的虚假新闻检测 被引量:1
3
作者 焦世明 于凯 《计算机工程与应用》 北大核心 2025年第11期238-248,共11页
公众能够从互联网快速获取海量有价值的信息,但也为虚假新闻的广泛和迅速传播提供了便利。因此,在社交媒体上发现并标记出虚假新闻变得非常重要,快速准确地识别出虚假新闻能够有效防止负面网络舆情的形成,减少不良社会影响。在现有虚假... 公众能够从互联网快速获取海量有价值的信息,但也为虚假新闻的广泛和迅速传播提供了便利。因此,在社交媒体上发现并标记出虚假新闻变得非常重要,快速准确地识别出虚假新闻能够有效防止负面网络舆情的形成,减少不良社会影响。在现有虚假新闻识别研究基础上,构建了多领域多模态融合网络虚假新闻检测模型(DMMFN)。DMMFN模型中使用了BERT模型将虚假新闻的文本内容转换为文本向量,使用CLIP提取图片特征信息,考虑文本与图像相关性与交互性,建立一个多模态融合网络,组成的两个联合矩阵促进不同模态之间的信息交互和融合。引入一个多领域分类器,让不同事件的多模态特征可以映射到同一个特征空间中。在Twitter和Weibo数据集中测试了模型的性能,实验结果证明,DMMFN模型在accuracy、precision和F1分数上均优于SIMPLE、CCD等基线模型。 展开更多
关键词 虚假新闻 BERT CLIP 多模态融合 多领域分类
在线阅读 下载PDF
基于K-means++算法与YDSE算法的多农机协同优化 被引量:1
4
作者 彭汪忆楠 赖惠成 +1 位作者 于逸然 张过 《计算机应用研究》 北大核心 2025年第5期1453-1461,共9页
针对农业生产中农机磨损问题常被忽视,导致任务分配和路径规划不合理的问题,提出一种高效的任务分配与路径规划算法,基于磨损感知的多农机协同优化方法(wear-aware multi-machine collaborative optimization method,WAMMCO),以提高农... 针对农业生产中农机磨损问题常被忽视,导致任务分配和路径规划不合理的问题,提出一种高效的任务分配与路径规划算法,基于磨损感知的多农机协同优化方法(wear-aware multi-machine collaborative optimization method,WAMMCO),以提高农业生产效率。首先,开发了一种融合荷兰式拍卖机制和惩罚因子机制的改进K-means++算法,并引入偏置处理,以实现农机工作负荷的均衡分配;其次,基于杨氏双缝实验(YDSE)原理,设计了一种元启发式算法,该算法结合离散化处理和多扰动策略,以优化农机作业路径并寻找最短作业路径;最后,结合贪心算法(GA)和农机的实际磨损情况,实现了农机的高效分配。仿真实验结果表明,在任务分配阶段,该算法比相同偏置约束下的constrained-balanced K-means++算法具有更快的运算速度;在路径规划阶段,与ACO、GWO、BWO、HO等算法相比,该算法在寻找全局最优解和收敛时间上表现更优;在农机分配阶段,不同农机数量下,该算法展现出其可行性、有效性和合理性,为农业生产智能化管理提供了新的技术支持,显著提升了农机作业的综合性能。 展开更多
关键词 农业机械 K-means++算法 杨氏双缝实验算法 贪心算法 农机磨损
在线阅读 下载PDF
氮肥基追比和种植模式对棉花氮素代谢和叶片衰老以及产量的影响 被引量:1
5
作者 徐新龙 张巨松 +5 位作者 代健敏 席亚雯 李雪瑞 王莲 李蔚和 孙华键 《中国生态农业学报(中英文)》 北大核心 2025年第4期709-722,共14页
为确定新疆棉区棉花高产高效栽培的合理施肥策略,研究了氮肥基追比例对不同种植模式棉花氮素利用效率、叶片衰老特性及产量的影响。以‘新陆中84号’棉花品种为研究对象,于2022—2023年在新疆沙雅县海楼镇进行田间试验。采用裂区设计,以... 为确定新疆棉区棉花高产高效栽培的合理施肥策略,研究了氮肥基追比例对不同种植模式棉花氮素利用效率、叶片衰老特性及产量的影响。以‘新陆中84号’棉花品种为研究对象,于2022—2023年在新疆沙雅县海楼镇进行田间试验。采用裂区设计,以2种种植模式为主区:一膜六行(66 cm+10 cm宽窄行距、株距12 cm,M6)、一膜三行(76 cm等行距、株距6 cm,M3);以4种氮肥基追比例为副区:0:0(CK,不施氮)、0:10 (N0)、2:8(N2)、4:6(N4);共8个处理。施氮处理总施氮量均为320 kg·hm^(2)。本文测定了棉花不同生育期氮代谢酶及叶片衰老相关酶活性、氮素利用效率、产量及产量构成。结果表明,2022年和2023年M3N4处理的棉花可获得较高籽棉产量,分别为7342.59和8085.19 kg·hm^(-2),较M6N2处理(M6最优产处理)提高12.05%和6.18%;M3N4处理表现出更好的结铃性,单株铃数较M6N2处理增加10.17%,但单铃重平均减少1.48%。M3N4处理在盛花—盛铃期棉花功能叶可保持较高的酶活性,促进棉花氮代谢,延长叶片功能期;M3模式整体较M6模式的氮素最大积累速率(Vm)有所降低,氮素最大积累速率出现时间(T)略有推迟,快速累积持续持续天数(Δt)增加3.85~11.64 d,氮素快速增长期生长特征值(TG)提高4.23%~27.60%。M3模式下各氮肥处理棉株氮素总积累量均高于M6模式对应氮肥处理,M3N4处理营养器官氮素积累量显著高于其他处理;M3N4处理棉花氮肥农学利用率、氮肥回收率和氮肥偏生产力较于M6N2处理分别增加7.77%、10.56%和8.90%,但氮肥生理利用率降低3.03%。合理的氮肥基追比和种植模式可调控棉株个体和群体之间的关系,加快棉花氮代谢水平,增加棉株各器官氮素积累转运量,进而提高氮素利用效率,通过提高生理代谢酶活性延缓棉花叶片衰老,维持较高棉株单株铃数,从而充分发挥棉花生产潜力。在本试验条件下,选择76 cm等行距种植模式,氮肥基追比控制在4:6为增产最优组合。 展开更多
关键词 棉花 种植模式 氮肥基追比 氮素代谢 叶片衰老
在线阅读 下载PDF
GCW-YOLOv8n:轻量级安全帽佩戴检测算法 被引量:1
6
作者 徐壮 钱育蓉 颜丰 《计算机工程与应用》 北大核心 2025年第3期144-154,共11页
我国是世界工业大国,在各种施工环境下,施工材料的坠落以及施工现场的碰撞是造成伤亡事故的主要原因。因头部伤害而导致的伤亡事故时有发生,而佩戴安全帽可以最大程度上保证施工人员的安全。为解决人工管理的时效性差、管理效率低下,现... 我国是世界工业大国,在各种施工环境下,施工材料的坠落以及施工现场的碰撞是造成伤亡事故的主要原因。因头部伤害而导致的伤亡事故时有发生,而佩戴安全帽可以最大程度上保证施工人员的安全。为解决人工管理的时效性差、管理效率低下,现有模型对算力需求较为严苛,内存需求大,以及工业设备在处理负载和数据传输延迟的问题,实现边缘计算、实时管控,提出一种基于YOLOv8n的改进安全帽佩戴检测算法。提出了一种新的GS-C2f模块,该模块引入GhostConv及SE(squeeze-and-excitation)注意力机制,有效降低了模型计算量及其复杂度,同时帮助网络有效提取特征。在Neck部分引入CBAM注意力机制,使模型加强对有效特征的关注。引入Wise-IoUv3进一步提高模型的精度。经实验,该模型对比原YOLOv8n模型,在计算参数下降21.24%的同时,识别精度提升了0.01,在模型精度和复杂度之间均取得了令人满意的效果。 展开更多
关键词 YOLOv8n 安全帽佩戴检测 GhostConv CBAM注意力机制
在线阅读 下载PDF
多尺度视觉增强语音驱动人脸生成
7
作者 杨想彦 梁慧慧 +1 位作者 陈希 李凡 《西安交通大学学报》 北大核心 2025年第6期167-176,共10页
针对现有语音驱动人脸生成方法在生成人脸视频清晰度和真实感方面的不足,设计了一种多尺度视觉增强的端到端人脸视频生成模型———VisClearTalk,并提出包含视觉增强模块的人脸解码器。首先,采用人脸编码器处理包含随机参考帧和下半张... 针对现有语音驱动人脸生成方法在生成人脸视频清晰度和真实感方面的不足,设计了一种多尺度视觉增强的端到端人脸视频生成模型———VisClearTalk,并提出包含视觉增强模块的人脸解码器。首先,采用人脸编码器处理包含随机参考帧和下半张脸被遮挡的先验帧,从中提取面部特征;接着,采用语音编码器从音频中提取特征,以指导面部内容生成;随后,采用人脸解码器融合上述特征,并通过卷积模块初步重建面部图像;最后,采用视觉增强模块将多尺度卷积和残差融合,进一步增强人脸下半部分区域的细节和边缘信息,从而提升生成人脸视频的视觉质量。使用公开唇语识别数据集对VisClearTalk模型进行实验验证,结果表明:通过引入视觉增强模块,该模型有效提升了面部视觉内容的细腻程度和真实感,能够生成清晰自然的人脸视频;在性能指标方面,峰值信噪比达到34.349dB,结构相似度达到0.933,可学习感知图像块相似度降低至0.040。研究结果可为当前人脸生成需求提供一种解决方案。 展开更多
关键词 语音驱动 人脸生成 视觉增强 视觉质量
在线阅读 下载PDF
认知MIMO系统非正交动态时隙分配能耗优化研究
8
作者 费恒海 葛文萍 +1 位作者 陈娟 陈紫康 《电子科技大学学报》 北大核心 2025年第2期250-256,共7页
认知MIMO系统中同时存在多类用户时,不同类型用户受不同约束条件限制,对时隙会有不同需求。该文旨在解决多类用户并存的认知MIMO系统能耗优化问题,提出基于稀疏码多址接入(sparse code multiple access,SCMA)的非正交时隙分配方法,满足... 认知MIMO系统中同时存在多类用户时,不同类型用户受不同约束条件限制,对时隙会有不同需求。该文旨在解决多类用户并存的认知MIMO系统能耗优化问题,提出基于稀疏码多址接入(sparse code multiple access,SCMA)的非正交时隙分配方法,满足更多类型用户的通信需求。在分配时隙时,提出动态时隙分配算法,通过设计虚拟用户进行时隙分配,保证不同类型用户不会占用同一个时隙。仿真结果和分析表明,系统中多类用户同时存在于eMBB(enhanced mobile broadband)和URLLC(ultra-reliable low latency communications)两种场景中时,基于SCMA的非正交动态时隙分配与传统正交分配方式相比能够降低能耗,与固定时隙的非正交时隙分配相比,动态时隙分配算法降低系统能耗的效果更明显。 展开更多
关键词 认知MIMO 动态时隙分配 能耗优化 SCMA
在线阅读 下载PDF
基于残差注意力编-解码网络的道路提取方法
9
作者 齐然然 帕力旦·吐尔逊 +1 位作者 汤泊川 钱育蓉 《计算机工程与科学》 北大核心 2025年第1期119-129,共11页
针对遥感图像中相似形状地物对道路提取造成干扰的问题,提出基于残差注意力的编-解码网络RAED-Net。RAED-Net的编码网络采用改进的通道注意力残差模块来提取输入图像的局部特征和全局特征,自适应地调整通道特征映射的权重,提高对重要通... 针对遥感图像中相似形状地物对道路提取造成干扰的问题,提出基于残差注意力的编-解码网络RAED-Net。RAED-Net的编码网络采用改进的通道注意力残差模块来提取输入图像的局部特征和全局特征,自适应地调整通道特征映射的权重,提高对重要通道信息的关注,减少背景干扰。在解码网络中引入条形卷积模块,提高上采样过程中跨通道信息交互以及对道路边缘细节信息的恢复能力,提升复杂环境中道路提取结果的准确度。在2个不同类型公开数据集上的对比实验结果表明,RAED-Net能够准确提取道路信息,缓解了相似地物对道路提取带来的干扰问题,取得综合最优结果且参数量最少。尤其在全像素标注、复杂性较高的mini DGRD数据集上的F1、IoU和mIoU分别比次优网络提高了3.53%,5.76%和2.21%。 展开更多
关键词 遥感图像 道路提取 编-解码网络 通道注意力
在线阅读 下载PDF
基于跨模态融合与双曲图注意力机制的视频异常检测
10
作者 姜迪 赖惠成 汪烈军 《通信学报》 北大核心 2025年第6期136-152,共17页
针对视频异常检测中模态信息不平衡、视听噪声不平均以及模态异步等问题,提出了一个动态跨模态融合模块与双曲图注意力机制融合的多模态视频异常检测方法CM-HVAD,以准确检测异常行为。首先,提出了一种新的动态跨模态融合模块,动态压缩... 针对视频异常检测中模态信息不平衡、视听噪声不平均以及模态异步等问题,提出了一个动态跨模态融合模块与双曲图注意力机制融合的多模态视频异常检测方法CM-HVAD,以准确检测异常行为。首先,提出了一种新的动态跨模态融合模块,动态压缩多模态数据特征,自主学习跨模态权重,动态平衡视觉特征和音视频特征并进行融合增强。然后,针对多模态数据中存在的模态异步问题,提出了模态一致性对齐模块,按时间帧序列对齐模态语义,确保多模态数据在时间和语义上的一致性。最后,引入了双曲图注意力机制,通过双曲空间的模式分离特性,有效捕捉正常和异常表示之间的层次关系,从而提高检测准确率。实验结果表明,所提方法在XD-Violence上AP达到了86.47%,在UCF-Crime上AUC达到了87.12%,性能优于基线方法。 展开更多
关键词 视频异常检测 跨模态融合 双曲图注意力机制 多模态
在线阅读 下载PDF
说话人验证中基于语音质量的自适应损失函数研究
11
作者 王佳龙 陈奕豪 +2 位作者 许敏强 何亮 方磊 《小型微型计算机系统》 北大核心 2025年第7期1585-1589,共5页
说话人验证任务中模型性能与语音质量有关,但目前研究并未关注语音质量的高低对模型能力的影响,因此本文提出了一种基于语音数据质量的自适应损失函数的方法.首先本文观察到说话人特征的模长与语音质量存在正相关性;其次根据说话人特征... 说话人验证任务中模型性能与语音质量有关,但目前研究并未关注语音质量的高低对模型能力的影响,因此本文提出了一种基于语音数据质量的自适应损失函数的方法.首先本文观察到说话人特征的模长与语音质量存在正相关性;其次根据说话人特征模长,本文提出了一种新型损失函数(AMGsoftmax),通过更加关注高质量大模长的样本,实现自适应调整不同质量数据的损失函数,从而提升模型识别能力.实验结果表明,AMGsoftmax与常用的AMsoftmax损失函数相比,在VoxCeleb1-O数据集上,等误识率(EER)相对降低了9.69%;在VoxSRC21-val数据集上,EER相对降低了7.38%. 展开更多
关键词 说话人验证 语音质量 损失函数
在线阅读 下载PDF
面向野外环境的视觉惯导SLAM算法
12
作者 李静博 伊克萨尼·普尔凯提 +2 位作者 朱斌 朱纪洪 艾斯卡尔·艾木都拉 《计算机工程与设计》 北大核心 2025年第4期1005-1012,共8页
过去的定位研究大多是在结构化环境下进行研究的,但在野外环境下由于光照变化大、特征提取困难和颠簸道路多导致定位困难。提出一个由单目相机和惯性测量单元组成的可视化视觉惯导里程计,前端通过融合基于泊松方程预处理的视觉信息和惯... 过去的定位研究大多是在结构化环境下进行研究的,但在野外环境下由于光照变化大、特征提取困难和颠簸道路多导致定位困难。提出一个由单目相机和惯性测量单元组成的可视化视觉惯导里程计,前端通过融合基于泊松方程预处理的视觉信息和惯性测量单元信息,后端采用非线性优化并结合鲁棒核函数使系统能够在光照变化大和颠簸道路的野外环境下鲁棒运行。实验结果表明,算法在ROOAD野外环境数据集中的表现比最先进的视觉惯导方法精度更高,鲁棒性更强,在EuRoC结构化数据集中的表现也超越现阶段最先进的算法。 展开更多
关键词 同时定位与建图 定位 单目相机 惯性测量单元 野外环境 自动驾驶 环境感知
在线阅读 下载PDF
基于遗传算法和A^(*)算法的多农机协同作业优化方法
13
作者 于逸然 赖惠成 +4 位作者 高古学 张过 彭汪忆楠 杨龙飞 黄俊豪 《系统仿真学报》 北大核心 2025年第9期2397-2408,共12页
针对多农业机械(简称农机)协同作业中的任务分配不均和农机转向路口较多导致时间成本较大问题,提出一种预热策略改进分组遗传算法(pre-heat multi grouped genetic algorithm,PHMGA)与转向约束A^(*)算法(turn A^(*),tA^(*))相结合的任... 针对多农业机械(简称农机)协同作业中的任务分配不均和农机转向路口较多导致时间成本较大问题,提出一种预热策略改进分组遗传算法(pre-heat multi grouped genetic algorithm,PHMGA)与转向约束A^(*)算法(turn A^(*),tA^(*))相结合的任务规划方法。PHMGA基于已知环境为每台农机分配任务,通过考虑行驶、作业及转向距离的代价目标函数确保任务量均衡,并设计多种算子和策略,以搜寻近似最优解。tA^(*)算法则用于选择田间路径,通过转向惩罚规避转向路口较多的复杂区域,进一步缩短作业时间。仿真结果表明:所提算法有效均衡了每台农机的工作量并显著降低了作业时间和等待时间,相比传统算法分别减少了5%和56%~67%。 展开更多
关键词 农业机械 改进分组遗传算法 改进A^(*)算法 多机协同作业规划 任务分配 路径规划
在线阅读 下载PDF
基于Squeezeformer的多颗粒度多方面发音质量评测方法
14
作者 费涛 艾山·吾买尔 +1 位作者 杜文旭 朱翠翠 《计算机工程》 北大核心 2025年第1期81-87,共7页
口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评... 口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评分某一项指标单方面进行评分。设计将Transformer替换Squeezeformer的改进模型Squeezeformer-MR对基线模型进行改进,Squeezeformer-MR使用多个残差连接增强了前后特征信息的传递。实验中,在参数设置上保持与基线模型一致,使用最稳定的24层嵌入层时,音素级、词级和句子级方面的综合评分的皮尔逊相关系数(PCC)相比基线模型分别提升了1.96%、6.37%和1.08%。在初次改进的基础上,使用WavLM和HuBERT预训练模型对训练集提取相应的特征,将提取到的预训练特征以拼接方式添加到原GOP特征中进行特征融合,使用融合特征以相同方式进行训练,得到的音素级、词级和句子级方面综合评分的PCC相比基线模型分别提升了2.45%、7.10%和1.89%。 展开更多
关键词 Squeezeformer模型 发音质量评测 预训练模型 特征融合 皮尔逊相关系数
在线阅读 下载PDF
LMFI-YOLO:复杂场景下的轻量化行人检测算法
15
作者 袁婷婷 赖惠成 +2 位作者 汤静雯 张晞 高古学 《计算机工程与应用》 北大核心 2025年第15期111-123,共13页
针对当前行人检测算法在复杂场景下存在误检、漏检及模型复杂度高等问题,提出一种改进YOLO11的轻量化行人检测算法——LMFI-YOLO融合RepConv来改进C3k2模块,构建RS-C3k2结构,以增强网络对行人特征的学习与捕捉能力。设计全新的颈部结构M... 针对当前行人检测算法在复杂场景下存在误检、漏检及模型复杂度高等问题,提出一种改进YOLO11的轻量化行人检测算法——LMFI-YOLO融合RepConv来改进C3k2模块,构建RS-C3k2结构,以增强网络对行人特征的学习与捕捉能力。设计全新的颈部结构MBFPN,结合高效上采样模块与多尺度卷积模块,以强化特征融合并提升行人的特征表达能力,大幅提高检测精度。设计任务交互检测头TD-Detect,通过共享卷积与任务交互机制显著减少参数量和模型大小。为进一步提高检测精度,采用Focaler-GIoU作为边界框回归损失函数,通过聚焦不同回归样本来提升目标定位与整体性能。实验结果表明,所提算法在CityPersons数据集上mAP50提升8.5个百分点,模型参数量降至1.8×10^(6),模型大小压缩至4.1 MB;在TinyPerson与CrowdHuman数据集上的泛化性实验表明,该算法在小尺寸目标和遮挡场景下的mAP50分别提升6.0和4.0个百分点。综合来看,LMFI-YOLO在保证检测精度显著提升的同时大幅降低了模型复杂度。 展开更多
关键词 行人检测 小目标行人 遮挡行人 深度卷积 任务交互
在线阅读 下载PDF
BF-YOLO:基于YOLOv8改进的小目标检测算法
16
作者 蒲小莉 赖惠成 高古学 《计算机工程与科学》 北大核心 2025年第8期1425-1436,共12页
针对现有的目标检测算法对无人机拍摄目标检测精度较低、模型大且不易于部署的问题,提出改进YOLOv8的目标检测算法BF-YOLO。首先,对网络的输出检测层进行重构,增强了算法模型对小目标的检测能力;其次,引入感受野注意力卷积替换普通卷积... 针对现有的目标检测算法对无人机拍摄目标检测精度较低、模型大且不易于部署的问题,提出改进YOLOv8的目标检测算法BF-YOLO。首先,对网络的输出检测层进行重构,增强了算法模型对小目标的检测能力;其次,引入感受野注意力卷积替换普通卷积,使网络关注目标位置信息,增强了模型对目标特征的学习能力;此外,设计了多尺度信息提取模块,通过多个分组卷积单元来提取不同感受野下的目标信息,减少模型参数量的同时提高了检测精度;最后,引入加权双向特征融合来改进颈部网络,实现多尺度特征融合,提高了模型对多尺度目标的识别能力。实验结果表明,在VisDrone-DET2019数据集上,改进后算法的mAP50比YOLOv8s提高了7.3%,且模型参数量减少了67.1%,有效实现了检测精度和模型轻量化的平衡。 展开更多
关键词 无人机图像 小目标检测 YOLOv8 特征融合
在线阅读 下载PDF
文本问答中基于双向叠加注意力的证据区间预测
17
作者 吐尔地·托合提 罗长虹 艾斯卡尔·艾木都拉 《计算机工程与科学》 北大核心 2025年第8期1470-1482,共13页
文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉... 文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉匹配来丰富隐式交互的文本语义;其次,根据证据分布互异性设计软证据标签对来表示前向和后向证据得分;最后,对序列中每个位置的证据得分双向叠加以获得更符合上下文语境要求的证据区间。实验结果表明,所提方法在Span-F1,Span-EM等评价指标上较基线模型有所提升,证实了其在复杂语境中能够有效提高证据区间预测精确度和问答准确性。 展开更多
关键词 文本问答 证据区间 注意力机制 双向叠加 软证据标签
在线阅读 下载PDF
基于双重分类和重建的跨域图异常检测
18
作者 苏世玉 于炯 +1 位作者 李姝 酒世承 《计算机科学》 北大核心 2025年第8期374-384,共11页
跨域图异常检测通过带标签的源图辅助无标签目标图,提升了异常节点检测的准确性,进而有效降低了无监督图异常检测中的高误报率。尽管已有多种领域自适应方法被相继提出,但图数据复杂的拓扑结构与节点属性之间的关系使得源图与目标图之... 跨域图异常检测通过带标签的源图辅助无标签目标图,提升了异常节点检测的准确性,进而有效降低了无监督图异常检测中的高误报率。尽管已有多种领域自适应方法被相继提出,但图数据复杂的拓扑结构与节点属性之间的关系使得源图与目标图之间的特征难以对齐;此外,图异常节点的多样性进一步增加了域对齐后的检测难度。为了解决上述问题,提出了一种新的跨域图异常检测框架,即双重分类和重建网络(Dual Classification and Reconstruction Network,DCRN)。该网络采用重建策略进行领域自适应,通过联合优化结构和属性的共享编码器、异常分类器和解码器,使共享编码器能够有效捕捉源图与目标图之间复杂的拓扑结构和节点属性关系,实现特征对齐与知识迁移。在对目标图进行异常检测的过程中,DCRN结合异常分类器和解码器的检测结果,识别与源图相似的异常节点以及仅存在于目标图中的特有异常,从而提升了模型的检测效果。在4个真实数据集上的实验表明,与10种基线方法相比,DCRN的AUC-ROC和AUC-PR平均提升了4.5%和20.5%,且FAR指标降低了16.13%。这些结果表明DCRN能够有效地检测目标图中的异常节点。 展开更多
关键词 异常检测 属性图 域自适应 图神经网络 知识迁移
在线阅读 下载PDF
MBFE-DETR:多尺度边界特征增强下的无人机目标检测算法
19
作者 张晞 赖惠成 +4 位作者 姜迪 汤静雯 高古学 袁婷婷 聂源 《计算机工程与应用》 北大核心 2025年第17期89-101,共13页
针对无人机视角下背景复杂、小目标比例较高且样本不平衡等问题,提出一种基于改进RT-DETR的无人机目标检测算法MBFE-DETR。设计一种基于C2f和单头自注意力模块的轻量化主干网络,降低模型参数量的同时提升网络的特征提取能力。提出多尺... 针对无人机视角下背景复杂、小目标比例较高且样本不平衡等问题,提出一种基于改进RT-DETR的无人机目标检测算法MBFE-DETR。设计一种基于C2f和单头自注意力模块的轻量化主干网络,降低模型参数量的同时提升网络的特征提取能力。提出多尺度边界特征增强协同网络MBFECN,通过其特有的多尺度边界特征增强机制和高效特征融合策略,解决了原模型在保持小目标边界细节方面的不足。引入Focaler-MPDIoU考虑框的位置匹配关系,同时通过线性区间映射重构原有IoU损失,使模型在复杂场景下的定位效果更好。针对样本不平衡的问题,采用新的分类损失函数ESVLoss,对分类损失值进行分段加权调整,并结合指数移动平均机制对权重进行动态平滑更新,使模型更具适应性。实验结果表明,在VisDrone2019-DET和DOTAv1.0数据集上,MBFE-DETR算法的mAP50分别提升3.9和2.9个百分点,同时参数量减少了21.6%。 展开更多
关键词 无人机目标检测 RT-DETR 单头自注意力 边界特征增强
在线阅读 下载PDF
改进U-Net++的遥感影像变化检测算法
20
作者 丁安安 周文婷 +2 位作者 李新 蔡子轩 沈佳 《遥感信息》 北大核心 2025年第3期95-103,共9页
针对高分辨率双时相遥感影像变化检测中出现的小目标区域漏检、伪变化较多、样本不平衡等问题,提出一种基于改进U-Net++的SUPNet变化检测模型。首先,利用孪生网络和基于融合了空-谱特征协同策略(SSFC)的多尺度空间解耦卷积(MSDConv)而... 针对高分辨率双时相遥感影像变化检测中出现的小目标区域漏检、伪变化较多、样本不平衡等问题,提出一种基于改进U-Net++的SUPNet变化检测模型。首先,利用孪生网络和基于融合了空-谱特征协同策略(SSFC)的多尺度空间解耦卷积(MSDConv)而改进的U-Net++作为骨干网络来对特征进行初步提取和融合;其次,通过并行卷积模块对粗变化特征图进行进一步特征集成;最后,使用包含两种注意力机制的混合注意力模块对特征进行细化,以此来获取精准的变化区域。实验采用公开的LEVIR-CD和SYSU-CD数据集进行训练和测试。结果表明,相对于其他7种主流的深度学习变化检测方法,SUPNet变化检测模型在精确率、召回率、F1分值、交并比和总精度方面具有好的表现,证明该模型具有良好的检测性能和泛化能力。 展开更多
关键词 变化检测 孪生网络 U-Net++ 注意力机制 并行卷积
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部