期刊文献+
共找到609篇文章
< 1 2 31 >
每页显示 20 50 100
双向特征图增强的图卷积网络算法
1
作者 李梦茜 高心丹 李雪 《计算机科学》 北大核心 2025年第7期127-134,共8页
图卷积神经网络算法在图结构数据的处理中起着至关重要的作用。现有图卷积网络的主流模式是基于拉普拉斯矩阵对节点特征进行加权求和,更侧重于对卷积聚合方式进行优化,忽略了图数据自身的先验信息。为充分挖掘图数据背后所蕴涵的丰富属... 图卷积神经网络算法在图结构数据的处理中起着至关重要的作用。现有图卷积网络的主流模式是基于拉普拉斯矩阵对节点特征进行加权求和,更侧重于对卷积聚合方式进行优化,忽略了图数据自身的先验信息。为充分挖掘图数据背后所蕴涵的丰富属性与结构信息,有效降低图数据中的噪音比例,提出双向特征图增强的图卷积网络算法,通过节点度和相似度计算增强图数据的拓扑空间特征和属性空间特征,然后将两种增强的图特征表示同时在拓扑空间和属性空间中传播,并利用注意力机制自适应融合学习到的嵌入。此外,针对深度图卷积神经网络易发生过平滑的问题,提出一种多输入残差结构,将初始残差和高阶邻域残差相结合,以实现模型在任意卷积层对初始特征和高阶邻域特征的均衡提取。在3个公共数据集上进行实验,结果表明该网络比现有网络具有更好的分类性能。 展开更多
关键词 图卷积网络 图注意力网络 图数据增强 特征提取 节点分类
在线阅读 下载PDF
高低频特征融合的低照度图像增强方法
2
作者 王德文 胡旺盛 +1 位作者 张润磊 赵文清 《智能系统学报》 北大核心 2025年第3期641-648,共8页
针对现有低照度图像增强方法中性能与开销不平衡的问题,本文提出一种高低频特征融合的低照度图像增强方法。该方法在多尺度上提取几何特征丰富的低频特征与语义特征丰富的高频特征,经过高低频特征融合得到增强图像,在保证良好图像质量... 针对现有低照度图像增强方法中性能与开销不平衡的问题,本文提出一种高低频特征融合的低照度图像增强方法。该方法在多尺度上提取几何特征丰富的低频特征与语义特征丰富的高频特征,经过高低频特征融合得到增强图像,在保证良好图像质量的同时降低开销。为提升低照度环境下的特征提取能力,构建残差混合注意力模块,从像素与通道两方面对重要的局部区域给予更多关注。针对下采样导致的信息丢失问题,提出一种特征合并模块对下采样后的特征进行特征补充。此外,通过多级残差密集连接模块增强特征复用能力。在SID(see-in-the-dark)数据集上的实验表明,该方法峰值信噪比和结构相似度分别达到29.67和0.792,模型参数量仅为1.5×10^(6)。 展开更多
关键词 低照度 图像增强 高频特征 低频特征 特征融合 注意力 多尺度 残差网络 密集连接
在线阅读 下载PDF
自监督短期兴趣特征增强的短视频推荐方法研究
3
作者 刘芳 王晓晖 +3 位作者 田枫 赵玲 黄美晨 孙嘉伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第6期91-99,共9页
现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term in... 现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term interest feature enhancement,SSER)。该模型采用自监督的对比学习方法对用户长短期兴趣进行解纠缠,针对短期兴趣表示提取不完全的问题,提出采用扩展循环神经网络(dilated RNN)从非线性的用户交互序列中有效捕捉用户短期兴趣表示;针对短期兴趣代理提取不完全的问题,提出一种多头自注意力机制的短期兴趣代理增强方式,该方式首先使用自注意力机制对短期交互序列嵌入数据进行噪声消除,随后融合从用户序列中提取的短期兴趣普遍特征和突出特征形成融合向量,采用多头自注意力机制从融合向量中提取短期兴趣代理,从而有效增强短期兴趣代理的提取。在KuaiRec短视频数据集上进行了多项实验,结果表明该模型在多个评价指标上优于其他主流方法。 展开更多
关键词 自监督对比学习 短期兴趣特征增强 短视频推荐 扩展循环神经网络 多头自注意力机制
在线阅读 下载PDF
金字塔渐进融合低照度图像增强网络 被引量:1
4
作者 余映 徐超越 +2 位作者 李淼 何鹏浩 杨昊 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第2期224-237,共14页
针对现有低照度图像增强网络对不同尺度特征信息存在感知与表达能力不足的问题,提出金字塔渐进融合低照度图像增强网络模型。网络对图像进行多次下采样操作以组成特征金字塔,通过在特征金字塔的三个不同分支上加入跳跃连接,将不同尺度... 针对现有低照度图像增强网络对不同尺度特征信息存在感知与表达能力不足的问题,提出金字塔渐进融合低照度图像增强网络模型。网络对图像进行多次下采样操作以组成特征金字塔,通过在特征金字塔的三个不同分支上加入跳跃连接,将不同尺度的特征图进行相互融合。通过精细恢复模块进一步提取精炼信息,将特征图恢复到正常的光照图像。结果表明,该网络模型不但能有效地提升低照度图像的整体亮度,而且能很好地保持图像中的细节信息和清晰的物体边缘轮廓,同时能够有效地抑制图像中的暗部噪声,使增强后的图像整体画面真实自然。 展开更多
关键词 低照度图像增强 深度学习 特征金字塔 多尺度特征 跳跃连接
在线阅读 下载PDF
感知增强混合网络的水下目标检测
5
作者 姚婷婷 李宁 张煜 《光学精密工程》 北大核心 2025年第8期1303-1312,共10页
水下目标检测技术在海洋资源勘探、环境保护等领域发挥着重要作用。然而,水下环境存在成像模糊、目标尺度多变等问题给检测任务带来了难度。为提高水下目标检测精度,提出一种感知增强混合网络。首先,构建全局-局部混合增强特征提取主干... 水下目标检测技术在海洋资源勘探、环境保护等领域发挥着重要作用。然而,水下环境存在成像模糊、目标尺度多变等问题给检测任务带来了难度。为提高水下目标检测精度,提出一种感知增强混合网络。首先,构建全局-局部混合增强特征提取主干网络,利用自注意力机制求取图像中的长程全局信息,进一步构建卷积注意力增强模块提取更丰富的图像局部细节信息。通过在特征提取过程中更好地捕获图像全局和局部特征关联,增强各尺度特征描述的判别性;随后,为提高成像模糊对比低时的目标检测精度,构建目标感知增强双阶段检测头。通过增加一阶段区域提议生成网络的深度,在低质图像中提取更多目标语义信息,并通过在二阶段引入自注意力机制,抑制背景或次要信息干扰。进一步引入目标检测交并比分支,将一阶段目标先验信息融入二阶段分类求解中,提高不同种类目标的检测精度。所提方法在水下目标检测数据集TrashCan与WPBB上的mAP0.5:0.95和AP50分别达到了37.8%,61.8%和82.0%,98.9%。定性和定量的对比实验结果表明,模型对不同种类水下目标均具有良好的检测准确性和鲁棒性。 展开更多
关键词 水下目标检测 特征增强 自注意力机制 混合网络
在线阅读 下载PDF
结合信噪比引导的双分支结构和直方图均衡的低照度图像增强网络
6
作者 黄颖 高胜美 +1 位作者 陈广 刘苏 《计算机应用》 北大核心 2025年第6期1971-1979,共9页
针对基于深度学习的低照度图像增强(LLIE)技术普遍依赖成对的数据集进行训练的问题,考虑实际应用中配对数据集的获取难度较高及其可能导致网络的泛化能力受限的问题,提出一种结合信噪比(SNR)引导的双分支结构和直方图均衡(HE)的LLIE网络... 针对基于深度学习的低照度图像增强(LLIE)技术普遍依赖成对的数据集进行训练的问题,考虑实际应用中配对数据集的获取难度较高及其可能导致网络的泛化能力受限的问题,提出一种结合信噪比(SNR)引导的双分支结构和直方图均衡(HE)的LLIE网络,从而摆脱对配对数据集的依赖。首先,在生成对抗网络(GAN)的框架上,引入卷积神经网络(CNN)和Transformer的双分支结构,并使用SNR图像指导网络自适应地增强图像的不同区域,以有效平衡图像增强和噪声抑制;其次,采用经HE处理的低照度图像约束生成结果,从而显著提升生成图像的纹理细节;最后,在鉴别器部分,结合全局与局部鉴别器确保生成图像与参考图像在分布上的一致性,进一步提高图像的视觉质量。为了验证所提网络的有效性,在LOL与LSRW测试集上进行测试,与包含监督和无监督的10种先进方法进行比较。实验结果表明,在LOL数据集上,所提网络的峰值信噪比(PSNR)为19.15 dB,结构相似性指数(SSIM)为0.7051,均位列第2名;在LSRW数据集中,所提网络以17.28 dB的PSNR和0.4857的SSIM分别获得第1名与第2名;具体地,在LSRW数据集上,所提网络的PSNR相较于KinD(Kindling the Darkness)和EnlightenGAN(deep light Enhancement without paired supervision Generative Adversarial Network)方法分别提升了15.7%和9.6%。可见,所提网络与无监督方法和部分有监督方法相比均展现了更优越的性能,且显著提升了生成图像的质量。 展开更多
关键词 低照度图像增强 无监督学习 生成对抗网络 直方图均衡 特征融合
在线阅读 下载PDF
面向超分辨率重建的层次间局部特征增强网络
7
作者 王晓峰 黄煜婷 +2 位作者 张文尉 张轩 陈东方 《计算机工程与设计》 北大核心 2024年第8期2407-2414,共8页
基于卷积神经网络的超分辨率重建模型以单项传播为主,层次越靠后感知信息的能力越微弱,导致层次间局部特征部分丢失,难以实质提升网络的特征表达能力。针对此问题,提出层次间局部特征增强网络。该方法由级联残差模块、层次间特征增强块... 基于卷积神经网络的超分辨率重建模型以单项传播为主,层次越靠后感知信息的能力越微弱,导致层次间局部特征部分丢失,难以实质提升网络的特征表达能力。针对此问题,提出层次间局部特征增强网络。该方法由级联残差模块、层次间特征增强块和特征感知注意力机制组成。级联残差模块通过有效残差连接增加对残差分支信息的利用;层次间特征增强块提取不同深度特征的依赖关系,自适应调整中间层特征权值增强捕获关键信息的能力;特征感知注意力机制采用方向感知和位置判断的方式准确定位和识别感兴趣对象。多项标准数据集的实验结果表明,该方法能改善超分辨率的视觉重建效果,整体性能优于现有方法。 展开更多
关键词 卷积神经网络 超分辨率 局部特征增强 级联残差模块 注意力机制 方向感知 位置判断
在线阅读 下载PDF
采用多尺度特征增强的路面病害检测模型 被引量:1
8
作者 胡鹏 夏晓华 +3 位作者 钟预全 段智威 姚运仕 成高立 《西安交通大学学报》 北大核心 2025年第2期156-169,共14页
针对现有网络多尺度特征提取能力不足造成路面病害因尺寸差异难以完全识别的问题,提出了一种多尺度特征增强的路面病害检测模型。构建基于混合空洞卷积的快速空间金字塔池化模块,通过堆叠不同膨胀系数的空洞卷积进一步扩大网络感受野,... 针对现有网络多尺度特征提取能力不足造成路面病害因尺寸差异难以完全识别的问题,提出了一种多尺度特征增强的路面病害检测模型。构建基于混合空洞卷积的快速空间金字塔池化模块,通过堆叠不同膨胀系数的空洞卷积进一步扩大网络感受野,以实现更大范围上下文信息的捕捉,并保留更多的空间信息;设计多路径特征融合网络,通过多分支和跳跃连接实现跨层级的特征捕捉,并减少特征融合过程中的信息丢失;采用K-means聚类算法结合交叉比获得合理的瞄点框;在损失函数中,设计一种面积惩罚项并设置下降梯度,提高预测框回归精度与效率;通过引入跨通道交互的高效注意力实现模型重要通道间的交互。实验结果表明:所提模型的检测精度比原模型YOLOv5s提高了4.0%;与Faster R-CNN、CenterNet等经典模型和YOLOv8s、YOLOv7n-tiny等先进模型相比,检测精度提高了1.0%~17.9%。模型经TensorRT加速引擎优化加速后,在NVIDIA Jetson TX2与NVIDIA Jetson Nano平台上的检测速率提高近1倍,同时不影响检测精度。 展开更多
关键词 路面病害检测 多尺度特征增强 混合空洞卷积 特征融合网络 高效通道注意力 嵌入式平台
在线阅读 下载PDF
轻量化的多尺度特征校准小目标检测网络
9
作者 徐杰 郭立君 +2 位作者 冯海 徐栋炯 张荣 《计算机应用》 北大核心 2025年第S1期228-234,共7页
为了解决复杂工业场景中边缘设备部署和小目标检测的漏检问题,提出一种轻量化的多尺度特征校准小目标检测网络(LMFC-Net)。首先,针对由于网络层数加深导致的浅层特征信息丢失及空间特征错位问题,提出多尺度特征校准的特征金字塔网络(MSF... 为了解决复杂工业场景中边缘设备部署和小目标检测的漏检问题,提出一种轻量化的多尺度特征校准小目标检测网络(LMFC-Net)。首先,针对由于网络层数加深导致的浅层特征信息丢失及空间特征错位问题,提出多尺度特征校准的特征金字塔网络(MSFC-FPN),利用深层特征校准浅层特征,在降低参数量的同时,提高模型对密集小目标的检测能力;其次,提出一种轻量化的共享参数卷积检测头(LSPC-Head),显著提升特征表达能力,并有效降低模型的参数和计算量;最后,通过通道剪枝和特征蒸馏降低计算和内存开销,并提升检测精度,使它适用于资源受限设备。实验结果表明,在FactorySafeDet数据集上,与YOLOv8n相比,LMFC-Net的参数量和计算量分别降低了76.7%和24.7%,召回率和平均精度均值(mAP50)分别提高了5.9和2.7个百分点。此外,在VisDrone2019、CrowdHuman和PCB公开数据集上,LMFC-Net具有良好的泛化性。与其他单阶段目标检测模型相比,LMFC-Net具有更小的模型参数量、计算量和更优的检测效果。 展开更多
关键词 小目标检测 轻量化 多尺度特征校准 特征金字塔网络 共享参数卷积检测头
在线阅读 下载PDF
融合全局-局部特征的低照度图像增强方法
10
作者 黄婷婷 曾上游 王靖 《计算机工程与应用》 北大核心 2025年第13期321-328,共8页
受环境黑暗影响或设备性能限制,所拍摄的图像往往存在低对比度、低亮度、高噪声等问题,从而使图像视觉感知质量差,成像效果不理想。为了解决上述问题,提出了一种融合全局-局部特征的低照度图像增强方法,以恢复正常光照图像。构建特征提... 受环境黑暗影响或设备性能限制,所拍摄的图像往往存在低对比度、低亮度、高噪声等问题,从而使图像视觉感知质量差,成像效果不理想。为了解决上述问题,提出了一种融合全局-局部特征的低照度图像增强方法,以恢复正常光照图像。构建特征提取模块初步提取图像的重要特征。设计了一个具有方向性注意力的Transformer准确地提取全局特征并捕获长期依赖关系,在网络结构中加入了残差模块,用于提取局部特征并关注低层次细节。采用信噪比图指导全局和局部特征融合。所提出的增强方法与现有的方法进行定性和定量的比较,并对网络结构进行了消融实验,实验结果表明,该方法能有效解决低照度图像曝光不足、色彩失真、噪声干扰等问题,具有一定的应用价值。 展开更多
关键词 低照度图像增强 特征融合 TRANSFORMER 残差网络
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
11
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
改进特征金字塔网络的小目标检测 被引量:2
12
作者 马郑凯 周林立 梁兴柱 《电光与控制》 CSCD 北大核心 2024年第12期48-54,共7页
由于小目标可视化特征少、难以定位,故许多小目标检测方法基于特征金字塔网络(FPN)进行多尺度融合丰富各特征层的信息。然而,FPN只关注特征局部相关性并且使用逐元素相加操作融合不同的特征层忽略了不同特征层感受野的不同。因此,提出... 由于小目标可视化特征少、难以定位,故许多小目标检测方法基于特征金字塔网络(FPN)进行多尺度融合丰富各特征层的信息。然而,FPN只关注特征局部相关性并且使用逐元素相加操作融合不同的特征层忽略了不同特征层感受野的不同。因此,提出增强上下文特征金字塔网络(ECFPN),设计了上下文信息增强(CIE)模块增强上下文信息,注意力引导特征融合(AGFF)模块融合高层特征图和低层特征图。实验结果表明,ECFPN在VOC2012数据集上的AP 0.5、AP S分别达到75.05%和19.48%,在NWPU VHR-10数据集上的AP 0.5、AP S分别达到93.48%和45%,具有良好的小目标检测性能。 展开更多
关键词 小目标检测 特征金字塔网络 注意力机制
在线阅读 下载PDF
分层特征细化与频域增强学习结合的空间组学细胞核分割
13
作者 李修齐 李金泽 +4 位作者 杨弃 李莹雪 赵才荣 周连群 姚佳 《光学精密工程》 北大核心 2025年第9期1456-1470,共15页
精确地将生物分子信息映射到组织切片的空间坐标是空间多组学分析的关键,细胞核分割精度直接决定靶标分子定位准确性。然而,细胞核形态多样性、组织结构复杂性以及细胞核聚集等因素造成细胞核分割困难,现有分割方法难以实现细胞核精准分... 精确地将生物分子信息映射到组织切片的空间坐标是空间多组学分析的关键,细胞核分割精度直接决定靶标分子定位准确性。然而,细胞核形态多样性、组织结构复杂性以及细胞核聚集等因素造成细胞核分割困难,现有分割方法难以实现细胞核精准分割,进而影响空间多组学分析结果。针对上述问题,结合分层特征细化和频域增强学习提出细胞核分割网络FFVM-UKAN,深度整合用于特征提取的浅层视觉状态空间模块及用于特征细化的深层令牌化Kolmogorov-Arnold网络,并提出并行频域学习模块实现细胞核分割所需精细特征捕捉,增强网络跳跃连接效果。该方法在公开数据集MoNuSeg上实现了细胞核分割,mIoU和Dice分别为69.09%和81.72%,在私有数据集上达到85.95%和92.45%。此外,在10X Genomics的人类肝脏数据集上验证基因、细胞核映射效果,结果显示基因映射准确率达90.63%。上述结果表明,本文所述方法在细胞核分割精度和模型泛化能力方面具有较好效果,实现了空间基因与细胞核的高精度映射,展现了该方法在空间多组学分析中的应用潜力。 展开更多
关键词 细胞核分割 分层特征细化 频域增强学习 Kolmogorov-Arnold网络
在线阅读 下载PDF
基于多路径增强特征的早期烟雾检测算法
14
作者 司盼召 何丽 +1 位作者 王宏伟 冉腾 《电子测量技术》 北大核心 2025年第7期142-151,共10页
早期烟雾检测是及时消除火灾隐患的有效手段,然而火灾早期的烟雾尺度小且扩散形式复杂,这使得其检测极具挑战性。针对以上问题,提出了一种基于多路径增强特征的早期烟雾检测算法MEF-YOLO。该算法采用QA-ELAN改进了骨干网络,实现了模型... 早期烟雾检测是及时消除火灾隐患的有效手段,然而火灾早期的烟雾尺度小且扩散形式复杂,这使得其检测极具挑战性。针对以上问题,提出了一种基于多路径增强特征的早期烟雾检测算法MEF-YOLO。该算法采用QA-ELAN改进了骨干网络,实现了模型复杂度和精度兼顾优化;并设计了FGCA自主增强样本区域间的特征差异,以有效捕捉烟雾的空间信息;且通过MEFAN优化特征融合路径,实现了跨层次特征间的直接交互,有效缓解了细节信息损失;又引入Wise-IOU损失函数,通过权重调整机制全面考虑位置和尺度信息,进而提高其在复杂场景的鲁棒性。实验结果表明,在不同光照以及小尺度烟雾、烟雾扩散等实验场景中,本研究提出的算法对早期烟雾的检测准确率高达92.5%,并且更具轻量化优势,参数量和GFLOPs分别下降了27.5%和30.6%。 展开更多
关键词 早期烟雾 YOLOv5 多路径增强特征聚合网络 注意力机制
在线阅读 下载PDF
结合目标特征增强与语义-位置路径聚合的水下目标检测
15
作者 宋巍 倪舟 +2 位作者 梁纪辰 张明华 王建 《计算机工程与应用》 北大核心 2025年第15期93-110,共18页
针对水下图像质量差、目标多尺度和严重遮挡导致的漏检和误检等问题,提出一种结合目标信息增强与语义-位置路径聚合的水下目标检测模型。该模型以RT-DETR框架为基础,提出了边缘特征多尺度注入模块(multiscale injection for edge featur... 针对水下图像质量差、目标多尺度和严重遮挡导致的漏检和误检等问题,提出一种结合目标信息增强与语义-位置路径聚合的水下目标检测模型。该模型以RT-DETR框架为基础,提出了边缘特征多尺度注入模块(multiscale injection for edge features module,MSI-Edge),将边缘信息注入深层网络中,强化了模型对小目标的感知能力;同时,提出了全局-局部特征增强模块(global-local feature enhancement module,GLF-Enhance)来替代编码器中的传统多头自注意力机制,增强对目标全局和局部信息的学习能力,并加速模型推理;进而,设计了一种新的结合语义-位置路径聚合网络(semantic-location path aggregation network,SL-PAN),利用高层特征作为权重来指导低层特征中的语义信息学习,再使用低层特征作为权重来指导高层特征中的位置信息学习,从而有效缓解多尺度特征融合过程中信息传递退化的问题。在公开水下数据集上进行实验验证,相较基准模型RT-DETR(ResNet50主干网络),在URPC数据集上AP、AP^(50)、AP^(75)指标分别提升了约3.2、3.0和2.7个百分点;在DUO数据集上分别提升了2.9、2.7、3.0个百分点,同时有效降低了误检和漏检率。消融实验验证了各模块的有效性。整体性能与主流目标检测器及最新水下目标检测器相比,达到了较好水平。 展开更多
关键词 水下目标检测 语义-位置路径聚合网络 边缘特征多尺度注入 RT-DETR模型 全局-局部特征增强
在线阅读 下载PDF
基于潜在特征增强网络的视频描述生成方法 被引量:2
16
作者 李伟健 胡慧君 《计算机工程》 CAS CSCD 北大核心 2024年第2期266-272,共7页
视频描述生成旨在用自然语言描述视频中的物体及其相互作用。现有方法未充分利用视频中的时空语义信息,限制了模型生成准确描述语句的能力。为此,提出一种用于视频描述生成的潜在特征增强网络(LFAN)模型。利用不同的特征提取器提取外观... 视频描述生成旨在用自然语言描述视频中的物体及其相互作用。现有方法未充分利用视频中的时空语义信息,限制了模型生成准确描述语句的能力。为此,提出一种用于视频描述生成的潜在特征增强网络(LFAN)模型。利用不同的特征提取器提取外观特征、运动特征和目标特征,将对象级的目标特征分别和帧级的外观特征与运动特征融合,同时对融合后的不同特征进行增强,在生成描述前利用图神经网络和长短时记忆网络推理对象之间的时空关系,从而得到具有时空信息和语义信息的潜在特征,同时使用长短时记忆网络和门控循环单元的解码器生成视频的描述语句。该网络模型能够准确地学习到对象特征,进而引导生成更准确的词汇及与对象之间的关系。在MSVD和MSR-VTT数据集上的实验结果表明,LFAN模型可以显著提高生成描述语句的准确性,并与视频中的内容呈现出更好的语义一致性,在MSVD数据集上的BLEU@4和ROUGE-L分数分别为57.0和74.1,在MSRVTT数据集上分别为43.8和62.1。 展开更多
关键词 视频描述生成 潜在特征增强网络 时空语义信息 图神经网络 特征融合
在线阅读 下载PDF
基于深度残差金字塔的皮肤病变分割与特征提取研究
17
作者 董春序 李雪 陈思光 《传感技术学报》 北大核心 2025年第2期263-271,共9页
由于皮肤病的类内差异大、类间差异小及样本分布不均衡导致恶性皮肤病智能诊断误诊率极高,因此提出一种基于深度残差金字塔的皮肤病变分割与特征提取机制。具体地,对比主流的单一尺度网络输出,为了提高特征提取和训练结果的准确度,构建... 由于皮肤病的类内差异大、类间差异小及样本分布不均衡导致恶性皮肤病智能诊断误诊率极高,因此提出一种基于深度残差金字塔的皮肤病变分割与特征提取机制。具体地,对比主流的单一尺度网络输出,为了提高特征提取和训练结果的准确度,构建了一个深度残差金字塔多尺度编码网络,将瓶颈层划分为多尺度编码网络,通过提取多尺度特征,实现网络分割与提取结果的输出。进一步,为了解决样本不均衡问题,设计了基于焦点损失的损失梯度监督机制,即通过焦点损失增加模型对难分样本的关注度,同时通过梯度协调机制减小难分样本和离群点对模型整体准确率的影响,从而达到减小类别不平衡对诊断结果的影响。实验结果表明,所提机制的分割与提取与现有相关方案相比,Jaccard系数提高了3%~10%,达到82.3%。 展开更多
关键词 皮肤病变 深度残差网络 特征金字塔 损失函数
在线阅读 下载PDF
基于特征感知增强的孪生跟踪
18
作者 邓健 张驰 高赟 《计算机工程与应用》 北大核心 2025年第3期186-195,共10页
对于孪生网络跟踪框架,骨干网络提取特征的目标表征能力对目标跟踪性能至关重要。为了提升特征对目标的表征能力,提出一种基于特征感知增强的孪生跟踪算法。其以TrDiMP算法为基础,对ResNet-50骨干网络提取的特征采用特征感知增强模块进... 对于孪生网络跟踪框架,骨干网络提取特征的目标表征能力对目标跟踪性能至关重要。为了提升特征对目标的表征能力,提出一种基于特征感知增强的孪生跟踪算法。其以TrDiMP算法为基础,对ResNet-50骨干网络提取的特征采用特征感知增强模块进行增强,该模块基于自注意力对模板分支和搜索分支的特征进行自我增强,并基于交叉注意力对两个分支进行关联增强,建立模板特征和搜索特征之间的目标依赖关系,抑制与目标无关的特征干扰,进而提升特征对目标的表征能力。基于OTB100、UAV123、LaSOT、GOT-10k和VOT2018五个基准数据集的大量实验表明,与几种主流的孪生跟踪器相比,该算法取得了更优的精确度和成功率,尤其在相似性干扰、尺度变化、遮挡等复杂场景中鲁棒性更优。 展开更多
关键词 目标跟踪 孪生网络 特征感知增强 注意力
在线阅读 下载PDF
基于边缘特征增强的油菜田块信息提取方法
19
作者 张宁 孔开昕 +3 位作者 许卫 董航 段金馈 张承明 《山东农业大学学报(自然科学版)》 北大核心 2025年第2期203-213,共11页
获取高质量的特征是从遥感影像中提取高精度油菜田块信息的关键步骤,本文针对油菜田块边缘像素特征质量通常不够理想的问题,提出了一种边缘特征增强的油菜田块信息提取模型(Edge Feature Enhancement Net,EFENet)。首先,采用编码器-解... 获取高质量的特征是从遥感影像中提取高精度油菜田块信息的关键步骤,本文针对油菜田块边缘像素特征质量通常不够理想的问题,提出了一种边缘特征增强的油菜田块信息提取模型(Edge Feature Enhancement Net,EFENet)。首先,采用编码器-解码器结构作为特征提取器基本结构,设计了边缘注意力机制(Edge Attention Mechanism, EAM)作为特征增强模块,由通道注意力和空间注意力两个子模块组成,用于提高边缘像素的特征质量。其次,设计了考虑边缘增强的损失函数(Considering Boundary Enhancement Loss Function, CBELoss)以提高边缘特征质量,由权重项ω和特征质量数学期望(Mathematical Expectation of Characteristic Mass, MECM)组成,ω根据像素空间相关性来表达样本位置对误差的影响;MECM通过评价样本质量以增强特征的区分度。EFENet采用SoftMax作为逐像素分类器。选择GF-6 PMS (Gaofen-6 Panchromatic and Multispectral Scanner)影像为数据源;青海省海北藏族自治州门源回族自治县为研究区;ERFNet、RefineNet、UNet为对比模型开展对比实验。结果表明,EFENet在F1分数(92.40%)、召回率(93.64%)、查准率(92.83%)和准确率(92.51%)方面均优于对比模型,表明该模型在提取油菜田块信息方面具有明显优势。 展开更多
关键词 卷积神经网络 油菜田块信息 边缘特征增强 损失函数 特征质量
在线阅读 下载PDF
结合卷积增强窗口注意力的双分支语音增强神经网络
20
作者 张晨辉 原之安 钱宇华 《计算机研究与发展》 北大核心 2025年第4期852-862,共11页
在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频... 在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频经过短时傅里叶变换(STFT)处理后,多数模型仅使用幅值信息,而忽略了相位信息,导致它们未能有效捕获语谱图特征,从而影响了语音增强的效果.基于此设计出一个带有卷积增强窗口注意力的双分支语音增强神经网络.该模型采用U-NET架构,通过双分支结构对音频的幅值和相位信息同时建模;在2个分支之间引入复值计算模块以实现信息交互;在编码器层和解码器层之间的跳跃连接部分采用卷积增强窗口注意力模块,该模块执行基于非重叠窗口的自注意力操作,在捕获局部上下文信息的同时显著降低了语音增强模型的计算复杂度.该模型在公开的Voicebank-Demand数据集上进行测试,与基线模型DCUNET 16和DCUNET20相比,在客观语音质量评估指标PESQ(perceptual evaluation of speech quality)分别提高了0.51和0.47.除了PESQ指标外,其他指标也都有显著的提升.相较于现有的各类语音增强模型,该模型在各项指标上均处于领先水平,尤其是在PESQ得分方面的提升更为显著. 展开更多
关键词 语音增强 双分支网络 语谱图特征 卷积增强窗口注意力 全局信息 局部信息
在线阅读 下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部