期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
融合视觉常识特征和门控计数方法的视觉问答
1
作者 徐钰涛 汤守国 《计算机科学》 北大核心 2025年第S1期421-427,共7页
为了更好地探索图像中的潜在常识信息,引入了一种创新的视觉常识特征用于视觉问答(Visual Question Answering,VQA)任务,并通过视觉特征融合模块有效地整合了自底向上特征和视觉常识特征,从而实现了丰富的视觉特征表示。其中引导式注意... 为了更好地探索图像中的潜在常识信息,引入了一种创新的视觉常识特征用于视觉问答(Visual Question Answering,VQA)任务,并通过视觉特征融合模块有效地整合了自底向上特征和视觉常识特征,从而实现了丰富的视觉特征表示。其中引导式注意力融合方法,通过将自底向上特征与视觉常识特征共同输入信息交互模块,使注意力机制能够捕捉到与问题文本更为相关的图片内容。在此基础上,设计并引入了一种门控计数模块(Gated Counting Module,GCM),旨在保留图像特征中实体的数量信息。这一模块在计数问题上显著提升了模型性能,同时保持了信息的完整性和相关性。与传统方法相比,GCM能够更准确地处理涉及数量的视觉问题,从而增强了整体VQA任务的准确性。最后,在广泛使用的数据集VQA v2.0上进行了大量实验,所提方法取得了较好的结果。 展开更多
关键词 视觉问答 视觉常识特征 特征融合 视觉特征 Faster R-CNN 门控计数模块
在线阅读 下载PDF
动态空间Transformer与多级融合的视网膜病变分级算法
2
作者 梁礼明 钟奕 +1 位作者 康婷 金家新 《计算机工程与科学》 北大核心 2025年第8期1459-1469,共11页
针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,... 针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,凸显病灶边缘特征,提高算法对病灶像素的定位感知能力;再次在网络底层设计动态空间注意力模块,有效联系全局和局部空间信息,以提升算法挖掘深层语义信息的能力;最后构建多级门控融合模块,实现非诊断信息的滤除,同时对可诊断信息进行多级融合,进一步提高视网膜病变分级准确率。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为91.71%和89.89%,IDRID数据集上准确率和APTOS 2019数据集ROC曲线下方面积的占比分别为79.61%和93.06%。实验结果表明,所提出算法在视网膜病变分级领域具有一定应用价值。 展开更多
关键词 视网膜病变分级 动态空间注意力 轮廓增强模块 多级门控融合模块
在线阅读 下载PDF
融合Mobile Vit和倒置门控编解码的视网膜血管分割算法
3
作者 梁礼明 阳渊 +2 位作者 朱晨锟 何安军 吴健 《北京航空航天大学学报》 北大核心 2025年第3期712-723,共12页
针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域... 针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域维度减少图像特征信息缺失,精确分割血管前景像素;提出特征自适应融合模块,建立血管纹理上下文依赖关系,提高血管分割灵敏度;优化编解码结构,设计倒置门控编解码模块,进一步捕获空间信息与深层语义信息,提高视网膜血管图像分割精度。在公共数据集DRIVE、STARE和CHASE_DB1上对所提算法进行实验,特异性分别为0.9863、0.9897和0.9873,准确度分别为0.9709、0.9754和0.9760,敏感度分别为0.8109、0.8010和0.8079。仿真实验证明,所提网络对视网膜血管分割具有较好的分割效果,为眼科疾病的诊断提供了新窗口。 展开更多
关键词 视网膜血管 Mobile Vit模块 离散余弦变换 倒置门控编解码模块 特征自适应融合
在线阅读 下载PDF
特征融合式轻量化调制识别方法设计与研究
4
作者 查燕平 王红军 沈哲贤 《小型微型计算机系统》 北大核心 2025年第9期2216-2224,共9页
物联网、边缘计算和可穿戴设备等万物互联的应用场景对无线网络领域信号调制识别方法所消耗的计算资源提出了要求.本研究针对调制识别任务中模型复杂度高、识别精度低的问题,设计了一种特征融合式的,联合深度残差收缩网络与门控循环单... 物联网、边缘计算和可穿戴设备等万物互联的应用场景对无线网络领域信号调制识别方法所消耗的计算资源提出了要求.本研究针对调制识别任务中模型复杂度高、识别精度低的问题,设计了一种特征融合式的,联合深度残差收缩网络与门控循环单元的轻量化调制识别方法.该方法首先对原始IQ信号数据进行转换,生成包含信号相位信息的瞬时相位值;然后针对IQ数据和瞬时相位值这两种特定类型的数据,创新性地结合深度残差收缩网络在信号降噪和提升训练效率方面的显著优势,以及门控循环单元在序列特征提取的优秀性能,设计了一种轻量化的特征提取和分类识别模型;最后在代表一个复杂调制识别任务的公开数据集RadioML2018.01a上进行仿真验证,并在实际的边缘设备上部署推理.实验结果表明,本文方法在调制识别任务中具有更少的参数量和更高识别精度,在边缘设备上具有更快的推理速度,适用于资源受限的应用场景. 展开更多
关键词 调制识别 轻量化 特征融合 深度残差收缩网络 门控循环单元
在线阅读 下载PDF
融合监督注意力模块和跨阶段特征融合的图像修复改进网络 被引量:2
5
作者 黄巧玲 郑伯川 +1 位作者 丁梓成 吴泽东 《计算机应用》 CSCD 北大核心 2024年第2期572-579,共8页
非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两... 非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两阶段网络模型上,引入了SAM与CSFF模块。SAM通过提供真实图像监督信号,监督上阶段输出特征,确保传入下阶段特征信息的有效性。CSFF将上阶段编码器-解码器的特征融合后送入下阶段的编码器,以弥补上阶段修复中特征信息的损失。实验结果表明,在缺失区域占比为1%~10%时,相较于基线模型Gconv,Gconv_CS在CelebA-HQ数据集上峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了1.5%和0.5%,Fréchet起始距离(FID)和L1损失分别降低了21.8%、14.8%;在Place2数据集上,前2个指标分别提高了26.7%和0.8%,后2个指标分别降低了7.9%、37.9%。将Gconv_CS用于去除大熊猫面部遮挡物时,取得了较好的修复视觉效果。 展开更多
关键词 图像修复 两阶段网络 跨阶段特征融合 监督注意力模块 门控卷积
在线阅读 下载PDF
跨级融合门控自适应网络用于视网膜血管分割 被引量:1
6
作者 梁礼明 余洁 +2 位作者 陈鑫 雷坤 周珑颂 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第4期1097-1109,共13页
针对现有多数算法对浅层特征提取不足,导致分割结果中血管边界模糊、毛细血管欠分割且包含噪声等问题,提出一种跨级融合门控自适应网络。该网络中的密集门控通道变换模块,通过促进通道之间的竞争或协同关系充分提取浅层特征信息,避免浅... 针对现有多数算法对浅层特征提取不足,导致分割结果中血管边界模糊、毛细血管欠分割且包含噪声等问题,提出一种跨级融合门控自适应网络。该网络中的密集门控通道变换模块,通过促进通道之间的竞争或协同关系充分提取浅层特征信息,避免浅层粗粒度特征信息丢失;通过跨层次融合模块捕获各层跨维度交互信息,有效聚合多尺度上下文特征;采用双自适应特征融合方法有效引导相邻层次特征融合,抑制噪声。在公共数据集DRIVE、CHASEDB1和STARE上进行验证,结果表明:所提网络准确率分别为0.9652、0.9668和0.9695,F_(1)值分别为0.8544、0.8152和0.8412,在多个指标上均处于较高水平,优于现有先进算法。 展开更多
关键词 视网膜血管分割 密集门控通道变换 跨层次融合模块 双自适应特征融合 三重注意力模块
在线阅读 下载PDF
基于多模态时-频特征融合的信号调制格式识别方法 被引量:2
7
作者 贺超 陈进杰 +1 位作者 金钊 雷印杰 《计算机科学》 CSCD 北大核心 2023年第4期226-232,共7页
自动调制识别(Automatic Modulation Recognition,AMR)是认知无线电中的关键技术,在无线通信中有着广泛应用。针对现有的自动调制识别方法大多都只利用了信号时域或频域的单模态信息,忽略了多模态信息之间的互补性的问题,提出了一种基... 自动调制识别(Automatic Modulation Recognition,AMR)是认知无线电中的关键技术,在无线通信中有着广泛应用。针对现有的自动调制识别方法大多都只利用了信号时域或频域的单模态信息,忽略了多模态信息之间的互补性的问题,提出了一种基于多模态时-频特征融合的信号调制格式识别方法。首先,在融合之前利用对比学习对齐信号的时域特征和频域特征,减小时-频特征间的异质性差异。然后,采用跨模态注意力实现时域特征和频域特征的互补性融合。最后,为了进一步提高模型整体的性能,在频域编码器中引入残差收缩模块来提取信号时频图的频域特征,并在时域编码器中引入复数双向门控循环单元,以提取I和Q两路信号之间的相关性特征及信号时序特征。在RadioML2016a上进行了实验,结果表明,所提方法具有较高的识别准确率和噪声鲁棒性。 展开更多
关键词 自动调制识别 跨模态注意力融合 对比学习 残差收缩模块 复数双向门控循环单元
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部