期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
跨模态信息融合的视频-文本检索
1
作者 习怡萌 邓箴 +1 位作者 刘倩 刘立波 《计算机应用》 北大核心 2025年第8期2448-2456,共9页
现有的视频-文本检索(VTR)方法通常假设文本描述与视频之间存在强语义关联,却忽略了数据集中广泛存在的弱相关视频文本对,导致模型虽然擅长识别常见的通用概念,但无法充分挖掘弱语义描述的潜在信息,进而影响模型的检索性能。针对上述问... 现有的视频-文本检索(VTR)方法通常假设文本描述与视频之间存在强语义关联,却忽略了数据集中广泛存在的弱相关视频文本对,导致模型虽然擅长识别常见的通用概念,但无法充分挖掘弱语义描述的潜在信息,进而影响模型的检索性能。针对上述问题,提出一种跨模态信息融合的VTR模型,该模型以跨模态的方式利用相关的外部知识改进模型的检索性能。首先,构建2个外部知识检索模块,分别用于实现视频与外部知识的检索以及文本与外部知识的检索,以便后续借助外部知识强化原始视频和文本的特征表示;其次,设计自适应交叉注意力的跨模态信息融合模块,以去除视频和文本中的冗余信息,并利用不同模态间的互补信息融合特征,学习更具判别性的特征表示;最后,引入模态间和模态内的相似性损失函数,以确保数据在融合特征空间、视频特征空间和文本特征空间下信息表征的完整性,从而实现跨模态数据间的精准检索。实验结果表明,与MuLTI模型相比,所提模型在公共数据集MSRVTT(Microsoft Research Video to Text)和DiDeMo(Distinct Describable Moments)上的召回率R@1分别提升了2.0和1.9个百分点;与CLIP-ViP模型相比,所提模型在公共数据集LSMDC(Large Scale Movie Description Challenge)上的R@1提高了2.9个百分点。可见,所提模型能有效解决VTR任务中的弱相关数据的问题,从而提升模型的检索准确率。 展开更多
关键词 跨模态检索 视频-文本检索 多特征融合 弱语义数据 自适应
在线阅读 下载PDF
融合路径与子图特征的知识图谱多跳推理模型 被引量:1
2
作者 李瑞 李贯峰 +1 位作者 胡德洲 高文馨 《计算机应用》 北大核心 2025年第1期32-39,共8页
针对知识推理模型在捕获实体之间的复杂语义特征方面难以捕捉多层次语义信息,同时未考虑单一路径的可解释性对正确答案的影响权重不同等问题,提出一种融合路径与子图特征的知识图谱(KG)多跳推理模型PSHAM(Hierarchical Attention Model ... 针对知识推理模型在捕获实体之间的复杂语义特征方面难以捕捉多层次语义信息,同时未考虑单一路径的可解释性对正确答案的影响权重不同等问题,提出一种融合路径与子图特征的知识图谱(KG)多跳推理模型PSHAM(Hierarchical Attention Model fusing Path-Subgraph features)。PS-HAM将实体邻域信息与连接路径信息进行融合,并针对不同路径探索多粒度的特征。首先,使用路径级特征提取模块提取每个实体对之间的连接路径,并采用分层注意力机制捕获不同粒度的信息,且将这些信息作为路径级的表示;其次,使用子图特征提取模块通过关系图卷积网络(RGCN)聚合实体的邻域信息;最后,使用路径-子图特征融合模块对路径级与子图级特征向量进行融合,以实现融合推理。在两个公开数据集上进行实验的结果表明,PS-HAM在指标平均倒数秩(MRR)和Hit@k(k=1,3,10)上的性能均存在有效提升。对于指标MRR,与MemoryPath模型相比,PS-HAM在FB15k-237和WN18RR数据集上分别提升了1.5和1.2个百分点。同时,对子图跳数进行的参数验证的结果表明,PS-HAM在两个数据集上都在子图跳数在3时推理效果达到最佳。 展开更多
关键词 知识图谱 多跳推理 子图特征 路径提取 特征融合
在线阅读 下载PDF
ResFPN:扩增实际感受野和改进FPN的多尺度目标检测方法 被引量:1
3
作者 杨扬 唐晓芬 《计算机工程与应用》 北大核心 2025年第10期247-257,共11页
针对多尺度目标检测中主干网络实际感受野远远小于理论感受野,感受野分布稀疏,以及特征金字塔网络(feature pyramid network,FPN)在横向连接过程中统一通道数会丢失通道信息等影响模型性能的问题,提出一种扩增实际感受野和多特征融合改... 针对多尺度目标检测中主干网络实际感受野远远小于理论感受野,感受野分布稀疏,以及特征金字塔网络(feature pyramid network,FPN)在横向连接过程中统一通道数会丢失通道信息等影响模型性能的问题,提出一种扩增实际感受野和多特征融合改进FPN的多尺度目标检测算法ResFPN。针对主干网络实际感受野远远小于理论感受野的问题,设计了多分支膨胀卷积(multi-branch dilated convolutional,MBD)模块和多分支池化(multi-branch pooling,MBP)模块,通过学习不同尺度空间特征融合,扩增感受野。针对感受野分布稀疏问题,提出轻量级通道交互融合(channel interactive fusion,CIF)模块,通过双分支结构并在每一分支叠加不同数量深度可分离卷积学习像素间的依赖关系增强特征表示。针对FPN通过1×1卷积统一通道数会丢失通道信息的问题,尝试利用SubPixel卷积提取C5层输出特征,保留原始丰富语义信息的同时引出额外双向路径对FPN通道信息进行补充,但这可能会产生冗余信息。因此,在额外双向路径后引入全局上下文(global context,GC)模块,利用GC瓶颈转换模块进一步融合特征信息,减少信息冗余。实验表明,提出的ResFPN有效解决了感受野分布稀疏问题,并将主干网络感受野增大为原来的一倍,同时提出的改进FPN通道丢失问题的方法也在多尺度目标检测中获得了良好的性能。与典型的网络Faster R-CNN相比,大、中、小物体检测平均精度在具有挑战性的MS COCO数据集上分别提高了2.2、1.6、2.0个百分点,与其他检测器相比检测效果也有提升。 展开更多
关键词 目标检测 卷积神经网络 多尺度目标检测 感受野 特征金字塔网络(FPN)
在线阅读 下载PDF
多放大倍率掩码自编码器的乳腺癌图像分类
4
作者 司嘉龙 贾伟 +1 位作者 赵雪芬 高宏娟 《电子测量技术》 北大核心 2025年第10期127-143,共17页
乳腺癌是对妇女健康构成严重威胁的疾病之一。早期诊断对于乳腺癌的治愈至关重要,计算机辅助乳腺癌分类诊断得到了广泛使用。虽然基于掩码自编码器的乳腺癌分类方法能够在乳腺癌病理图像已标注数据缺少的前提下进行模型性能的提升,但是... 乳腺癌是对妇女健康构成严重威胁的疾病之一。早期诊断对于乳腺癌的治愈至关重要,计算机辅助乳腺癌分类诊断得到了广泛使用。虽然基于掩码自编码器的乳腺癌分类方法能够在乳腺癌病理图像已标注数据缺少的前提下进行模型性能的提升,但是现有的基于掩码自编码器的乳腺癌病理图像分类方法没有充分提取和融合不同放大倍率乳腺癌病理图像之间的特征信息。为了解决该问题,提出了一种基于多放大倍率掩码自编码器的乳腺癌病理图像分类方法。该方法在掩码自编码器的基础上结合放大独立和放大特异的优势。首先,设计了规则化噪音掩码模块来避免乳腺癌病理图像重要特征丢失。然后,将不同放大倍率乳腺癌病理图像块组合在一起输入到加入了交叉卷积映射的编码器中提取和融合不同放大倍率图像的特征。最后,在解码器中加入残差交叉注意力机制增强低放大倍率图像下细胞密度及排列顺序和高放大倍率图像下细胞纹理特征的融合。在BreakHis公共数据集上进行实验,与现有分类方法相比,该方法在Top-1 Accuracy、精确率、召回率和F1-Score上至少提高了约2%,说明该方法在良恶性乳腺癌病理图像准确分类方面表现出良好的性能。 展开更多
关键词 乳腺癌病理图像 自监督学习 掩码自编码器 放大独立 放大特异
在线阅读 下载PDF
球谐函数局部特征投影的三维人脸生成方法
5
作者 赵世杰 梁瑾裕 +1 位作者 杜晓飞 高宏娟 《计算机辅助设计与图形学学报》 北大核心 2025年第3期385-395,共11页
针对三维人脸生成任务中不能精确地控制局部属性生成的问题,提出球谐函数局部特征投影的三维人脸生成方法.首先将三维人脸划分为多个属性,每个属性对应多个潜变量;然后将每个属性映射到单位球面,使用球谐函数对球面上的形状属性进行特... 针对三维人脸生成任务中不能精确地控制局部属性生成的问题,提出球谐函数局部特征投影的三维人脸生成方法.首先将三维人脸划分为多个属性,每个属性对应多个潜变量;然后将每个属性映射到单位球面,使用球谐函数对球面上的形状属性进行特征投影;最后定义一种特征投影损失,并将其分别应用于3D-VAE的编码器和解码器,通过度量投影特征和潜变量的差异,学习具有高解耦性、高可解释性的局部特征潜在表示.在UHM数据集上与几种主流方法进行对比实验,结果表明,所提方法的局部特征解耦效果是最优的;该方法的训练时间最少,与SD-VAE和SD-VQVAE方法相比,分别减少约37%和54%. 展开更多
关键词 三维人脸 特征投影 变分自编码器 球谐波 潜变量解耦
在线阅读 下载PDF
基于改进RT-DETR的多尺度特征融合的高效轻量皮肤病理检测方法
6
作者 任煜瀛 黄凌霄 +1 位作者 杜方 姚新波 《南方医科大学学报》 北大核心 2025年第2期409-421,共13页
目的针对皮肤病检测任务中存在皮肤病变区域多尺度、图像噪点干扰以及辅助诊疗设备资源有限影响检测准确性等问题,提出一种基于RT-DETR改进的高效轻量化皮肤病检测模型。方法引入轻量级FasterNet作为骨干网络,同时对FasterNetBlock模块... 目的针对皮肤病检测任务中存在皮肤病变区域多尺度、图像噪点干扰以及辅助诊疗设备资源有限影响检测准确性等问题,提出一种基于RT-DETR改进的高效轻量化皮肤病检测模型。方法引入轻量级FasterNet作为骨干网络,同时对FasterNetBlock模块进行重参数化改进。在颈部网络中引入卷积和注意力融合模块代替多头自注意力机制,形成AIFI-CAFM模块,从而增强模型捕获图像全局依赖关系和局部细节信息的能力。设计DRB-HSFPN特征金字塔网络替换跨尺度特征融合模块(CCFM),以融合不同尺度的上下文信息,提升颈部网络的语义特征表达能力。结合Inner-IoU和EIoU的优点,提出了Inner-EIoU替换原损失函数GIOU,进一步提高模型推理准确性和收敛速度。结果改进后的RT-DETR相较于原始模型,在HAM10000数据集上的mAP@50和mAP@50:95分别提升了4.5%和2.8%,检测速度FPS达到59.1帧/s。同时,改进模型的参数量为10.9M,计算量为19.3GFLOPs,相较于原始模型分别降低了46.0%和67.2%,验证了改进模型的有效性。结论本文提出的SD-DETR模型在降低参数量和计算量的同时,能够有效的提取并融合多尺度特征,从而显著提升了皮肤病检测任务的性能。 展开更多
关键词 皮肤病 轻量级网络 多尺度特征融合 注意力机制 RT-DETR
在线阅读 下载PDF
瞬态执行攻击防御方法研究进展
7
作者 李扬 高菲 +1 位作者 马自强 苗莉 《计算机工程与应用》 北大核心 2025年第2期37-58,共22页
瞬态执行攻击利用处理器微架构的实现特性窃取秘密,并通过缓存侧信道泄露秘密相关信息,对现代商用处理器的信息安全构成了极大威胁。随着攻击研究的不断深入,其防御方法也成为了研究热点。对瞬态执行攻击防御技术发展现状进行了系统性总... 瞬态执行攻击利用处理器微架构的实现特性窃取秘密,并通过缓存侧信道泄露秘密相关信息,对现代商用处理器的信息安全构成了极大威胁。随着攻击研究的不断深入,其防御方法也成为了研究热点。对瞬态执行攻击防御技术发展现状进行了系统性总结,剖析了熔断型攻击、幽灵型攻击、数据采样型攻击和缓存隐蔽信道的形成原因及分类依据;总结了防御方法的实现原理与发展现状,依据防御措施的介入阶段将其分为四类:基于代码检测的、基于破坏瞬态行为的、基于中断隐蔽信道的和面向攻击检测的防御方法,其中,特别总结了结合机器学习的攻击检测方法。对现有防御研究中存在的关键问题进行了分析与总结,并展望了未来的研究方向,以期为后续研究工作提供帮助。 展开更多
关键词 系统安全 瞬态执行攻击 缓存侧信道 防御方法 处理器安全
在线阅读 下载PDF
面向低样本的工业图像异常检测综述
8
作者 郭新茹 宋丽娟 +2 位作者 朱文倩 杜方 马子睿 《计算机工程与应用》 北大核心 2025年第13期26-45,共20页
异常检测是计算机视觉的重要研究方向之一,被广泛应用于工业产品检测、医疗诊断和视频监控等领域。它可以监控产品质量并快速识别不符合标准的产品,从而实现自动化质量控制。在工业图像异常检测中,由于获取大量训练样本既耗时又昂贵,因... 异常检测是计算机视觉的重要研究方向之一,被广泛应用于工业产品检测、医疗诊断和视频监控等领域。它可以监控产品质量并快速识别不符合标准的产品,从而实现自动化质量控制。在工业图像异常检测中,由于获取大量训练样本既耗时又昂贵,因此低样本的工业图像异常检测成为研究热点和趋势。同时,大型视觉语言模型的出现推动了工业图像异常检测从单模态驱动发展到多模态融合,提高了检测的全面性。针对近四年的低样本工业图像异常检测,探讨了模态数量对异常检测性能的影响,并根据检测算法在处理数据和检测异常时采用的不同策略以及特征提取技术的提取范围对低样本异常检测方法进行分类。这旨在帮助研究人员快速了解并进一步改进异常检测技术和优化特征提取策略,从而提升低样本环境下的检测效率和准确性。此外,还对不同方法在MVTec AD和VisA数据集上的检测结果进行了对比,对比结果表明多模态融合方法中的混合特征融合在分类和分割异常方面表现突出。通过对比不同的检测技术和模型,总结了不同的低样本工业异常检测方法以及解决的问题,并讨论了未来的研究方向。 展开更多
关键词 工业图像异常检测 低样本 单模态驱动 多模态融合 混合特征融合
在线阅读 下载PDF
基于改进双向记忆残差网络的Tor流量分类研究
9
作者 唐妍 王恒 +3 位作者 马自强 滕海龙 施若涵 张宁宁 《信息安全研究》 北大核心 2025年第5期447-456,共10页
为了解决Tor链路加密的特性导致模型难以对Tor流量进行正确分类导致监管困难的问题,提出了一种基于改进双向记忆残差网络(convolutional block attention module-bidirectional memory residual neural network, CBAM-BiMRNet)的Tor流... 为了解决Tor链路加密的特性导致模型难以对Tor流量进行正确分类导致监管困难的问题,提出了一种基于改进双向记忆残差网络(convolutional block attention module-bidirectional memory residual neural network, CBAM-BiMRNet)的Tor流量分类方法.首先,采用SMOTETomek(SMOTE and tomek links)综合采样算法平衡数据集,使模型能够对各类流量数据进行充分学习.其次,采用CBAM为重要的特征赋予更大的权值,将1维卷积与双向长短期记忆模块结合起来,提取Tor流量数据的时间特征和局部空间特征.最后,通过添加恒等映射避免因模型层数的增加而出现的梯度消失和梯度爆炸现象,并且解决了网络退化问题.实验结果表明,在ISCXTor2016数据集上,该模型对Tor流量识别的准确率达到99.22%,对Tor流量应用服务类型分类的准确率达到93.10%,证明该模型能够有效地对Tor流量进行识别和分类. 展开更多
关键词 Tor流量 残差网络 流量识别 综合采样 类别不平衡
在线阅读 下载PDF
瞬态执行攻击综述
10
作者 李扬 马自强 +4 位作者 林璟锵 孟令佳 李冰雨 苗莉 高菲 《计算机研究与发展》 北大核心 2025年第8期2058-2097,共40页
瞬态执行攻击利用处理器优化措施绕过安全检查,进而通过隐蔽信道传输并窃取敏感信息.其中,Meltdown和Spectre攻击尤为知名,波及包括Intel,ARM,AMD在内的主流商用处理器.尽管处理器制造商已采取相应防御措施,但相关变种攻击仍不断被研究... 瞬态执行攻击利用处理器优化措施绕过安全检查,进而通过隐蔽信道传输并窃取敏感信息.其中,Meltdown和Spectre攻击尤为知名,波及包括Intel,ARM,AMD在内的主流商用处理器.尽管处理器制造商已采取相应防御措施,但相关变种攻击仍不断被研究人员发现并公之于众.为深化对瞬态执行攻击的理解并实施有效防御,对各种隐蔽信道下的瞬态执行攻击进行了剖析.首先,提炼出了瞬态执行攻击的共同特征,并系统性构建了全新的瞬态执行攻击模型.其次,总结了现有研究中涉及的各类隐蔽信道,将瞬态执行攻击归纳总结为3类:乱序执行驱动的熔断型攻击、错误分支预测驱动的幽灵型攻击以及错误数据预测驱动的数据采样型攻击,并梳理了各类型攻击的核心要点及关联性.其中,对数据采样型攻击进行了系统性归纳和整理.接着,从隐蔽信道利用、攻击适用场景和微架构通用性3个维度分析和评估了各攻击变种的能力.最后,结合上述针对处理器微架构和隐蔽信道的深入分析与总结,展望了瞬态执行攻击研究的未来研究方向,以期为后续研究工作提供有力支撑. 展开更多
关键词 隐蔽信道 瞬态执行攻击 侧信道攻击 微架构数据采样攻击 缓存侧信道 系统安全
在线阅读 下载PDF
基于冲突的缓存侧信道攻击与驱逐集综述
11
作者 姚梓豪 马自强 +1 位作者 李扬 魏良根 《计算机应用》 北大核心 2025年第7期2070-2078,共9页
缓存侧信道攻击是一种利用计算机缓存共享特性的侧信道攻击手段,对跨处理器、跨虚拟机的目标密码系统构成严重威胁。其中基于冲突的缓存侧信道攻击突破了使用特权指令的限制,能构造一组与目标地址映射到同一缓存集的虚拟地址,即驱逐集,... 缓存侧信道攻击是一种利用计算机缓存共享特性的侧信道攻击手段,对跨处理器、跨虚拟机的目标密码系统构成严重威胁。其中基于冲突的缓存侧信道攻击突破了使用特权指令的限制,能构造一组与目标地址映射到同一缓存集的虚拟地址,即驱逐集,从而造成缓存冲突,进而最终获取目标的隐私数据。构造驱逐集已成为基于冲突的缓存侧信道攻击和推测执行攻击的关键技术之一。因此,对基于冲突的缓存侧信道攻击与驱逐集的研究进行综述。首先,剖析了基于冲突的缓存侧信道攻击的基本原理;其次,分析了驱逐集构造算法的基本原理、发展现状,根据候选地址的操作策略和驱逐集的构造策略不同,将算法分为冲突移除法和冲突渐增法两类;再次,对驱逐集构造算法的影响因素进行了归纳;最后,讨论了基于冲突的缓存侧信道攻击的现状及未来的研究方向。 展开更多
关键词 系统安全 缓存侧信道攻击 驱逐集 虚拟地址 缓存替换策略
在线阅读 下载PDF
WTSTC:基于广域时频采样和时序感知卷积的语音识别模型
12
作者 刘立波 王詠森 +1 位作者 刘倩 邓箴 《中文信息学报》 北大核心 2025年第4期161-171,共11页
针对现有语音识别模型存在的时频特征感受野不足、时序特征损失及模型结构扩展性较差等方面的问题,该文提出基于广域时频采样和时序感知卷积的语音识别模型WTSTC,在保证模型轻量化的同时提升识别精度。首先,通过结合RepLKNet模块和传统... 针对现有语音识别模型存在的时频特征感受野不足、时序特征损失及模型结构扩展性较差等方面的问题,该文提出基于广域时频采样和时序感知卷积的语音识别模型WTSTC,在保证模型轻量化的同时提升识别精度。首先,通过结合RepLKNet模块和传统卷积下采样模块,构建了一种新型的广域时频采样模块,增大感受野的同时更加关注输入音频序列的时频特征;其次,设计了时序感知卷积模块,通过实现应用于时序特征的一维全局响应归一化层取代原有的Batch Norm以增强通道间的特征竞争,避免了归一化过程中语音信号的时序特征信息丢失的潜在可能;最后,在模型内部各模块间引入Droppath正则化方法,通过在模块间随机跳跃样本避免模型对特定模块的依赖。实验结果表明,该方法在中文公共数据集AISHELL-1的测试集上字错率为4.27%,在更大规模英文公共数据集Librispeech的测试集clean和other上的词错率分别为2.2%和5.1%。在保持相同训练策略的前提下,该方法相较现有先进模型展现出更优异的性能。 展开更多
关键词 自动语音识别 端到端 CONFORMER RepLKNet
在线阅读 下载PDF
多级跨模态对齐的文本检索视频方法研究
13
作者 习怡萌 刘立波 +1 位作者 邓箴 刘倩 《中文信息学报》 北大核心 2025年第2期111-122,共12页
现有文本检索视频方法在进行跨模态对齐时,未充分考虑文本细节和复杂视觉语义间的信息交互,使检索性能受到影响。为解决此问题,该文提出一种多级跨模态对齐的文本检索视频方法。首先,将查询文本按词性进行分解并编码,同时对视频帧进行... 现有文本检索视频方法在进行跨模态对齐时,未充分考虑文本细节和复杂视觉语义间的信息交互,使检索性能受到影响。为解决此问题,该文提出一种多级跨模态对齐的文本检索视频方法。首先,将查询文本按词性进行分解并编码,同时对视频帧进行编码和聚类操作;然后,对查询文本和视频的全局编码进行对齐,获取二者间的全局语义关系;接着,对文本动词编码与视频子动作编码进行动作对齐,以实现动作关联;最后,将名词编码与经动作对齐筛选的关键帧进行实体对齐,进一步消弱视频中弱相关或不相关帧,提高文本与视频之间的相关性。实验证明,该方法在MSR-VTT、DiDeMo和LSMDC公共数据集上的R@1指标分别提升了2.3%、1.5%和0.9%,优于现有文本检索视频方法。 展开更多
关键词 文本检索视频 文本分解 视频关键帧提取
在线阅读 下载PDF
基于扩散模型的文本图像生成对比研究综述 被引量:4
14
作者 高欣宇 杜方 宋丽娟 《计算机工程与应用》 CSCD 北大核心 2024年第24期44-64,共21页
随着深度学习的不断发展,人工智能生成内容成为了一个热门话题,特别是扩散模型作为一种新兴的生成模型,在文本图像生成领域取得了显著进展。全面描述了扩散模型在文本图像生成任务中的应用,并与生成对抗网络和自回归模型的对比分析,揭... 随着深度学习的不断发展,人工智能生成内容成为了一个热门话题,特别是扩散模型作为一种新兴的生成模型,在文本图像生成领域取得了显著进展。全面描述了扩散模型在文本图像生成任务中的应用,并与生成对抗网络和自回归模型的对比分析,揭示了扩散模型的优势和局限性。同时深入探讨了扩散模型在提升图像质量、优化模型效率以及多语言文本图像生成方面的具体方法,通过在CUB、COCO和T2I-CompBench数据集上进行了实验分析,不仅验证了扩散模型零样本生成的能力,还凸显了其根据复杂文本提示生成高质量图像的能力。介绍了扩散模型在文本图像编辑、3D生成、视频及医学图像生成等领域的应用前景。总结了扩散模型在文本图像生成任务上面临的挑战以及未来的发展趋势,有助于研究者更深入地推进这一领域的研究。 展开更多
关键词 文本图像生成 扩散模型 生成对抗网络 自回归模型
在线阅读 下载PDF
多模态MRI脑肿瘤分割方法的特征融合技术综述
15
作者 刘海超 宋丽娟 《计算机工程与应用》 CSCD 北大核心 2024年第23期28-48,共21页
随着人工智能技术的快速发展,脑肿瘤分割在提高临床诊断、研究和治疗的准确性和效率方面取得了显著进展。多模态医疗图像分割正在成为当前脑肿瘤分割研究的热点和趋势,这是因为多模态医学图像可以提供更加全面和详尽的信息,增强了脑肿... 随着人工智能技术的快速发展,脑肿瘤分割在提高临床诊断、研究和治疗的准确性和效率方面取得了显著进展。多模态医疗图像分割正在成为当前脑肿瘤分割研究的热点和趋势,这是因为多模态医学图像可以提供更加全面和详尽的信息,增强了脑肿瘤分割算法的可行性和可靠性。然而,多模态数据的使用也面临着一系列的问题和挑战。模态特征在进行融合时可能无法充分利用,导致模态间信息遗漏和不均衡;模态之间的差异过大,可能会产生干扰和误导算法的表现。而且,模态缺失也是一个常见的问题,使多模态方法的效果进一步降低。因此,旨在研究医疗图像多模态融合方法,以帮助新研究者探索未来多模态脑肿瘤分割的方向。该研究的重点在于探讨在脑肿瘤分割中多模态数据的特征融合方法,并根据融合数据的抽象层次对各种方法进行分类。通过研究不同的融合算法和模型,希望能够解决脑肿瘤多模态数据融合的困难和挑战,提高脑肿瘤分割的准确性与可靠性,为脑肿瘤的诊断与治疗提供更好的支持。 展开更多
关键词 脑肿瘤分割 多模态 早期融合 晚期融合 多级别融合 模态缺失
在线阅读 下载PDF
基于条件扩散模型的结直肠图像染色归一化
16
作者 李子成 贾伟 +1 位作者 赵雪芬 高宏娟 《电子测量技术》 北大核心 2024年第13期136-147,共12页
由于现有染色归一化方法无法准确提取结直肠病理图像的复杂结构特征,导致丢失部分结直肠病理图像的结构信息,无法生成高质量的染色归一化结直肠病理图像。为解决该问题,提出一种基于条件扩散模型的结直肠病理图像染色归一化方法,该方法... 由于现有染色归一化方法无法准确提取结直肠病理图像的复杂结构特征,导致丢失部分结直肠病理图像的结构信息,无法生成高质量的染色归一化结直肠病理图像。为解决该问题,提出一种基于条件扩散模型的结直肠病理图像染色归一化方法,该方法包括条件扩散模型和图像特征重建。在条件扩散模型中,首先,使用马尔科夫链前向过程对结直肠病理原图像进行加噪声。然后,将噪声图像和条件图像输入到增强去噪网络中进行去噪,在这过程中利用增强激活模块,学习结直肠病理图像的深层特征,捕获更多的图像上下文信息。在编码器和解码器之间引入跳跃连接空间注意力模块,准确提取结直肠病理图像的位置空间信息。在图像特征重建中,设计金字塔特征提取模块,提取多尺度条件图像与生成图像的特征,并构建重建损失函数,优化整个网络的性能。实验结果表明,与现有方法相比,所提染色归一化方法在公共数据集GlaS和CRAG上的能生成质量更高的染色归一化结直肠病理图像。 展开更多
关键词 条件扩散模型 结直肠病理图像 染色归一化 去噪网络
在线阅读 下载PDF
基于改进EDTER算法的河流边缘检测方法
17
作者 高钰栋 黄凌霄 +1 位作者 姚新波 赵苑汝 《液晶与显示》 2025年第9期1321-1332,共12页
为了提高遥感图像中河流边缘提取的精度与鲁棒性,构建了一种基于改进EDTER算法的河流边缘检测方法。针对传统方法在复杂自然场景下存在边缘细节丢失、噪声干扰等问题,提出一种适应性更强的边缘检测方案。采用以Swin Transformer为主干... 为了提高遥感图像中河流边缘提取的精度与鲁棒性,构建了一种基于改进EDTER算法的河流边缘检测方法。针对传统方法在复杂自然场景下存在边缘细节丢失、噪声干扰等问题,提出一种适应性更强的边缘检测方案。采用以Swin Transformer为主干网络的两阶段边缘检测结构,引入残差多层感知机以增强特征表达能力,并设计轻量化多尺度解码器提升检测效率。第一阶段提取图像全局特征,生成全局边缘图;第二阶段进行局部特征提取并与全局特征融合,生成最终边缘检测结果。在BSDS500数据集和自建的跨区域河流边缘数据集上开展对比实验,结果显示本文方法在ODS、OIS和AP三个指标上均优于主流方法。其中,在跨区域河流边缘数据集上的AP值达到0.871,较EDTER方法提升约3.2%,说明该方法在复杂遥感场景中表现出更优的边缘提取能力。本文方法能够有效兼顾检测精度与计算效率,具备良好的泛化性能,适用于多类型遥感图像中的水体边缘提取任务,具有较高的工程应用价值。 展开更多
关键词 河流边缘 边缘检测 遥感图像 Swin Transformer 水体提取
在线阅读 下载PDF
上下文语义表征和像素关系纠正的小样本目标检测
18
作者 魏利利 闫丽蓉 唐晓芬 《计算机应用》 2025年第9期2993-3002,共10页
小样本目标检测中因为支持样本稀缺且可利用的类别信息不足,所以有效利用有限样本的特征信息尤为重要。通过丰富支持样本和查询样本中可用的语义信息,能够实现查询特征和支持特征更全面的信息匹配,这有助于模型在小样本场景下理解目标类... 小样本目标检测中因为支持样本稀缺且可利用的类别信息不足,所以有效利用有限样本的特征信息尤为重要。通过丰富支持样本和查询样本中可用的语义信息,能够实现查询特征和支持特征更全面的信息匹配,这有助于模型在小样本场景下理解目标类别,进而有效地实现目标检测。因此,提出一种基于空间上下文和像素关系的模型。设计空间上下文学习模块以辅助像素构建局部上下文区域,从而为中心像素获取区域内的像素语义,并丰富图像的特征信息。此外,针对空间上下文容易引入噪声信息的问题,设计像素上下文关系模块以利用图像中的原始特征知识探索像素之间的关系,并构建类内和类间关系映射图,从而纠正空间上下文学习模块容易引入噪声信息的缺陷。实验结果表明,在PASCAL VOC数据集上进行3种划分时,与VFA(Variational Feature Aggregation)相比,所提模型在样本极其稀缺的1-shot设置下的平均精度(AP_(50))分别提升2.7、2.0和1.3个百分点。在MS COCO数据集上的10-shot和30-shot设置下,与VFA相比,所提模型的AP分别提升0.4和0.6个百分点;与Meta FR-CNN(Meta Faster RCNN)相比,所提模型的AP50分别提升11.4和8.7个百分点。可见,所提方法通过更有效地利用有限特征信息提升了对新类样本的识别能力,对只能获取极少量样本的特殊场景下的目标检测模型泛化能力的提升具有参考价值。 展开更多
关键词 小样本目标检测 丰富语义信息 特征信息匹配 空间上下文 像素关系映射
在线阅读 下载PDF
结合模糊测试和污点分析的幽灵漏洞检测
19
作者 李扬 马自强 +1 位作者 苗莉 姚梓豪 《信息安全研究》 2025年第9期822-831,共10页
针对传统漏洞检测技术在Spectre V1漏洞检测中适用性不足、漏报率和误报率较高等问题,提出了一种结合模糊测试与污点分析的Spectre V1漏洞检测方法TransFT.首先,通过对程序代码进行控制流重构,模拟Spectre V1漏洞的错误预测行为;其次,... 针对传统漏洞检测技术在Spectre V1漏洞检测中适用性不足、漏报率和误报率较高等问题,提出了一种结合模糊测试与污点分析的Spectre V1漏洞检测方法TransFT.首先,通过对程序代码进行控制流重构,模拟Spectre V1漏洞的错误预测行为;其次,采用反馈驱动的模糊测试技术定位高风险代码片段,并保留和生成能够触发漏洞的测试用例,以提升测试效率;最后,基于静态污点分析对潜在漏洞进行验证,有效降低漏报率和误报率.实验结果表明,与传统方法相比,该方法在漏报率、误报率及测试时间方面均显著改善,展现出更优的漏洞检测能力. 展开更多
关键词 幽灵漏洞 瞬态执行攻击 漏洞检测 模糊测试 污点分析
在线阅读 下载PDF
基于并联分支联合编码的网络恶意流量分类研究
20
作者 马自强 崔梦真 +1 位作者 杨天宇 张宁宁 《通信学报》 2025年第8期193-204,共12页
针对单分支模型无法完整表述流量信息且并联分支模型无法很好地融合各个支路提取特征的问题,提出了一种基于并联分支联合编码的网络恶意流量分类模型。在特征提取方面,采用分裂注意力残差网络和双向长短期记忆网络(Bi-LSTM)对原始流量... 针对单分支模型无法完整表述流量信息且并联分支模型无法很好地融合各个支路提取特征的问题,提出了一种基于并联分支联合编码的网络恶意流量分类模型。在特征提取方面,采用分裂注意力残差网络和双向长短期记忆网络(Bi-LSTM)对原始流量分别提取空间特征和时序特征。在分支融合方面,采用交叉多头自注意力机制来利用分支间的关联性,并获得有效的特征融合。最终输入全连接层中进行网络恶意流量分类。在公开数据集USTC-TFC2016上的广泛实验表明,所提模型在准确率、精确度、召回率和F1值等关键性能指标上均表现出显著优势;在针对新型恶意流量的在线学习能力评估中,所提模型同样表现出优越的性能。 展开更多
关键词 流量分类 并联分支联合 双向长短期记忆网络 交叉多头自注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部