期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离
1
作者 王春丽 刘素倩 陈善立 《信号处理》 北大核心 2025年第4期718-729,共12页
针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合... 针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合现实中复杂的背景环境需求。为使模型可以在现实应用复杂条件下灵活应对混合语音信号中的多变性与非平稳性,采用多尺度可变形注意力机制与Transformer编码器构成(Transformer Encoder Multi-Scale deformable attention,TEMDA)模块,利用多尺度可变形注意力机制的偏移层在不同位置上进行动态计算,扩展模型的感受野,同时使模型更有效地聚焦于重要的时间点,减少噪声和混响的影响。为了更好地获取上下文信息,在多路径融合策略中,通过在双路径模块的基础上增加通道间的Conformer组成三路径模块,用于提取多说话人之间的特征信息,这样的处理方式可以更好地融合单一说话人和多说话人之间的信息,提升语音分离性能。实验表明,所提出的模型分别在纯净和带噪声的Libri2Mix、Libri3Mix数据集上达到了显著的分离效果,并且在LRS2-2Mix数据集中模型可以更好地减少噪声和混响对语音分离的影响,尺度不变信噪比改善(Scale-Invariant Signal-to-Noise Ratio Improvement,SI-SNRi)和信号失真比改善(Signal-to-Distortion Ratio Improvement,SDRi)分别为14.7 dB和15.1 dB;在三个说话人数目中的估计精度为98.89%,提升了0.12%。 展开更多
关键词 未知说话人语音分离 多尺度可变形注意力编码策略 多路径融合 吸引子估计
在线阅读 下载PDF
融入交叉注意力编码的皮肤病变分割网络 被引量:2
2
作者 李大湘 杨福杰 +1 位作者 刘颖 唐垚 《光学精密工程》 EI CAS CSCD 北大核心 2024年第4期609-621,共13页
由于卷积操作的局限性,现有的皮肤病变图像分割网络无法对图像中的全局上下文信息建模,导致其无法有效捕获图像的目标结构信息,本文设计了一个融入交叉自注意力编码的U型混合网络,用于皮肤病变图像分割。首先,将设计的多头门控位置交叉... 由于卷积操作的局限性,现有的皮肤病变图像分割网络无法对图像中的全局上下文信息建模,导致其无法有效捕获图像的目标结构信息,本文设计了一个融入交叉自注意力编码的U型混合网络,用于皮肤病变图像分割。首先,将设计的多头门控位置交叉自注意力编码器引入到U型网络的最后两个层级中,使其能够在图像中学习语义信息的长期依赖关系,弥补卷积操作全局建模能力的不足;其次,在跳跃连接部分引入一个新的位置通道注意力机制,用于编码融合特征的通道信息并保留位置信息,提高网络捕获目标结构的能力;最后,设计一个正则化Dice损失函数,使网络能够在假阳性和假阴性之间权衡,提高网络的分割结果。基于ISBI2017和ISIC2018数据集的对比实验结果表明,本文网络的Dice分别为91.48%和91.30%,IoU分别为84.42%和84.12%,分割精度在整体上优于其他网络,且具有较低的参数量和计算复杂度,即本文网络能够高效地分割皮肤病变图像的目标区域,可为皮肤疾病辅助诊断提供帮助。 展开更多
关键词 医学图像分割 皮肤病变 交叉自注意力编码 位置通道注意力
在线阅读 下载PDF
基于双分支多视角深度自注意力编码器的乳腺肿瘤分类方法 被引量:2
3
作者 柳懿垚 杨意 +3 位作者 陈敏思 汪天富 姜伟 雷柏英 《中国生物医学工程学报》 CAS CSCD 北大核心 2022年第5期527-536,共10页
自动乳腺全容积超声成像(ABVS)系统因其高效、无辐射等特性成为筛查乳腺癌的重要方式。针对ABVS图像进行计算机辅助乳腺肿瘤良恶性分类的研究,有利于帮助临床医生准确、快速地进行乳腺癌的诊断,甚至可辅助提高低年资医生的诊断水平。ABV... 自动乳腺全容积超声成像(ABVS)系统因其高效、无辐射等特性成为筛查乳腺癌的重要方式。针对ABVS图像进行计算机辅助乳腺肿瘤良恶性分类的研究,有利于帮助临床医生准确、快速地进行乳腺癌的诊断,甚至可辅助提高低年资医生的诊断水平。ABVS系统产生的三维乳腺图像数据量较大,造成常规的深度学习方式训练时间长、占用资源巨大。本研究设计了一种基于ABVS数据的多视角图像提取方式,替代常规的三维数据输入,在降低参数量的同时弥补二维深度学习中的空间关联性;其次,基于交叉视角图像的空间位置关系,提出一种深度自注意力编码器(Transformer)网络,用于获得图像的有效特征表达。实验是基于自有ABVS数据库的153例容积图像,良恶性分类的准确率为86.88%,F1-评分为81.70%,AUC达到0.8316。所提出的方法有望应用于ABVS图像的乳腺肿瘤良恶性筛查。 展开更多
关键词 乳腺癌 多视角 注意力编码 良恶性诊断 自动乳腺全容积超声成像
在线阅读 下载PDF
用于旋转机械状态趋势预测的量子注意力循环编码解码神经网络 被引量:1
4
作者 李锋 程阳洋 +1 位作者 陈勇 汤宝平 《中国机械工程》 EI CAS CSCD 北大核心 2020年第21期2573-2582,共10页
提出了基于量子注意力循环编码解码神经网络(QAREDNN)的旋转机械状态趋势预测方法。在QAREDNN中,引入注意力机制以同时重构QAREDNN的编码器和解码器,使QAREDNN能够充分挖掘和重视重要信息,并抑制冗余信息的干扰,从而获得更好的非线性逼... 提出了基于量子注意力循环编码解码神经网络(QAREDNN)的旋转机械状态趋势预测方法。在QAREDNN中,引入注意力机制以同时重构QAREDNN的编码器和解码器,使QAREDNN能够充分挖掘和重视重要信息,并抑制冗余信息的干扰,从而获得更好的非线性逼近能力;采用量子神经元构建了一种活性值和权值由量子旋转矩阵代替的量子门限循环单元(QGRU),QGRU不仅能够更加精细地遍历解空间,还具有大量的多重吸引子,因此QGRU能代替传统编码器和解码器中的循环单元以提高QAREDNN的泛化能力和响应速度;通过引入Levenberg-Marquardt(LM)法来提高QAREDNN的量子旋转矩阵的旋转角和注意力参数的更新速度。滚动轴承状态趋势预测实例验证了该方法的有效性。 展开更多
关键词 量子注意力循环编码解码神经网络 注意力机制 量子神经元 状态趋势预测 旋转机械
在线阅读 下载PDF
联合ZINB模型与图注意力自编码器的自优化单细胞聚类
5
作者 孔凤玲 吴昊 董庆庆 《计算机科学》 CSCD 北大核心 2023年第12期104-112,共9页
单细胞数据聚类在生物信息分析中具有重要作用,但受测序原理和测序平台的限制,单细胞数据集普遍存在高维稀疏性、高方差噪声和基因数据缺失的问题,导致单细胞数据在聚类分析和应用方面仍面临诸多挑战。现有的单细胞聚类方法主要针对细... 单细胞数据聚类在生物信息分析中具有重要作用,但受测序原理和测序平台的限制,单细胞数据集普遍存在高维稀疏性、高方差噪声和基因数据缺失的问题,导致单细胞数据在聚类分析和应用方面仍面临诸多挑战。现有的单细胞聚类方法主要针对细胞和基因表达间的关系进行建模,忽略了对细胞间潜在特征关系的充分挖掘以及对噪声的去除,导致聚类结果不理想,从而阻碍了后期对数据的分析。针对上述问题,提出了一种联合零膨胀负二项(Zero Inflated Negative Binomial,ZINB)模型与图注意力自编码器的自优化单细胞聚类算法(Self-optimized Single Cell Clustering Using ZINB Model and Graph Attention Autoencoder,scZDGAC)。该算法首先使用ZINB模型并结合可扩展的DCA去噪算法,通过ZINB分布更好地拟合数据特征分布,提升自编码器的去噪性能,并减小噪声和数据丢失对KNN算法输出的影响;然后通过图注意力自编码器在不同权重的细胞之间传播信息,更好地捕获细胞间的潜在特征进行聚类;最后scZDGAC采用自优化的方法使原本两个独立的聚类模块和特征模块相互受益,不断迭代更新聚类中心,进一步提升聚类性能。为了对聚类结果进行评价,文中使用调整兰德指数(ARI)和标准化互信息(NMI)两个通用评价指标。在6个不同规模的单细胞数据集上与其他算法进行对比实验,结果表明,所提聚类算法在聚类性能上较其他方法有很大提高,很好地展现了该算法的鲁棒性。 展开更多
关键词 深度聚类 scRNA-Seq ZINB模型 自优化 DCA 注意力编码
在线阅读 下载PDF
基于Transformer交叉注意力的文本生成图像技术 被引量:6
6
作者 谈馨悦 何小海 +2 位作者 王正勇 罗晓东 卿粼波 《计算机科学》 CSCD 北大核心 2022年第2期107-115,共9页
近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展。文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像。目前,主流的方法是通过预训练文本编码器来完... 近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展。文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像。目前,主流的方法是通过预训练文本编码器来完成对输入文本描述的编码,但这些方法在文本编码器中未考虑与对应图像的语义对齐问题,独立对输入文本进行编码,忽略了语言空间与图像空间之间的语义鸿沟问题。为解决这一问题,文中设计了一种基于交叉注意力编码器的对抗生成网络(CAE-GAN),该网络通过交叉注意力编码器,将文本信息与视觉信息进行翻译和对齐,以捕捉文本与图像信息之间的跨模态映射关系,从而提升生成图像的逼真度和与输入文本描述的匹配度。实验结果表明,在CUB和coco数据集上,与当前主流的方法DM-GAN模型相比,CAE-GAN模型的IS(Inception Score)分数分别提升了2.53%和1.54%,FID (Fréchet Inception Distance)分数分别降低了15.10%和5.54%,由此可知,CAE-GAN模型生成图像的细节更加完整、质量更高。 展开更多
关键词 文本描述生成图像 生成对抗网络 交叉注意力编码 图像生成 计算机视觉
在线阅读 下载PDF
采用自注意力抗干扰网络的视频房颤检测 被引量:1
7
作者 陈静 杨学志 +1 位作者 陈鲸 刘雪南 《图学学报》 CSCD 北大核心 2023年第2期313-323,共11页
房颤的早期发现与诊断是降低房颤以及并发症风险的关键。视频光电体积描记术(VPPG)技术为房颤筛查提供了新途径,但易受到现实场景中运动干扰。现有VPPG房颤检测方法存在运动干扰时会造成脉冲信号失真,从而发生误判。为解决以上问题,提... 房颤的早期发现与诊断是降低房颤以及并发症风险的关键。视频光电体积描记术(VPPG)技术为房颤筛查提供了新途径,但易受到现实场景中运动干扰。现有VPPG房颤检测方法存在运动干扰时会造成脉冲信号失真,从而发生误判。为解决以上问题,提出一种抗干扰视频房颤检测模型。该模型使用注意力编码器网络,从包含运动干扰的脉冲信号中提取鲁棒的脉冲潜在特征,径向基分类网络根据潜在特征实现房颤检测。注意力编码器将复杂脉冲信号映射到高维子空间,重点关注有效信息,提取稳健潜在特征。径向基分类网络在房颤标签监督下提高房颤识别能力,输出可靠结果。在200名测试者参与的自建数据集上进行实验,结果表明该模型在各类场景中均表现优异。在静态场景中,检测精度较最优对比算法提高了8.1%,敏感性提高了7.5%。在动态场景中,对比算法准确度均大幅下降,所提模型精度相比提升了16.5%,特异性提升了18.3%。模型具有良好的抗运动干扰能力,可有效地消除运动干扰影响,提高现实场景中视频房颤检测精度。 展开更多
关键词 视频光电体积描记术 房颤检测 抗运动干扰 注意力编码 潜在特征
在线阅读 下载PDF
面向语义片段结构化自注意力的目标情感分析 被引量:1
8
作者 邓航 陈渝 +1 位作者 赵容梅 琚生根 《小型微型计算机系统》 CSCD 北大核心 2022年第12期2499-2505,共7页
目标情感分析任务中大多数方法都使用循环神经网络或注意力机制对句子进行建模,但循环神经网络很难进行并行化计算,且不能充分捕捉长距离的语义信息;注意力机制注重于词与词之间的相关性,忽略了语义片段的重要性.针对以上问题,论文提出... 目标情感分析任务中大多数方法都使用循环神经网络或注意力机制对句子进行建模,但循环神经网络很难进行并行化计算,且不能充分捕捉长距离的语义信息;注意力机制注重于词与词之间的相关性,忽略了语义片段的重要性.针对以上问题,论文提出了一种面向语义片段结构化自注意力的目标情感分析方法.首先通过BERT获取目标词、上下文和整个句子的嵌入表示,再利用注意力编码网络进行语义建模.其次,通过多头注意力机制获得目标与上下文的融合语义特征,通过结构化自注意力机制获得句子片段的语义特征.最终,在融合各个语义特征的基础上对目标的情感极性分类.本方法在SemEval 2014 Task4和SemEval 2015 Task12通用数据集上的实验表明,该方法对比基线方法获得了提升. 展开更多
关键词 目标情感分析 注意力编码网络 结构化自注意力 BERT
在线阅读 下载PDF
基于多层特征嵌入的单目标跟踪算法
9
作者 才华 周鸿策 +1 位作者 付强 赵义武 《兵工学报》 北大核心 2025年第3期333-348,共16页
针对现有视觉目标跟踪方法仅使用初始帧的目标单一外观特征,导致当背景复杂或外观发生剧烈变化时跟踪失效的问题,提出一种基于多层特征嵌入的单目标跟踪算法。增强目标的外观区分度,使用稀疏内嵌注意力机制编码器,嵌入具有高实例区分度... 针对现有视觉目标跟踪方法仅使用初始帧的目标单一外观特征,导致当背景复杂或外观发生剧烈变化时跟踪失效的问题,提出一种基于多层特征嵌入的单目标跟踪算法。增强目标的外观区分度,使用稀疏内嵌注意力机制编码器,嵌入具有高实例区分度的外观特征;采用类间特征聚合编码器嵌入目标的类别信息,在外观发生变化时保持类内的紧凑性;同时将预测的历史帧跟踪框坐标转化为目标运动轨迹特征嵌入,为算法提供高置信度的时间上下文特征。研究结果表明:所提算法在OTB100基准测试中成功率和准确率分别达到71.4%和92.6%,在GOT-10K、LaSOT、TrackingNet共3个大规模公开数据上取得了鲁棒的效果,成功率分别达到64.9%、72.0%和78.7%;基于多层特征嵌入的单目标跟踪算法有效地克服了现有算法的局限,具有较好的准确性和鲁棒性。 展开更多
关键词 目标跟踪 稀疏内嵌注意力机制编码 类间特征聚合编码 运动特征嵌入
在线阅读 下载PDF
无线传感器网络数据压缩与时延估计精度的平衡优化
10
作者 任国栋 高勇 《电讯技术》 北大核心 2025年第7期1138-1143,共6页
在大规模无线传感器网络中的时延估计研究中,良好的数据压缩是实现节省带宽资源与尽量降低时延估计精度损失的一个重要方法。然而,传统的方法在信号压缩与重建过程中存在信息损失大、计算复杂度高等问题。为了解决这些问题,提出了一种... 在大规模无线传感器网络中的时延估计研究中,良好的数据压缩是实现节省带宽资源与尽量降低时延估计精度损失的一个重要方法。然而,传统的方法在信号压缩与重建过程中存在信息损失大、计算复杂度高等问题。为了解决这些问题,提出了一种使用卷积自编码器-注意力机制-广义互相关相位变换的模型,实现无线传感器网络中的二进制相移键控(Binary Phase Shift Keying,BPSK)信号数据压缩与时延估计的平衡。仿真实验表明,相较于使用奇异值分解与赫夫曼(Huffman)编码分别压缩解压后计算的时延,所提模型具有以下优势:一是可实现更高的信号压缩率;二是重构信号具有更小的均方误差;三是压缩比例相同时具有更高的时延估计精度。仿真实验数据进一步验证了模型在应用场景中的有效性,表明其适用于大规模无线传感器网络的实际应用。 展开更多
关键词 无线传感器网络(WSN) 数据压缩 时延估计 卷积自编码器-注意力机制
在线阅读 下载PDF
基于U2-Net的金属表面缺陷检测算法 被引量:9
11
作者 王昱翔 葛洪伟 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期413-424,共12页
金属表面缺陷检测旨在通过合理的算法判断工业生产中金属材料的表面图像中是否存在缺陷,是计算机视觉领域在工业应用中的重要研究内容,但现有的基于分割的金属表面缺陷检测算法存在抗干扰能力弱、容易背景误判和检测粒度不够细致等问题... 金属表面缺陷检测旨在通过合理的算法判断工业生产中金属材料的表面图像中是否存在缺陷,是计算机视觉领域在工业应用中的重要研究内容,但现有的基于分割的金属表面缺陷检测算法存在抗干扰能力弱、容易背景误判和检测粒度不够细致等问题.针对具有各种干扰因子的金属表面图像,提出一种基于U2-Net的金属表面缺陷检测算法Attention-U2Net.首先,为了解决实际生产中金属表面图像噪点过多导致背景误判和采样层获取信息不够细致的问题,设计U型注意力编码模块,可以在编码时增大缺陷区域权重的同时,抑制背景噪声;然后,为了解决图像中存在的难检测样本和边界复杂问题,设计具有权重的损失函数并结合多层次监督方法,使检测算法更关注难检测样本和边界像素点,提高预测准确度;最后,使用根据图像结果自动计算灰度阈值进行结果优化的算法,最终生成高质量缺陷预测图.与六种常用的缺陷检测领域的像素分割方法在金属表面缺陷公开数据集上进行比较实验,实验结果表明,提出的算法的像素准确率、查准率、查全率、F-score、平均绝对误差和均方误差均取得了优良的结果,证明该算法拥有较强的抗干扰因子能力,最终缺陷预测图像素准确率高,边界明显. 展开更多
关键词 缺陷检测 深度学习 注意力编码 图像优化 图像分割
在线阅读 下载PDF
模块化枪族智能化辅助设计策略与方法 被引量:5
12
作者 赵书彬 徐诚 +1 位作者 蒋弘毅 步春辰 《兵工学报》 EI CAS CSCD 北大核心 2021年第4期723-733,共11页
枪族的模块化、智能化设计是当今国内外枪械设计的热点。根据枪族设计特点建立基于知识的计算机辅助设计流程,提出一种基于模块化的枪族智能辅助设计策略与方法。针对枪族设计领域不同类型的知识,采用统一的面向对象知识表示,在枪族定... 枪族的模块化、智能化设计是当今国内外枪械设计的热点。根据枪族设计特点建立基于知识的计算机辅助设计流程,提出一种基于模块化的枪族智能辅助设计策略与方法。针对枪族设计领域不同类型的知识,采用统一的面向对象知识表示,在枪族定义阶段和模块设计阶段求解中分别运用基于知识模板、机器学习和混合推理的策略。具体地,采用模块划分知识模板引导枪族模块化设计,利用基于随机森林的回归算法完成枪族系列主参数的估算;采用基于注意力机制的双向编码器模型的枪械知识问答系统和基于实例推理、设计规则与计算交叉推理的混合推理模式辅助设计者完成枪械各模块详细设计。完成了软件原型系统的构建,进行了5.8 mm/7.62 mm口径模块化枪族的设计,结果证明了该方法的有效性。 展开更多
关键词 模块化枪族 智能化辅助设计 随机森林 实例推理 注意力机制的双向编码 问答系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部