期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于密集多尺度自注意力变换网络的伪装对象分割方法
1
作者 闫馨宇 孙美君 +1 位作者 韩亚洪 王征 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第8期1224-1236,共13页
为了充分地发挥深度自注意力变换网络在伪装对象分割任务中的潜力,提出一种基于密集多尺度自注意力变换网络的伪装对象分割方法,包含双分支可分离密集多尺度特征提取和快速注意力诱导的跨级交互融合2个模块.首先以自注意力变换网络作为... 为了充分地发挥深度自注意力变换网络在伪装对象分割任务中的潜力,提出一种基于密集多尺度自注意力变换网络的伪装对象分割方法,包含双分支可分离密集多尺度特征提取和快速注意力诱导的跨级交互融合2个模块.首先以自注意力变换网络作为骨干特征提取器获取各级特征;然后将提取的特征馈送到双分支可分离密集多尺度特征提取模块,在局部分支和全局分支中,利用密集递进相连的深度可分离卷积块提取丰富的多尺度上下文特征;最后使用快速注意力诱导的跨级交互融合模块融合各级特征,并利用每级融合特征预测伪装映射,通过深度监督让各级特征在空间上保持高度一致性,尽可能地集中注意力于伪装特征而避免背景噪声的干扰.在CHAMELEON,CAMO,COD10K和NC4K这4个基准数据集上,与其他28种主流模型进行定性可视化对比,以及针对PR曲线、S值、F值、E值及MAE这5种评价指标的定量对比实验结果表明,所提出的基于密集多尺度自注意力变换网络是一种有效的伪装对象分割模型. 展开更多
关键词 伪装对象分割 自注意力变换网络 深度学习
在线阅读 下载PDF
基于自注意力机制的深度学习模拟电路故障诊断 被引量:17
2
作者 杨东儒 魏建文 +2 位作者 林雄威 刘明 鲁圣国 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第3期128-136,共9页
模拟电路是集成电路中的重要组成部分,基于深度学习技术对模拟电路发生的故障进行检测,并精准识别故障的类型是当前集成电路测试领域的研究热点。针对模拟集成电路故障检测存在困难的问题,利用人工智能在图像识别领域、语音分类领域的... 模拟电路是集成电路中的重要组成部分,基于深度学习技术对模拟电路发生的故障进行检测,并精准识别故障的类型是当前集成电路测试领域的研究热点。针对模拟集成电路故障检测存在困难的问题,利用人工智能在图像识别领域、语音分类领域的先进技术,提出了基于自注意力机制检测Sallen-Key型低通滤波电路故障的深度学习模拟电路故障检测方案,将输出信号采样成音频信号,并将其输入到自注意力变换网络的音频分类模型中进行训练、测试和优化。结果表明,通过自注意力变换网络音频分类在9种不同的故障类型诊断中,平均准确率达93.1%,最高准确率达98.1%。该模型收敛速度更快,具有较强的模拟电路故障检测能力。 展开更多
关键词 集成电路测试 故障检测 深度学习 频谱图 自注意力变换网络
在线阅读 下载PDF
DeepSeek模型分析及其在AI辅助蛋白质工程中的应用 被引量:1
3
作者 李明辰 钟博子韬 +6 位作者 余元玺 姜帆 张良 谭扬 虞慧群 范贵生 洪亮 《合成生物学》 北大核心 2025年第3期636-650,共15页
2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关... 2025年年初,杭州深度求索人工智能基础技术研究有限公司发布并开源了其自主研发的DeepSeek-R1对话大模型。该模型具备极低的推理成本和出色的思维链推理能力,在多种任务上能够媲美甚至超越闭源的GPT-4o和o1模型,引发了国际社会的高度关注。此外,DeepSeek模型在中文对话上的优异表现以及免费商用的策略,在国内引发了部署和使用的热潮,推动了人工智能技术的普惠与发展。本文围绕DeepSeek模型的架构设计、训练方法与推理机制进行系统性分析,探讨其核心技术在AI蛋白质研究中的迁移潜力与应用前景。DeepSeek模型融合了多项自主创新的前沿技术,包括多头潜在注意力机制、混合专家网络及其负载均衡、低精度训练等,显著降低了Transformer模型的训练和推理成本。尽管DeepSeek模型原生设计用于人类语言的理解与生成,但其优化技术对同样基于Transformer模型的蛋白质预训练语言模型具有重要的参考价值。借助DeepSeek所采用的关键技术,蛋白质语言模型在训练成本、推理成本等方面有望得到显著降低。 展开更多
关键词 大语言模型 AI蛋白质 深度自注意力变换网络 蛋白质语言模型 深度学习
在线阅读 下载PDF
嵌入局部聚类描述符的视频问答Transformer模型 被引量:3
4
作者 郭丹 姚沈涛 +1 位作者 王辉 汪萌 《计算机学报》 EI CAS CSCD 北大核心 2023年第4期671-689,共19页
视频问答(Video Question Answering)是典型的跨模态理解任务,其目的是根据提问的文本对视频内容进行理解并推理正确的答案,如何有效地对多模态输入进行特征表示并建立跨模态间复杂的语义关联是解决这一任务的关键难点.为了正确地推理结... 视频问答(Video Question Answering)是典型的跨模态理解任务,其目的是根据提问的文本对视频内容进行理解并推理正确的答案,如何有效地对多模态输入进行特征表示并建立跨模态间复杂的语义关联是解决这一任务的关键难点.为了正确地推理结果,模型首先必须捕获视频序列和复杂文本中包含的关键语义信息.本文提出了一种嵌入局部聚类描述符的视频问答Transformer模型,称为TVLAD-Net(Transformer Residual-less VLAD Network).TVLAD-Net主要包含一个端到端可训练的无残差局部聚合描述符模块(RVLAD,Residual-less Vec⁃tor of Local Aggregated Descriptor),以及一个统一的语义转换模块(Transformer).具体来说,RVLAD通过设置多个不同的聚类中心将视频和文本特征分别聚合为少量紧凑的局部聚类描述符;每个聚类描述符从全局角度分配及汇总了序列上权重不一的语义信息,相比于聚合前的视频帧特征或文本词特征具有更丰富的表征能力.Trans⁃former模块能够利用模态间的相互语义引导,实现多模态聚类描述符的语义交互,即采用多头注意力机制同时求解模态内和模态间的语义关联,进而避免了与所求解问题无关或者冗余的描述符语义单元的聚合.实验评估在TGIF-QA、MSVD-QA和MSRVTT-QA三个基准数据集上进行;实验结果表明本文方法能够实现先进的问答推理,在整体的评价指标上与现有方法相比有2%~5%的性能提升. 展开更多
关键词 视频问答 多模态数据 聚类描述符 自注意力变换网络 深度学习
在线阅读 下载PDF
基于ViT的细粒度图像分类 被引量:8
5
作者 李佳盈 蒋文婷 +1 位作者 杨林 罗铁坚 《计算机工程与设计》 北大核心 2023年第3期916-921,共6页
为解决细粒度图像分类任务存在类内差异性和类间相似性大的问题,提出一种基于Vision Transformer(ViT)的细粒度图像分类方法。采取ViT作为特征编码网络,获取图像的全局特征表示;设计多级区域选择模块,捕捉细微的具有可判别性的层级化信... 为解决细粒度图像分类任务存在类内差异性和类间相似性大的问题,提出一种基于Vision Transformer(ViT)的细粒度图像分类方法。采取ViT作为特征编码网络,获取图像的全局特征表示;设计多级区域选择模块,捕捉细微的具有可判别性的层级化信息;利用一个简单且有效的中心损失函数,缩短深层特征与相应类中心在特征空间中的距离。在图像级标签的监督下,实现端到端的训练。结果在CUB-200-2011、NABirds以及Stanford Cars数据集上分别达到90.1%、90.2%和93.7%的分类准确率,超越当前最优算法。 展开更多
关键词 细粒度图像分类 深度自注意力变换网络 注意力机制 中心损失 卷积神经网络 特征表示 特征空间
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部