期刊文献+
共找到267篇文章
< 1 2 14 >
每页显示 20 50 100
MSMVT:多尺度和多视图Transformer半监督医学图像分割框架 被引量:3
1
作者 李飞翔 降爱莲 《计算机工程与应用》 北大核心 2025年第2期273-282,共10页
近年来,Transformer在众多监督式计算机视觉任务中取得了显著进展,然而由于高质量医学标注图像的缺乏,其在半监督图像分割领域的性能仍有待提高。为此,提出了一种基于多尺度和多视图Transformer的半监督医学图像分割框架:MSMVT(multi-sc... 近年来,Transformer在众多监督式计算机视觉任务中取得了显著进展,然而由于高质量医学标注图像的缺乏,其在半监督图像分割领域的性能仍有待提高。为此,提出了一种基于多尺度和多视图Transformer的半监督医学图像分割框架:MSMVT(multi-scale and multi-view transformer)。鉴于对比学习在Transformer的预训练中取得的良好效果,设计了一个基于伪标签引导的多尺度原型对比学习模块。该模块利用图像金字塔数据增强技术,为无标签图像生成富有语义信息的多尺度原型表示;通过对比学习,强化了不同尺度原型之间的一致性,从而有效缓解了由标签稀缺性导致的Transformer训练不足的问题。此外,为了增强Transformer模型训练的稳定性,提出了多视图一致性学习策略。通过弱扰动视图,以校正多个强扰动视图。通过最小化不同视图之间的输出差异性,使得模型能够对不同扰动保持多层次的一致性。实验结果表明,当仅采用10%的标注比例时,提出的MSMVT框架在ACDC、LIDC和ISIC三个公共数据集上的DSC图像分割性能指标分别达到了88.93%、84.75%和85.38%,优于现有的半监督医学图像分割方法。 展开更多
关键词 半监督医学图像分割 伪标签 transformER 多尺度 多视图
在线阅读 下载PDF
基于双域查询增强Transformer的遥感图像旋转小目标检测
2
作者 王福军 王星 王柯迪 《吉林大学学报(理学版)》 北大核心 2025年第5期1418-1426,共9页
针对遥感图像中旋转小目标在尺度受限、姿态多样及复杂背景条件下检测精度不足的问题,提出一种旋转感知双域查询增强的Transformer网络方法.该方法采用卷积神经网络提取多尺度特征,并在编码端引入空间和频率双域联合增强机制,其中空间... 针对遥感图像中旋转小目标在尺度受限、姿态多样及复杂背景条件下检测精度不足的问题,提出一种旋转感知双域查询增强的Transformer网络方法.该方法采用卷积神经网络提取多尺度特征,并在编码端引入空间和频率双域联合增强机制,其中空间自适应模块利用多尺度感受野捕获几何结构特征,频率自适应模块通过小波变换提取方向信息,经跨域融合模块生成兼具空间与频率感知能力的特征查询.解码端引入旋转感知模块,在Transformer解码过程中动态估计空间偏移,实现多尺度旋转小目标的精准对齐.实验结果表明,该方法在公开遥感图像数据集上显著提升了旋转小目标的检测精度,验证了其在复杂背景条件下的有效性和鲁棒性. 展开更多
关键词 遥感图像 旋转小目标检测 双域查询增强 transformer模型
在线阅读 下载PDF
联合多视角Transformer编码与在线融合互学习的乳腺癌病理图像分类模型 被引量:1
3
作者 李广丽 叶艺源 +3 位作者 吴光庭 李传秀 吕敬钦 张红斌 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2369-2381,共13页
乳腺癌是女性最常见的癌症.单一网络在乳腺癌病理图像分类中存在缺陷,卷积神经网络无法提取全局上下文,而Transformer不能准确描述局部细节.本文提出联合多视角Transformer编码与在线融合互学习的乳腺癌病理图像分类模型(Multi-View Tra... 乳腺癌是女性最常见的癌症.单一网络在乳腺癌病理图像分类中存在缺陷,卷积神经网络无法提取全局上下文,而Transformer不能准确描述局部细节.本文提出联合多视角Transformer编码与在线融合互学习的乳腺癌病理图像分类模型(Multi-View Transformer Online Fusion Mutual Learning,MVT-OFML).采用ResNet-50(Residual Network-50)提取图像局部特征,设计多视角Transformer编码模块,捕获图像中全局上下文;联合Logits和中间特征层构建OFML框架,实现ResNet-50与多视角Transformer编码模块间双向传递知识,使2个网络优势互补以完成乳腺癌病理图像分类.实验表明,在BreakHis和BACH数据集上,MVT-OFML的准确率比最强基线分别提升0.90%和2.26%,F1均值比最强基线分别提升4.75%和3.21%. 展开更多
关键词 乳腺癌 病理图像分类 多视角transformer 卷积神经网络 在线融合互学习
在线阅读 下载PDF
基于边缘辅助极线Transformer的多视角场景重建 被引量:1
4
作者 童伟 张苗苗 +2 位作者 李东方 吴奇 宋爱国 《电子与信息学报》 EI CSCD 北大核心 2023年第10期3483-3491,共9页
基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断... 基于深度学习的多视角立体几何(MVS)旨在通过多个视图重建出稠密的3维场景。然而现有的方法通常设计复杂的2D网络模块来学习代价体聚合的跨视角可见性,忽略了跨视角2维上下文特征在3D深度方向的一致性假设。此外,基于多阶段的深度推断方法仍需要较高的深度采样率,并且在静态或预先设定的范围内采样深度值,容易在物体边界以及光照遮挡等区域产生错误的深度推断。为了缓解这些问题,该文提出一种基于边缘辅助极线Transformer的密集深度推断模型。与现有工作相比,具体改进如下:将深度回归转换为多深度值分类进行求解,在有限的深度采样率和GPU占用下保证了推断精度;设计一种极线Transformer模块提高跨视角代价体聚合的可靠性,并引入边缘检测分支约束边缘特征在极线方向的一致性;为了提高弱纹理区域的精度,设计了基于概率成本体积的动态深度范围采样机制。与主流的方法在公开的数据集上进行了综合对比,实验结果表明所提模型能够在有限的显存占用下重建出稠密准确的3D场景。特别地,相比于Cas-MVSNet,所提模型的显存占用降低了35%,深度采样率降低约50%,DTU数据集的综合误差从0.355降低至0.325。 展开更多
关键词 多视角场景重建 多视角立体几何 深度估计 极线几何 transformER
在线阅读 下载PDF
具有跨尺度Transformer的高效多视图立体网络 被引量:1
5
作者 王思成 江浩 陈晓 《计算机工程》 CAS CSCD 北大核心 2024年第11期266-275,共10页
现有深度多视图立体(MVS)方法将Transformer引入级联网络,以实现高分辨率深度估计,从而实现高精确度和完整度的三维重建结果。然而,基于Transformer的方法受计算成本的限制,无法扩展到更精细的阶段。为此,提出一种新颖的跨尺度Transfor... 现有深度多视图立体(MVS)方法将Transformer引入级联网络,以实现高分辨率深度估计,从而实现高精确度和完整度的三维重建结果。然而,基于Transformer的方法受计算成本的限制,无法扩展到更精细的阶段。为此,提出一种新颖的跨尺度Transformer的MVS网络,在不增加额外计算的情况下处理不同阶段的特征表示。引入一种自适应匹配感知Transformer(AMT),在多个尺度上使用不同的交互式注意力组合。这种组合策略使所提网络能够捕捉图像内部的上下文信息,并增强图像之间的特征关系。此外,设计双特征引导聚合(DFGA),将粗糙的全局语义信息嵌入到更精细的代价体构建中,以进一步增强全局和局部特征的感知。同时,通过设计一种特征度量损失,用于评估变换前后的特征偏差,以减少特征错误匹配对深度估计的影响。实验结果表明,在DTU数据集中,所提网络的完整度和整体度量达到0.264、0.302,在Tanks and temples 2个大场景的重建平均值分别达到64.28、38.03。 展开更多
关键词 多视图立体 特征匹配 transformer网络 注意力机制 三维重建
在线阅读 下载PDF
View synthesis based on the serial images from camera lengthways motion
6
作者 Zhang Jing Wang Changshun +2 位作者 Liao Wuling Ou Zongying Hua Shungang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2006年第2期284-289,共6页
For the pre-acquired serial images from camera lengthways motion, a view synthesis algorithm based on epipolar geometry constraint is proposed in this paper. It uses the whole matching and maintaining order characters... For the pre-acquired serial images from camera lengthways motion, a view synthesis algorithm based on epipolar geometry constraint is proposed in this paper. It uses the whole matching and maintaining order characters of the epipolar line, Fourier transform and dynamic programming matching theories, thus truly synthesizing the destination image of current viewpoint. Through the combination of Fourier transform, epipolar geometry constraint and dynamic programming matching, the circumference distortion problem resulting from conventional view synthesis approaches is effectively avoided. The detailed implementation steps of this algorithm are given, and some running instances are presented to illustrate the results. 展开更多
关键词 Image-based rendering view synthesis epipolar geometry constraint Fourier transform dynamic prog-ramming matching.
在线阅读 下载PDF
从“体育生活化”到“生活体育化”:理论基点、内在逻辑及学理阐释 被引量:6
7
作者 刘献国 唐强 《武汉体育学院学报》 北大核心 2025年第1期18-24,共7页
体育生活化是探究体育本质与价值的重要命题,具有强烈的现实针对性与历史合理性,但因时代之故存在美中不足,因而提出“体育生活化”向“生活体育化”转化与发展的问题。研究表明,生活体育化的理论基点是体育生活化,其转化过程遵循凸显... 体育生活化是探究体育本质与价值的重要命题,具有强烈的现实针对性与历史合理性,但因时代之故存在美中不足,因而提出“体育生活化”向“生活体育化”转化与发展的问题。研究表明,生活体育化的理论基点是体育生活化,其转化过程遵循凸显“生活”核心地位及进阶发展的理论逻辑,新时代体育和生活共同需求的现实逻辑。马克思生活观是生活体育化的理论之源,阐释了生活体育化的理论机制、核心内容与意义;内涵上生活体育化指向以体育活动为主体的休闲生活方式,表达为具有身体实践、交往实践的生活观念,生活与体育在双向塑造的过程中趋于统一,形成了以人的自由全面发展为目标的实践路径;其主张生活中职业与场域的泛化,以体育文化塑造生活、激发生活的活力并引领生活的美好。 展开更多
关键词 生活体育化 体育生活化 转化逻辑 美好生活 马克思生活观
在线阅读 下载PDF
融合局部和全局特征的深度多视图聚类网络
8
作者 李顺勇 李嘉茗 +1 位作者 曹付元 郑孟蛟 《计算机科学与探索》 北大核心 2025年第8期2085-2098,共14页
多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多... 多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多视图深度聚类方法,通过深度神经网络或对比学习增强了表征能力,但大多只关注局部或全局特征,未能在同一框架下对这两类特征进行综合处理。针对这些不足,提出了一种融合卷积神经网络与Transformer的深度多视图聚类模型(DMVCN-ILGF)。该模型设计了并行的卷积分支和Transformer分支,分别用于提取局部特征和全局特征。为了实现特征的有效融合,引入了特征交互机制(FIM)和特征融合模块(FFM),通过充分整合各视图的特征信息,以增强不同特征的交互和融合,最终提升聚类性能。进一步地,还设计了实例级和类别级对比损失,分别计算各视图的局部与全局特征之间的相似性,从而优化模型的表征能力和聚类效果。实验结果表明,提出的DMVCN-ILGF模型在多个多视图数据集上均取得了显著优于现有方法的聚类性能。 展开更多
关键词 多视图聚类 卷积神经网络 transformER 特征融合
在线阅读 下载PDF
中国文学整体观与当下文学生态格局的重构
9
作者 王姝 《浙江社会科学》 北大核心 2025年第11期123-132,160,共11页
中国文学在现代转型之际重构了文学与“现实”之间的关系,从传统的“载道”“诗教”“实用”等大文学观念向窄化的“纯文学”观念转变,构造了现有的文学结构与秩序。它以“审美”的名义放逐了传统“经世致用”的实用性文学,以“启蒙”... 中国文学在现代转型之际重构了文学与“现实”之间的关系,从传统的“载道”“诗教”“实用”等大文学观念向窄化的“纯文学”观念转变,构造了现有的文学结构与秩序。它以“审美”的名义放逐了传统“经世致用”的实用性文学,以“启蒙”的名义鄙视着“娱乐游戏”的文学。由此,另一半实用而保守的文学作品如通俗文学、民间文学、旧体诗词、传统戏曲等或被摒弃在主流文学史之外,或在与主流文学史的交锋中不断挣扎以求一席之地。各类文学、各体文学之间更缺乏彼此的沟通和整体观照的学术视野。在延续至今的文学创作及其评价系统中,左翼传统、群众文艺、改革小说等与“现实”联系更为密切的创作均在不同程度上被低估,文体多样化、文类多元化受到局限。随着网络文学的崛起,文学生产体制发生变革,素人写作、打工文学等现象的涌现,作者、读者群体的扩容,文学的跨媒介扩张,在重构文学外部生态的同时,亦通过文学与“现实”的重新深度融合,重构着文学内部的等级秩序与价值体系。 展开更多
关键词 文学整体观 诗教传统 生态变迁
在线阅读 下载PDF
面向子空间聚类的多视图统一表示学习网络 被引量:2
10
作者 林毓秀 刘慧 +1 位作者 于晓 张彩明 《计算机研究与发展》 北大核心 2025年第5期1248-1261,共14页
多视图子空间聚类旨在挖掘多视图的丰富信息来指导高维数据聚类,其研究关键在于如何有效地学习多视图统一表示和子空间表示.近年来,深度聚类方法利用神经网络强大的表征能力取得了优异的性能.然而,多视图数据固有的多源异构性使得大多... 多视图子空间聚类旨在挖掘多视图的丰富信息来指导高维数据聚类,其研究关键在于如何有效地学习多视图统一表示和子空间表示.近年来,深度聚类方法利用神经网络强大的表征能力取得了优异的性能.然而,多视图数据固有的多源异构性使得大多数现有方法以单模态编码器实现对各个视图的独立编码,不仅增加了模型参数量,同时限制了模型的泛化能力.另一方面,低秩子空间表示被证明能够提升聚类性能,传统的核范数正则化优化没有考虑不同奇异值隐含的信息量差异,是矩阵秩的一个有偏估计.为此,提出了一种面向子空间聚类的多视图统一表示学习网络.首先,基于Transformer构建编码器,通过共享参数将异构视图以相同的映射规则投影到低维特征空间.其次,针对每个样本在不同视图中可能具有不同的表现,采用视图内样本加权融合的方法学习多视图统一表示.最后,引入加权Schatten-p范数对子空间表示矩阵施加低秩约束.在7个多视图数据集上的广泛实验验证了所提方法的有效性和优越性. 展开更多
关键词 多视图子空间聚类 transformer 加权融合 低秩表示 加权Schatten-p范数
在线阅读 下载PDF
人工智能时代知识观的变革与课程教学创新 被引量:2
11
作者 郝和平 桑新民 《课程·教材·教法》 北大核心 2025年第7期19-27,共9页
生成式人工智能的爆发性突破引发了知识观、价值观、教育观的深刻变革。借鉴美国课程再设计中心(CCR)的知识与能力结构创新框架,整合哈佛大学“为理解而教”(TfU)项目,探索AI时代基础教育课程教学超越工业文明“三中心”模式的创新之路... 生成式人工智能的爆发性突破引发了知识观、价值观、教育观的深刻变革。借鉴美国课程再设计中心(CCR)的知识与能力结构创新框架,整合哈佛大学“为理解而教”(TfU)项目,探索AI时代基础教育课程教学超越工业文明“三中心”模式的创新之路。以人工智能课程创新为突破口,在与中小学各学科课程的整合中,共创共享高质量、多种类型的智能体和智能化教学资源库,尤其是人机共创的优秀课程案例库,推动中小学课程教学数字化转型、智能化创新和人文化建设,培养师生在复杂的网络环境中辨真伪、明善恶、识美丑的能力,有效防范AI风险,开创中小学课程教学新生态。 展开更多
关键词 人工智能 知识观变革 课程再设计 教育智能体 为理解而教
在线阅读 下载PDF
基于视角统一的手姿态估计优化方法
12
作者 曹忠锐 谢文军 +3 位作者 王冬 钮立超 王婷玉 刘晓平 《计算机应用研究》 北大核心 2025年第1期293-299,共7页
从深度图像中准确估计手的三维姿态是计算机视觉领域的重要任务。然而,由于手的自遮挡和关节自相似性,使得手姿态估计任务极具挑战性。为了克服这些困难,考察了深度图像采样视角对于估计精度的影响,提出了一种基于视角统一(UVP)的网络... 从深度图像中准确估计手的三维姿态是计算机视觉领域的重要任务。然而,由于手的自遮挡和关节自相似性,使得手姿态估计任务极具挑战性。为了克服这些困难,考察了深度图像采样视角对于估计精度的影响,提出了一种基于视角统一(UVP)的网络。该网络旨在将输入的深度图像重采样为更易于估计的“正面”视角,而后通过原始视角下的特征提高关节估计精度。首先,提出了视角转换模块,实现对输入的单张深度图像的视角旋转,提供作为补充的第二视角;然后,提出了视角统一损失函数,确保转换后的第二视角为“正面”视角,最大程度规避自遮挡问题;最后,通过改变卷积组合结构、降低网络深度等网络轻量化手段,进一步优化方法的性能。通过在三个公开的手姿态数据集(包括ICVL、NYU和MSRA)上进行实验,所提方法分别取得了4.92 mm、7.43 mm和7.02 mm的平均关节位置误差,且在搭载RTX3070的计算机上能以159.39 frame/s的速度运行。可见,转换深度图的采样视角,并融合双视角下的特征有利于提高手部姿态估计的精度。同时,所提方法具备自适应性,并表现出优秀的泛化能力,可以推广到大多数基于单深度图像的手部姿态估计模型,为深度学习在三维手姿态估计中的应用提供了有力支持。 展开更多
关键词 手部姿态估计 手关节自遮挡 视角统一 深度图像 点云变换
在线阅读 下载PDF
基于多视角信息的行人检测算法
13
作者 刘皓宇 孔鹏伟 +1 位作者 王耀力 常青 《计算机应用》 北大核心 2025年第7期2325-2332,共8页
针对现有的多视角行人检测算法中因目标遮挡严重以及未关注多视角之间关系而导致的错检和漏检等问题,提出一种基于MVDeTr(MultiView Detection with shadow Transformer)算法改进的多视角行人检测算法。首先,在特征提取阶段,设计一个视... 针对现有的多视角行人检测算法中因目标遮挡严重以及未关注多视角之间关系而导致的错检和漏检等问题,提出一种基于MVDeTr(MultiView Detection with shadow Transformer)算法改进的多视角行人检测算法。首先,在特征提取阶段,设计一个视角特征增强模块VEM(View Enhancement Module),通过关注不同视角之间的关系实现对重要视角的增强;其次,在将多视角信息引入单视角的过程中,加入高效多尺度注意力(EMA)模块建立短距离和长距离依赖关系,从而提升检测效果;最后,在原始基线算法Shadow Transformer模块的基础上,设计一种新的多视角信息处理模块EST(Efficient Shadow Transformer),在保持检测效果的基础上减少多视角中冗余信息的使用。实验结果表明,在Wildtrack数据集上与原始MVDeTr算法相比,所提算法的主要检测指标MODA(Multiple Object Detection Accuracy)提升了1.8个百分点,检测指标MODP(Multiple Object Detection Precision)提升了0.6个百分点,召回率提升了1.8个百分点。可见,所提算法能很好地应用于多视角行人检测任务。 展开更多
关键词 多视角 行人检测 MVDeTr 注意力机制 特征增强
在线阅读 下载PDF
基于BoT-YOLOX的毫米波图像目标检测
14
作者 李刚 叶学义 +2 位作者 蒋甜甜 李文杰 应娜 《计算机辅助设计与图形学学报》 北大核心 2025年第3期484-494,共11页
主动毫米波(active millimeter wave,AMMW)图像具有噪声多、易含伪影、小目标多等特点,一直是隐匿目标检测的挑战.为此,提出了一种基于BoT-YOLOX的毫米波图像目标检测方法.首先,在模型主干网络中引入瓶颈型Transformer(bottleneck Trans... 主动毫米波(active millimeter wave,AMMW)图像具有噪声多、易含伪影、小目标多等特点,一直是隐匿目标检测的挑战.为此,提出了一种基于BoT-YOLOX的毫米波图像目标检测方法.首先,在模型主干网络中引入瓶颈型Transformer(bottleneck Transformer,BoT),加强模型的特征提取能力;然后,调整多尺度目标检测层,并集成全局注意力机制来提高对小目标的检测能力;最后,提出一种多视角加权框融合的后处理方法,用于集成不同视角检测结果,以提高模型的鲁棒性.在自行采集的包括54000幅图像的AMMW数据集上,与基准模型(YOLOX)相比,该模型达到了93.22%的检出率和4.46%的误检率,AP提升了6.74个百分点;在公开AMMW数据集上,与主流方法相比,mAP提升了4.07个百分点.实验结果表明,所提方法对AMMW图像场景的目标,小目标检测准确度更加出色. 展开更多
关键词 主动毫米波图像 瓶颈型transformer 小目标检测 多视角加权框融合
在线阅读 下载PDF
TS-SEA:用于时间序列分类的时域-频域-季节性联合对比学习
15
作者 李坤 谭珺 +1 位作者 桂宁 朱赵炜 《现代电子技术》 北大核心 2025年第16期38-44,共7页
时间序列分类(TSC)是将时序数据按其动态模式划分到预定类别的任务。现实世界的时间序列通常包含趋势项、季节性分量、异常值及噪声的复杂耦合,其精准分解对分类性能提升至关重要。因此,提出一种时间序列分类方法 TSSEA,其通过FFT和STL... 时间序列分类(TSC)是将时序数据按其动态模式划分到预定类别的任务。现实世界的时间序列通常包含趋势项、季节性分量、异常值及噪声的复杂耦合,其精准分解对分类性能提升至关重要。因此,提出一种时间序列分类方法 TSSEA,其通过FFT和STL将时间序列分解为3个视图:时间、频率和季节。基于这些视图,通过编码器间的对比学习实现迭代学习。对3个现实世界的数据集进行大量实验,结果表明,所提出的TS-SEA方法在处理多样化的时间序列应用时,相较现有方法表现出最佳的性能。 展开更多
关键词 TS-SEA 时间序列分类 多视图联合学习 对比学习 傅里叶变换 时间序列分解
在线阅读 下载PDF
融合时空查询的情景感知多模态车辆轨迹预测模型
16
作者 李庆 乔少杰 +6 位作者 陈浩 李任杰 蒋宇河 李洲 刘晨旭 卓小军 韩楠 《无线电通信技术》 北大核心 2025年第3期454-465,共12页
随着自动驾驶技术的快速发展,准确预测周围车辆的运动轨迹成为确保行车安全的关键。现有的方法大多未充分考虑车辆与环境以及车与车之间的互动和环境情景信息,面对复杂交通场景下的轨迹预测性能不佳。基于此,提出一种融合时空查询Transf... 随着自动驾驶技术的快速发展,准确预测周围车辆的运动轨迹成为确保行车安全的关键。现有的方法大多未充分考虑车辆与环境以及车与车之间的互动和环境情景信息,面对复杂交通场景下的轨迹预测性能不佳。基于此,提出一种融合时空查询Transformer的情景感知多模态车辆轨迹预测模型(Contex-aware Multimodal Vehicle Trajectory Pediction Model Based on Spatio-Temporal Query Transformer,STQformer),高效地理解和预测复杂交通环境中的车辆行为。模型以Transformer框架为基础,引入可学习的时空查询并利用社交交互模块,实现对车辆意图的深度感知和更准确的轨迹预测。实验结果表明:与当前先进的轨迹预测算法相比,STQformer在长期预测方面的性能同比性能最佳对比模型提升了9%。该模型有助于提升自动驾驶系统的安全性和可靠性,推动自动驾驶技术的发展和应用,使其更好地适应复杂多变的交通环境,减少交通事故,提高交通效率。 展开更多
关键词 车辆轨迹预测 时空查询 transformER 多头注意力机制 深度学习
在线阅读 下载PDF
基于英语学习活动观的知识分层、素养转化与教学设计 被引量:1
17
作者 姜男男 李广 《天津师范大学学报(基础教育版)》 北大核心 2025年第5期29-34,共6页
英语学习活动观的践行需要探寻其知识基础。依据知识的抽象程度,英语学科知识结构可分为指向价值性知识、方法性知识以及事实性或概念性知识三个层次。研究认为,英语学习活动中的迁移创新活动指向多层次知识的联结,实践应用活动指向方... 英语学习活动观的践行需要探寻其知识基础。依据知识的抽象程度,英语学科知识结构可分为指向价值性知识、方法性知识以及事实性或概念性知识三个层次。研究认为,英语学习活动中的迁移创新活动指向多层次知识的联结,实践应用活动指向方法性知识的形成,学习理解活动指向事实性或概念性知识的整合。在英语学科知识向素养转化的过程中,问题、语境与意义是核心要素,提取、巩固与运用是进阶过程,倒转、融合与表达是实现路径。基于学习活动观的英语学科教学设计应通过解读知识内隐的脉络谱系,重构学习内容;分析知识蕴含的素养要素,确定学习目标;围绕知识承载的多维目标,设计学习活动。 展开更多
关键词 学习活动观 知识立体分层 素养转化 初中英语教学设计
在线阅读 下载PDF
基于中心点注意力的多视角多人三维人体姿态估计 被引量:1
18
作者 江以恒 李洋 +1 位作者 刘春颜 赵蕴龙 《计算机科学》 北大核心 2025年第3期68-76,共9页
多视角多人三维人体姿态估计被广泛应用于各类计算机视觉任务中。当前基于空间体素的方法由于需要消耗巨大的资源难以实现在边缘计算设备上的实时性运算;而回归方法因缺乏几何约束导致泛化能力有限,在新的环境中无法直接应用而需要采集... 多视角多人三维人体姿态估计被广泛应用于各类计算机视觉任务中。当前基于空间体素的方法由于需要消耗巨大的资源难以实现在边缘计算设备上的实时性运算;而回归方法因缺乏几何约束导致泛化能力有限,在新的环境中无法直接应用而需要采集数据进行微调。通过结合空间体素方法与基于回归的姿态估计方法并融合二者的特点,提出了基于中心点注意力回归的多视角多人三维人体姿态估计模型。该模型通过一个小规模的体素网络粗略估计人体中心点位置,并以此构建初始姿态,随后在人体中心点的范围内进行回归预测得到更精确的人体姿态。本研究通过结合空间关键点位置,使得模型的回归预测更加准确,在大尺度上平均准确率提升1.16%,同时使得模型非常容易训练,在小样本微调中准确率最多提升了12%。这使得基于回归的模型可以在新的场景下通过小数据量的训练快速部署而实现泛化性能和通用性的大幅提升。 展开更多
关键词 三维人体姿态估计 多视角 中心点预测网络 中心点注意力 transformER 体素网络
在线阅读 下载PDF
基于类别共享与独有信息双向融合的多类别姿态估计
19
作者 陈俊杰 陈卫龙 +2 位作者 方玉明 姜文晖 牛力 《计算机学报》 北大核心 2025年第8期1795-1811,共17页
姿态估计旨在定位物体各关键点的位置,是一项基本的计算机视觉任务,具有广泛的应用场景。现有方法聚焦于估计单一类别物体的姿态(如人体),无法较好地用单个模型为多个类别的物体估计姿态。鉴于分类、检测、分割等模型都可为多类别预测结... 姿态估计旨在定位物体各关键点的位置,是一项基本的计算机视觉任务,具有广泛的应用场景。现有方法聚焦于估计单一类别物体的姿态(如人体),无法较好地用单个模型为多个类别的物体估计姿态。鉴于分类、检测、分割等模型都可为多类别预测结果,从单类别拓宽到多类别是姿态估计领域的必然发展趋势。因此,本文研究多类别姿态估计,其关键问题在于如何融合类别之间的共享信息与独有信息,使得单个模型可较好地兼容多个类别的信息。为此,本文提出基于共享与独有信息双向融合的Transformer模型,其中依据匹配关系对两种信息进行自适应融合。具体地,本模型使用可学习的查询向量来表征各类关键点的共享和独有信息,并用初始和精化两个阶段来逐步估计关键点位置。在初始阶段中,共享查询向量通过Transformer解码器来聚合图像骨干特征图中的共享信息,并预测得到关键点的初始位置和物体的类别。在精化阶段中,本模型依据共享查询向量与该类别关键点的匹配关系,将查询向量与该类别的独有查询向量进行前向融合,并将初始位置精化为准确位置。并且,本模型将更新后的独有查询向量储存到队列中,并依据匹配关系将其反向融合到共享查询向量中,可更有效地提炼共享信息。本文在多类别姿态数据集MP-100上进行了大量实验,其中的定量和定性分析都充分证明了本方法的有效性。 展开更多
关键词 姿态估计 多类别 基于查询的模型 信息解耦 多头注意力模型
在线阅读 下载PDF
基于伪影提示的稀疏角度CT金属伪影校正方法
20
作者 石保顺 舒元飞 +1 位作者 姜轲 苏月明 《自动化学报》 北大核心 2025年第8期1800-1810,共11页
联合稀疏角度CT重建和金属伪影校正任务旨在通过受金属迹污染的少视角投影数据重建高质量的CT图像.现有稀疏角度CT重建方法和金属伪影校正方法通常依赖于CT图像或投影数据,但其存在临床投影数据难以获取和校正精度差的问题.为解决这些问... 联合稀疏角度CT重建和金属伪影校正任务旨在通过受金属迹污染的少视角投影数据重建高质量的CT图像.现有稀疏角度CT重建方法和金属伪影校正方法通常依赖于CT图像或投影数据,但其存在临床投影数据难以获取和校正精度差的问题.为解决这些问题,提出一种基于伪影提示Transformer的图像域方法,仅利用受伪影影响的CT图像即可同时实现稀疏角度CT重建和金属伪影校正.该方法将伪影区域作为提示,并将提示特征融入Transformer提取的特征中,提出伪影提示Transformer架构.该架构能够通过伪影区域特征提示,利用伪影区域和非伪影区域之间的全局上下文相关性提升伪影校正精度.针对多种伪影校正问题,在包含伪影的CT图像上构建伪影区域估计网络来估计伪影区域,并设计由局部信息提取模块、伪影区域注意力模块和通道注意力融合模块构成的局部−全局信息交互网络来融合局部与全局信息.实验结果表明,该方法能够同时进行高精度CT重建并有效去除金属伪影. 展开更多
关键词 稀疏角度CT 重建 金属伪影校正 提示学习 transformER
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部