期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于图注意力网络的视觉常识推理方法
1
作者 张文琪 高永超 +1 位作者 钱恒 吕红丽 《计算机应用与软件》 北大核心 2025年第10期191-197,238,共8页
视觉常识推理(Visual Commonsense Reasoning,VCR)是近年来提出的一项具有挑战性的多模态任务。为了深入理解图像中的语义关系,提高VCR任务的性能,提出一种基于图注意力网络的视觉常识推理方法,针对多种类型的图像,将图像中的视觉对象... 视觉常识推理(Visual Commonsense Reasoning,VCR)是近年来提出的一项具有挑战性的多模态任务。为了深入理解图像中的语义关系,提高VCR任务的性能,提出一种基于图注意力网络的视觉常识推理方法,针对多种类型的图像,将图像中的视觉对象编码为视觉节点,使用图注意力网络对视觉节点和其相邻节点的特征进行建模,得到视觉对象间的内部关联。该方法有效地捕获视觉对象间的动态交互,提高了图像的语义理解能力。在VCR数据集上进行实验表明,该方法在VCR三个子任务上的性能均有提升,证明了该方法的有效性。 展开更多
关键词 视觉常识推理 多模态 图注意力网络 视觉关系
在线阅读 下载PDF
面向国产异构DCU平台的大规模并行矩量法研究 被引量:1
2
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
在线阅读 下载PDF
粒子滤波的智能机器人位置自标定算法 被引量:6
3
作者 于飞 姜燕 郑阶财 《机械设计与制造》 北大核心 2023年第8期219-223,共5页
为了提升智能机器人位置自标定的精准度、稳定性,降低用时,设计基于粒子滤波的智能机器人位置自标定算法。根据智能机器人相邻连杆位置关系,描述机器人正运动学,通过粒子初始化、位置更新、权值更新、重组的粒子滤波方法标定机器人的模... 为了提升智能机器人位置自标定的精准度、稳定性,降低用时,设计基于粒子滤波的智能机器人位置自标定算法。根据智能机器人相邻连杆位置关系,描述机器人正运动学,通过粒子初始化、位置更新、权值更新、重组的粒子滤波方法标定机器人的模糊位置。根据三球座设备在机器人外部架构世界坐标系,将末端工具坐标系转换到世界坐标系中,令正运动学的起始点从基座变为三球座设备,根据机器人与设备间装配关系建立世界坐标系与基坐标系的变换矩阵,推导出位置自标定的线性模型,完成智能机器人位置自标定。仿真结果表明,该算法的自标定精准度较高、稳定性较高,标定用时较短,修正效果好,能满足快速标定需求。 展开更多
关键词 智能机器人 正运动学 粒子滤波 位置自标定 坐标系
在线阅读 下载PDF
基于级联密集网络的轮廓波变换域图像复原 被引量:9
4
作者 刘宇男 张姗姗 +2 位作者 王春鹏 李广宇 杨健 《软件学报》 EI CSCD 北大核心 2020年第12期3968-3980,共13页
近年来,卷积神经网络凭借极强的学习能力,在图像复原任务上实现了比传统学习方法更令人满意的结果.但是,由于丢失了重要的纹理细节,这些基于卷积神经网络的方法普遍存在着复原图像过度平滑的缺点.为解决该问题,提出一种基于级联密集型... 近年来,卷积神经网络凭借极强的学习能力,在图像复原任务上实现了比传统学习方法更令人满意的结果.但是,由于丢失了重要的纹理细节,这些基于卷积神经网络的方法普遍存在着复原图像过度平滑的缺点.为解决该问题,提出一种基于级联密集型卷积神经网络的轮廓波域图像复原方法,可以应用于单幅图像去噪、超分辨率及JPEG解压缩这3个经典图像复原任务.首先,构建了一种紧凑的级联密集型网络结构,不但可以充分挖掘和利用不同层次的图像特征,而且解决了由于网络加深带来的长期依赖问题.接着,引入可以稀疏表示图像重要特征的轮廓波变换,分别将低质量图像和重建图像对应的轮廓波子带作为网络的输入和输出,更加有效地恢复出逼真的结构和纹理细节.在标准测试集的实验表明:提出的方法在3个图像复原任务上达到了当前最优的性能,不但获得了更高的峰值信噪比和结构相似度,而且在主观的重建图像中包含了更加真实的纹理细节. 展开更多
关键词 图像去噪 超分辨率 JPEG解压缩 轮廓波变换 级联密集型卷积神经网络
在线阅读 下载PDF
基于SVM的类别增量人体活动识别方法 被引量:4
5
作者 邢云冰 龙广玉 +1 位作者 胡春雨 忽丽莎 《计算机科学》 CSCD 北大核心 2022年第5期78-83,共6页
基于人体活动识别(Human Activity Recognition,HAR)的健康监护是发现健康异常的一种重要手段。然而,在日常活动识别中,很难提前获取包含所有可能活动类别的训练样本。当预测阶段出现新增类别时,传统的支持向量机(Support Vector Machin... 基于人体活动识别(Human Activity Recognition,HAR)的健康监护是发现健康异常的一种重要手段。然而,在日常活动识别中,很难提前获取包含所有可能活动类别的训练样本。当预测阶段出现新增类别时,传统的支持向量机(Support Vector Machine,SVM)会将其错误地分类为已知类别。一个鲁棒的分类器应该能够分辨出新增类别,以便后续区别于已知类别并对其进行处理。文中提出一种基于SVM的类别增量人体活动识别方法,引入超球面的思想,既能高精度地识别已知活动类别,又能检测出新增类别。通过训练得到的多个超球面将整个特征空间进行划分,使分类器具有对新增活动类别的检测能力。实验结果表明,与传统多分类SVM方法相比,该方法能够在不显著降低已知类别分类效果的前提下实现对新增类别的检测,从而提高分类器在开放环境下的人体活动识别能力。 展开更多
关键词 人体活动识别 支持向量机 超球面 聚类可分 类别增量
在线阅读 下载PDF
基于视觉变换网络的音乐流派自动分类 被引量:7
6
作者 董安明 刘宗银 +2 位作者 禹继国 韩玉冰 周酉 《计算机应用》 CSCD 北大核心 2022年第S01期54-58,共5页
随着网络音乐产业的快速发展,构筑音乐自动检索和分类系统的需求日益增加。利用计算机对音乐流派进行正确标注是实现音乐类型精准分类和保障音乐推荐系统性能的重要前提。针对卷积运算不具备提取全局表征的能力,深度卷积神经网络对音乐... 随着网络音乐产业的快速发展,构筑音乐自动检索和分类系统的需求日益增加。利用计算机对音乐流派进行正确标注是实现音乐类型精准分类和保障音乐推荐系统性能的重要前提。针对卷积运算不具备提取全局表征的能力,深度卷积神经网络对音乐流派数据的全局建模能力较弱的问题,提出了一种基于视觉变换(ViT)神经网络的音乐流派自动分类方法。该方法对待分类的音频进行预处理后,利用短时傅里叶变换(STFT)转化为尺寸统一的语谱图切片,实现音乐频域特征的转换。为了避免训练过拟合,通过增加白噪声对语谱图切片集进行数据增强。然后利用所生成的语谱切片集及其增强后的数据集对所构建的ViT神经网络进行训练,从而实现音乐流派风格的自动分类。仿真结果表明,所构建的ViT网络在音乐流派分类公共数据集GTZAN上的测试识别准确率达到91.01%,比基于AlexNet、AlexNet-enhanced和VGG16等传统卷积神经网络(CNN)的音乐流派分类方法提升了1.00~5.00个百分点。 展开更多
关键词 视觉变换网络 音乐流派 特征转换 语谱图 深度学习 数据增强
在线阅读 下载PDF
基于码分复用的音频文件大容量可逆信息隐藏算法 被引量:3
7
作者 马宾 侯金程 +2 位作者 王春鹏 李健 施云庆 《计算机科学》 CSCD 北大核心 2021年第9期298-305,共8页
针对音频文件可逆信息隐藏算法嵌入容量小、安全性不高的问题,文中提出了一种基于码分复用(Code Division Multiplexing,CDM)的音频文件大容量可逆信息隐藏(Reversible Data Hiding,RDH)算法。所提算法采用正交扩展序列将秘密信息可逆... 针对音频文件可逆信息隐藏算法嵌入容量小、安全性不高的问题,文中提出了一种基于码分复用(Code Division Multiplexing,CDM)的音频文件大容量可逆信息隐藏(Reversible Data Hiding,RDH)算法。所提算法采用正交扩展序列将秘密信息可逆地嵌入音频文件中,不但可以保障所嵌入信息的无损提取,而且能够完全恢复原始音频信号;同时,基于嵌入向量的正交特性,将机密信息叠加嵌入到原始载体图像中,在嵌入过程中,不同嵌入向量中的大部分元素相互抵消,使得所提算法在大容量信息嵌入的情况下可取得更高的音频保真能力。而且,接收方只有采用相同的嵌入向量才能实现嵌入信息的正确提取与原始音频信息的无损恢复,有效提升了算法的安全性能。实验结果表明,与其他音频可逆信息隐藏算法相比,基于码分复用(CDM)的音频文件可逆信息隐藏(RDH)算法在相同文件失真情况下具有更大的可逆信息嵌入容量。 展开更多
关键词 可逆信息隐藏(RDH) 音频文件 码分复用(CDM) 大容量
在线阅读 下载PDF
一种用于癌症分类的两阶段深度特征选择提取算法
8
作者 胡艳羽 赵龙 董祥军 《计算机科学》 CSCD 北大核心 2022年第7期73-78,共6页
癌症是世界上最致命的疾病之一。利用机器学习处理基因微阵列数据集(Microarray Data)对于协助癌症的早期诊断具有重要作用,但微阵列数据集中基因特征的数目远大于样本数目,造成样本不平衡,影响了分类的效率和精度,因此对基因阵列数据... 癌症是世界上最致命的疾病之一。利用机器学习处理基因微阵列数据集(Microarray Data)对于协助癌症的早期诊断具有重要作用,但微阵列数据集中基因特征的数目远大于样本数目,造成样本不平衡,影响了分类的效率和精度,因此对基因阵列数据进行特征选择就显得尤为重要。现有的特征选择算法多为单一条件的特征选择,很少考虑特征提取,且大多采用存在已久的神经网络,分类精度较低。因此,文中提出了一种两阶段深度特征选择(Two-Stage Deep Feature Selection,TSDFS)算法。第一阶段集成3种特征选择算法进行全面的特征选择,得到特征子集;第二阶段使用非监督神经网络获得特征子集的最佳表示,进而提高最终的分类精度。通过特征选择前后的分类效果和不同特征选择算法之间的对比来分析TSDFS的有效性,实验结果表明,TSDFS在减少特征数目的同时保持或者提高了分类的精度。 展开更多
关键词 微阵列数据 特征选择 深度学习 随机森林 变分自编码器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部