期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
复杂场景下跨层多尺度特征融合的安全帽佩戴检测算法
1
作者 陈亮 王璇 雷坤 《计算机应用》 北大核心 2025年第7期2333-2341,共9页
为了解决施工场景下安全帽佩戴检测时,由于人员密集、遮挡和复杂背景等原因造成的小目标漏检和错检的问题,提出一种基于YOLOv8n的双重注意力机制的跨层多尺度安全帽佩戴检测算法。首先,设计微小目标检测头,以提高模型对小目标的检测能力... 为了解决施工场景下安全帽佩戴检测时,由于人员密集、遮挡和复杂背景等原因造成的小目标漏检和错检的问题,提出一种基于YOLOv8n的双重注意力机制的跨层多尺度安全帽佩戴检测算法。首先,设计微小目标检测头,以提高模型对小目标的检测能力;其次,在特征提取网络中嵌入双重注意力机制,从而更加关注复杂场景下目标信息的特征捕获;然后,将特征融合网络替换成重参数化泛化特征金字塔网络(RepGFPN)改进后的跨层多尺度特征融合结构S-GFPN(Selective layer Generalized Feature Pyramid Network),以实现小目标特征层信息和其他特征层的多尺度融合,并建立长期的依赖关系,从而抑制背景信息的干扰;最后,采用MPDIOU(Intersection Over Union with Minimum Point Distance)损失函数来解决尺度变化不敏感的问题。在公开数据集GDUT-HWD上的实验结果表明,改进后的模型比YOLOv8n的mAP@0.5提升了3.4个百分点,对蓝色、黄色、白色和红色安全帽的检测精度分别提升了2.0、1.1、4.6和9.1个百分点,在密集、遮挡、小目标、反光和黑暗这5类复杂场景下的可视化检测效果也优于YOLOv8n,为实际施工场景中安全帽佩戴检测提供了一种有效方法。 展开更多
关键词 复杂场景 目标检测 小目标 多尺度特征融合 YOLOv8
在线阅读 下载PDF
尺度因子感知对比学习的无参考型超分辨图像质量评价
2
作者 樊丹丹 张凯兵 +1 位作者 权星 孟雅蕾 《西北大学学报(自然科学版)》 北大核心 2025年第2期309-319,共11页
超分辨图像的质量不仅受重建算法的影响,而且在不同的尺度因子下重建出的图像在质量退化等级方面存在一定差异。然而现有的无参考型超分辨图像质量评价方法主要关注超分辨率图像的视觉特征,忽略了可用的尺度因子信息。提出了一种尺度因... 超分辨图像的质量不仅受重建算法的影响,而且在不同的尺度因子下重建出的图像在质量退化等级方面存在一定差异。然而现有的无参考型超分辨图像质量评价方法主要关注超分辨率图像的视觉特征,忽略了可用的尺度因子信息。提出了一种尺度因子感知对比学习(upscaling-factor aware contrastive learning,UFACL)方法,该网络结构分为尺度因子识别分支和质量分数分支。其中尺度因子识别分支从数据集本身出发,将不同尺度因子的超分辨图像作为彼此的正负样本,在完成分类任务的同时引入对比学习,提高有效特征的表达能力。在质量分数分支设计了一个频域注意模块(frequency domain attention module,FDAM),考虑了全局信息和通道信息,同时,该分支使用倒残差块(inverted residuals blocks,IRB)降低模型的计算量,使得在训练过程中既保证了质量分数预测精度又提升了模型训练效率。实验结果表明,提出的UFACL能够获得与主观感知质量更好的一致性。 展开更多
关键词 超分辨图像质量评价 尺度因子 对比学习 频域注意模块 倒残差块
在线阅读 下载PDF
融合音频内容、风格和情感特征的人脸动画生成方法
3
作者 张欣茹 朱欣娟 高全力 《计算机应用研究》 北大核心 2025年第2期636-640,共5页
现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取... 现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取隐含的情感辅助特征来估计更加准确的面部情感标志位移,然后与语音内容和说话者风格动画的面部地标位移进行融合,提高landmarks(面部地标)预测的准确性和生动性。其次,设计了一个基于U-Net模型的注意力增强解码器(AADU),使得估计的地标与图像最终解码为逼真的包含唇音同步、头部运动和面部表情的理想视频帧。实验表明,该方法既能增强面部情感表达,又可使图像更加清晰,效果优于对比基线模型。 展开更多
关键词 音频驱动 人脸动画 情感动画模块 注意力增强解码器
在线阅读 下载PDF
基于多任务学习的意图检测和槽位填充联合方法
4
作者 尚爱国 朱欣娟 《计算机应用》 CSCD 北大核心 2024年第3期690-695,共6页
随着预训练语言模型在自然语言处理(NLP)任务上的应用,意图检测(ID)和槽位填充(SF)联合建模提高了口语理解的性能。现有方法大多关注意图和槽位的相互作用,忽略了差异文本序列建模对口语理解(SLU)任务的影响。因此,提出一种基于多任务... 随着预训练语言模型在自然语言处理(NLP)任务上的应用,意图检测(ID)和槽位填充(SF)联合建模提高了口语理解的性能。现有方法大多关注意图和槽位的相互作用,忽略了差异文本序列建模对口语理解(SLU)任务的影响。因此,提出一种基于多任务学习的意图检测和槽位填充联合方法(IDSFML)。首先,使用随机掩盖mask策略构造差异文本,设计结合自编码器和注意力机制的神经网络(AEA)结构,为口语理解任务融入差异文本序列的特征;其次,设计相似性分布任务,使差异文本和原始文本的表征相似;最后,联合训练ID、SF和差异文本序列相似性分布三个任务。在航班旅行信息系统(ATIS)和SNIPS数据集上的实验结果表明,IDSFML与表现次优的基线方法SASGBC(Self-Attention and Slot-Gated on top of BERT with CRF)相比,槽位填充F1值分别提升了1.9和1.6个百分点,意图检测准确率分别提升了0.2和0.4个百分点,提高了口语理解任务的准确率。 展开更多
关键词 意图检测 槽位填充 多任务学习 口语理解 注意力机制
在线阅读 下载PDF
基于双通道的多维域水声目标识别
5
作者 张晨颖 杨琼 刘枫 《舰船科学技术》 北大核心 2024年第20期142-147,共6页
在海洋遥感领域,水声目标分类识别一直是声呐系统的一项困难而又极其重要的任务,为了进一步提高在不同信噪比下水下声目标的识别准确率,本文提出一种使用多维域融合特征分别输入双通道模型的水声目标识别方法。首先,通过梅尔频率倒谱系... 在海洋遥感领域,水声目标分类识别一直是声呐系统的一项困难而又极其重要的任务,为了进一步提高在不同信噪比下水下声目标的识别准确率,本文提出一种使用多维域融合特征分别输入双通道模型的水声目标识别方法。首先,通过梅尔频率倒谱系数(MFCC)和短时傅里叶变换(STFT)提取声信号在频域和时频上的特征进行融合;其次,构建密集卷积神经网络(DenseCNN)和长短期记忆网络(LSTM)2个通道,DenseCNN通道架构采用跳跃连接重用所有以前的特征映射,以优化各种受损条件下的分类率,并采用SE注意力机制使得动态调整特征权重。LSTM通道捕捉时间相关性,对模型进行长依赖关系处理能力的补充。实验结果表明,该方法在–20~10 dB信噪比下的分类准确率优于其他先进的神经网络模型。 展开更多
关键词 水声目标识别 多维时频特征 双通道学习模块
在线阅读 下载PDF
基于多属性的动态采样协同过滤推荐算法 被引量:7
6
作者 李维乾 张艺 +2 位作者 郑振峰 王海 张紫云 《计算机应用研究》 CSCD 北大核心 2020年第9期2640-2644,2683,共6页
针对目前协同过滤推荐算法推荐精度和用户数据在算法中匹配度都不高的问题,提出一种多属性的条件受限波尔兹曼机协同过滤推荐模型(MA-CRBM)。该模型基于实值状态的条件玻尔兹曼机,融合了用户职业和性别属性,充分利用数据集中潜在的评分... 针对目前协同过滤推荐算法推荐精度和用户数据在算法中匹配度都不高的问题,提出一种多属性的条件受限波尔兹曼机协同过滤推荐模型(MA-CRBM)。该模型基于实值状态的条件玻尔兹曼机,融合了用户职业和性别属性,充分利用数据集中潜在的评分与未评分信息。在训练过程中,采用动态迭代采样算法对原采样算法进行了改进,克服了训练后期数据采样误差波动太大导致精确度不高的问题。在MovieLens数据集上的实验结果表明,MA-CRBM模型具有较好的推荐效果,可以有效提升推荐模型的精度和效率。 展开更多
关键词 协同过滤推荐算法 条件受限性玻尔兹曼机 多属性条件推荐 动态迭代采样算法
在线阅读 下载PDF
状态与杂波相关的GM-PHD平滑滤波 被引量:2
7
作者 陈金广 王星辉 马丽丽 《计算机工程与设计》 北大核心 2019年第11期3186-3191,共6页
考虑到多目标跟踪中杂波与状态之间的相关性,引入平滑算法提高目标估计的精度。针对整个监视区域内的杂波,重新计算其强度;将目标分为幸存目标和新生目标两大类,采用自适应椭球门限对量测进行预处理,将门限内的量测用于更新幸存目标,门... 考虑到多目标跟踪中杂波与状态之间的相关性,引入平滑算法提高目标估计的精度。针对整个监视区域内的杂波,重新计算其强度;将目标分为幸存目标和新生目标两大类,采用自适应椭球门限对量测进行预处理,将门限内的量测用于更新幸存目标,门限外的量测用于更新新生目标;采用RTS平滑算法进行逆向平滑。实验结果表明,在该条件下所提算法具有较好的跟踪性能,优于未平滑的GM-PHD滤波器。 展开更多
关键词 多目标跟踪 RTS平滑 概率假设密度滤波 状态相关杂波 自适应椭球门限
在线阅读 下载PDF
基于自然语言生成的协同制造企业图表数据分析方法 被引量:2
8
作者 陈亮 赵康廷 刘昌宏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第3期910-919,共10页
为充分利用协同制造企业在生产过程中的非结构化图表数据,提出一种基于自然语言生成的图表数据分析方法。首先使用光学字符识别技术和关键点检测网络对图表中的文本信息和数据信息进行识别和提取;随后将用户需求作为输入,通过自然语言... 为充分利用协同制造企业在生产过程中的非结构化图表数据,提出一种基于自然语言生成的图表数据分析方法。首先使用光学字符识别技术和关键点检测网络对图表中的文本信息和数据信息进行识别和提取;随后将用户需求作为输入,通过自然语言生成模型输出相应的图表文本描述,使其可以根据用户不同的意图,生成智能和准确的图表分析结果。该方法图表提取的精度为88.6%,文本描述的评估得分为86.4%。通过在企业的应用案例和相关调研也表明该方法能够根据用户需求对不同类型的图表进行准确的分析。 展开更多
关键词 数据分析 深度学习 图表数据 自然语言生成
在线阅读 下载PDF
基于无匹配差错的PSI计算 被引量:5
9
作者 巩林明 王道顺 +3 位作者 刘沫萌 高全力 邵连合 王明明 《计算机学报》 EI CSCD 北大核心 2020年第9期1769-1790,共22页
分布式计算有很多应用需要参与各方协同执行集合的一些计算但不泄露各自数据集的信息.保密集合交集(private set intersection,PSI)计算已经成为数据匹配、数据挖掘、推荐系统等应用中保护用户隐私的一个重要工具.本文的主要工作是构造... 分布式计算有很多应用需要参与各方协同执行集合的一些计算但不泄露各自数据集的信息.保密集合交集(private set intersection,PSI)计算已经成为数据匹配、数据挖掘、推荐系统等应用中保护用户隐私的一个重要工具.本文的主要工作是构造无匹配差错的安全两方保密集合交集运算协议.着重探讨三个问题:(1)开发构造无匹配差错的两方保密集合交集计算所需要的工具(①面向有理数且具有语义安全性的加密方案,②便于集合匹配计算的称之为集合的定长向量编码方法);(2)无匹配差错的两方保密集合交集计算问题;(3)元素为有理数的保密集合交集计算问题.首先在标准模型下设计了一个能够加密有理数的方案,并证明了该方案能抗自适应性地选择明文攻击;而后又提出了一种便于集合匹配计算的,称之为集合的定长向量编码方法;最后基于有理数加密方案和集合的定长向量编码方法构造了两个面向有理数的、无匹配差错的两方保密集合交集协议.与先前的两方保密集合交集协议相较之,这两个协议不仅解决了无匹配差错的两方保密集合交集计算,还拓展了保密集合交集问题中隐私保护的范畴:除了可以保护各参与方的隐私数据外,还可以保护各参与方隐私数据的数量. 展开更多
关键词 保密集合交集 有理数加密 语义安全 安全两方计算 集合的定长向量编码
在线阅读 下载PDF
面向3D虚拟展示的软件定制化系统研究 被引量:2
10
作者 郝亚玲 朱欣娟 吴晓军 《计算机工程与应用》 CSCD 北大核心 2021年第5期271-278,共8页
针对传统三维虚拟展示软件中存在的编程过程复杂、开发周期长等缺陷,提出一个具有可定制性和扩展性面向虚拟展示的定制方法。该方法基于虚拟现实技术和软件大规模定制技术,设计面向虚拟展示的定制化系统架构;基于软件功能树对系统功能解... 针对传统三维虚拟展示软件中存在的编程过程复杂、开发周期长等缺陷,提出一个具有可定制性和扩展性面向虚拟展示的定制方法。该方法基于虚拟现实技术和软件大规模定制技术,设计面向虚拟展示的定制化系统架构;基于软件功能树对系统功能解耦,抽取可复用的公共模块实现参数定制化,封装为功能接口供系统调用;同时定义了系统的定制模板,以描述和配置应用系统的基本信息和个性化定制,从而满足不同企业产品虚拟展示功能定制需求。最后通过具体实例展示验证了该系统的有效性和实用性。 展开更多
关键词 虚拟现实 软件定制 定制模板 构件
在线阅读 下载PDF
增强现实环境快速重建系统研究 被引量:1
11
作者 彭睿男 万韬阮 巩林明 《计算机工程与应用》 CSCD 北大核心 2023年第15期290-299,共10页
针对现有增强现实技术在进行环境重建时存在环境重建时间长、设备门槛高、户外环境重建定位困难等问题,设计并实现了AR环境快速重建系统。以谷歌ARCore作为开发基础,调用环境信息估算工具获取三维模型空间坐标和环境深度信息;设计一种... 针对现有增强现实技术在进行环境重建时存在环境重建时间长、设备门槛高、户外环境重建定位困难等问题,设计并实现了AR环境快速重建系统。以谷歌ARCore作为开发基础,调用环境信息估算工具获取三维模型空间坐标和环境深度信息;设计一种新的多重目标跟踪匹配算法,以解析目标特征,并与三维模型生成对应关系;加入北斗全球卫星信号(global navigation satellite system,GNSS)接收机对原有的定位模块进行改进,采用参数转换法对高精度坐标进行本地化处理;使用分割位姿匹配法校正环境中的三维模型重建位姿。实验结果证明,该改进系统适用范围广,拥有脱离摄像头后AR环境不丢失位置等特点,增强了AR环境重建中用户的方位感知能力,降低了AR环境中不同三维模型和目标特征的匹配处理难度。 展开更多
关键词 增强现实 谷歌ARCore 多重目标跟踪匹配 北斗全球卫星 参数转换法 分割位姿匹配
在线阅读 下载PDF
采用分段RTS的CPHD平滑算法 被引量:1
12
作者 陈金广 王星辉 +2 位作者 马丽丽 张馨东 巩林明 《计算机工程与应用》 CSCD 北大核心 2019年第1期50-55,95,共7页
针对多目标跟踪中的固定间隔平滑问题,将势概率假设密度(CPHD)滤波器和RTS平滑器相结合,提出了RTS的势概率假设密度滤波平滑算法。考虑到在平滑过程中存在较大的输出延迟问题,采用分段思想,提出了分段RTS的势概率假设密度滤波平滑算法... 针对多目标跟踪中的固定间隔平滑问题,将势概率假设密度(CPHD)滤波器和RTS平滑器相结合,提出了RTS的势概率假设密度滤波平滑算法。考虑到在平滑过程中存在较大的输出延迟问题,采用分段思想,提出了分段RTS的势概率假设密度滤波平滑算法。对需要平滑的估计值进行分段;采用匈牙利算法进行航迹-估计关联;对关联后的估计值逐段进行RTS平滑。实验结果表明,与CPHD滤波结果相比,分段RTS的势概率假设密度滤波平滑算法能够更加精确地估计目标状态,并且可以有效避免直接应用RTS平滑造成的实时性欠佳问题。 展开更多
关键词 目标跟踪 RTS平滑 势概率假设密度滤波 航迹-估计关联 信息融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部