期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
融合细粒度特征编码的点云分类分割网络 被引量:1
1
作者 陶志勇 豆淼森 +1 位作者 李衡 林森 《数据采集与处理》 CSCD 北大核心 2024年第4期944-953,共10页
有效获取点云特征是分析和处理三维点云场景的关键。针对目前深度学习方法特征信息提取不充分,难以捕捉深层次语义信息的问题,提出了一种融合细粒度特征编码的网络来提高点云分类与分割任务的准确率。首先,特征提取模块包含2个子模块:... 有效获取点云特征是分析和处理三维点云场景的关键。针对目前深度学习方法特征信息提取不充分,难以捕捉深层次语义信息的问题,提出了一种融合细粒度特征编码的网络来提高点云分类与分割任务的准确率。首先,特征提取模块包含2个子模块:一个是扩张图卷积模块,相比图卷积能够提取更丰富的几何信息;另一个是细粒度特征编码模块,能够获取局部区域的细节特征。其次,通过可学习参数将二者动态融合,有效地学习每个点的上下文信息。最后,将提取的所有特征相加,通过通道亲和注意力模块来强调不同通道,协助特征图来避免可能的冗余。在ModelNet40及ScanObjectNN数据集上进行点云分类实验,总体分类精度分别为93.3%和80.0%。在ShapeNet Part数据集上进行点云部件分割实验,平均交并比为85.6%。实验结果表明,与目前主流方法相比,该网络具有较优的性能。 展开更多
关键词 深度学习 局部特征提取 点云分类 部件分割 细粒度特征
在线阅读 下载PDF
基于细粒度特征融合的部分多模态哈希 被引量:1
2
作者 殷崭祚 李博涵 +3 位作者 王萌 黄瑞龙 吴文隆 王昊奋 《软件学报》 EI CSCD 北大核心 2024年第3期1074-1089,共16页
多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但... 多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但是仍然存在着3个重要问题:(1)已有方法偏向于考虑所有样本都是模态完整的,然而在实际检索场景中,样本缺失部分模态的情况依然存在;(2)大多数方法都是基于浅层学习模型,这不可避免地限制了模型的学习能力,从而影响最终的检索效果;(3)针对模型学习能力弱的问题已提出了基于深度学习框架的方法,但是它们在提取各个模态的特征后直接采用了向量拼接等粗粒度特征融合方法,未能有效地捕获深层语义信息,从而弱化了哈希码的表示能力并影响最终的检索效果.针对以上问题,提出了PMH-F^(3)模型.该模型针对样本缺失部分模态的情况,实现了部分多模态哈希.同时,基于深层网络架构,利用Transformer编码器,以自注意力方式捕获深层语义信息,并实现细粒度的多模态特征融合.基于MIRFlickr和MSCOCO数据集进行了充分实验并取得了最优的检索效果.实验结果表明:所提出的PMH-F^(3)模型能够有效地实现部分多模态哈希,并可应用于大规模多模态数据检索. 展开更多
关键词 部分多模态哈希 多模态数据检索 细粒度特征融合
在线阅读 下载PDF
基于ViT的细粒度特征增强无监督行人重识别方法 被引量:1
3
作者 程思雨 陈莹 《电子测量与仪器学报》 CSCD 北大核心 2024年第9期24-35,共12页
行人重识别任务可以看做是细粒度视觉分类任务的一种。现有的无监督行人重识别方法通常只关注人体全局特征,不能获取准确的细粒度局部特征,进而影响模型的识别精度。为解决这一问题,提出了一种基于ViT的细粒度特征增强网络,该网络利用视... 行人重识别任务可以看做是细粒度视觉分类任务的一种。现有的无监督行人重识别方法通常只关注人体全局特征,不能获取准确的细粒度局部特征,进而影响模型的识别精度。为解决这一问题,提出了一种基于ViT的细粒度特征增强网络,该网络利用视觉-语言模型生成图像中人体局部区域的掩码,根据自注意力机制中可学习标记与图像块之间交互策略的不同,使类标记与引入的可学习变量局部标记分别学习全局与局部细粒度特征表示。此外,为进一步提升特征表示能力,设计了一个空间信息增强模块,该模块通过挖掘人体局部区域内代表性图像块之间的空间上下文关系来增强特征学习。最后,利用提取到的全局和局部细粒度特征,分别计算在线和离线相机感知对比损失,以增强模型在无监督环境下对于行人身份的鲁棒性。在Market-1501、MSMT17和PersonX数据集上的实验结果验证了所提方法的有效性,mAP/Rank-1分别达到了90.3%/95.9%、59.2%/83.5%、91.3%/96.1%。 展开更多
关键词 行人重识别 无监督 细粒度特征 vision transformer 自注意力
在线阅读 下载PDF
融合判别性与细粒度特征的抗遮挡红外目标跟踪算法 被引量:1
4
作者 吴捷 马小虎 《红外技术》 CSCD 北大核心 2022年第11期1139-1145,共7页
针对现有热红外目标跟踪算法难以处理相似物干扰和目标遮挡的问题,引入MMNet(Multi-task MatchingNetwork)算法中的多任务框架获取热红外目标特定的判别性特征和细粒度特征,并将这两种特征相互融合,用于在类间和类内识别热红外对象。此... 针对现有热红外目标跟踪算法难以处理相似物干扰和目标遮挡的问题,引入MMNet(Multi-task MatchingNetwork)算法中的多任务框架获取热红外目标特定的判别性特征和细粒度特征,并将这两种特征相互融合,用于在类间和类内识别热红外对象。此外,利用峰值旁瓣比动态设置模型更新参数以更高效地获取目标变化信息并对跟踪结果进行评估。对于不可靠跟踪结果利用卡尔曼滤波对目标位置进行预测。在LSOTB-TIR(Large-Scale Thermal Infrared Object Tracking Benchmark)红外数据集上的实验结果表明,提出的改进算法性能较好,相比MMNet跟踪精确度和成功率分别提高了5.7%和4.2%,且能有效应对遮挡、变形等挑战,可以应用于红外目标跟踪领域。 展开更多
关键词 热红外 判别性特征 细粒度特征 峰值旁瓣比 卡尔曼滤波
在线阅读 下载PDF
基于图像细粒度特征的深度伪造检测算法 被引量:3
5
作者 彭舒凡 蔡满春 +1 位作者 刘晓文 马瑞 《信息网络安全》 CSCD 北大核心 2022年第11期77-84,共8页
随着深度学习的发展,深度伪造生成模型解决了生成图像中存在明显伪影的问题,但深度伪造图像与真实图像之间的区别往往是细微且局部的。因此,文章构建了一个基于图像细粒度特征的检测模型FGDD。针对深度伪造检测任务中仅使用粗粒度特征... 随着深度学习的发展,深度伪造生成模型解决了生成图像中存在明显伪影的问题,但深度伪造图像与真实图像之间的区别往往是细微且局部的。因此,文章构建了一个基于图像细粒度特征的检测模型FGDD。针对深度伪造检测任务中仅使用粗粒度特征的不足,FGDD利用多分支模型充分学习样本图像的细粒度特征,通过引入通道注意力机制以及优化激活图掩膜定位策略提升面部敏感区域定位的精度。在激活图中,利用多级滑动窗口提取样本中的高区分度细微特征,通过AugMix数据增强策略提升模型对于细粒度特征的鲁棒性。实验结果表明,FGDD在多个数据集上的测试准确率优于主流算法,证明了基于图像细粒度特征的深度伪造检测算法的有效性。 展开更多
关键词 深度伪造 深度伪造检测 细粒度特征 数据增强
在线阅读 下载PDF
基于细粒度字词特征的中文作者识别模型
6
作者 赵宏 张陈鹏 +1 位作者 王奡隆 张扬 《兰州理工大学学报》 北大核心 2025年第3期99-106,共8页
现有作者识别模型大多针对英文建立,但由于中文与英文在语法和语言组成要素方面的差异,英文作者识别模型用于中文文本时会出现较大的偏差.为解决中文作者识别的问题,提出一种适配中文特点的模型,称为细粒度字词特征的中文作者识别模型.... 现有作者识别模型大多针对英文建立,但由于中文与英文在语法和语言组成要素方面的差异,英文作者识别模型用于中文文本时会出现较大的偏差.为解决中文作者识别的问题,提出一种适配中文特点的模型,称为细粒度字词特征的中文作者识别模型.该模型使用并行卷积提取1至4字词的细粒度特征,结合注意力机制进行权重分配,最后通过分类器实现中文作者识别.实验结果表明,该模型与BERT、文本卷积网络(TextCNN)、循环神经网络(RNN)等基线模型相比,在三个中文作者识别数据集上的准确率平均提高2.09%、7.2%和6.71%,具有较高的实用价值. 展开更多
关键词 中文作者识别 BERT 注意力机制 并行卷积层 细粒度特征
在线阅读 下载PDF
基于细粒度多层次特征分离的轴承寿命预测
7
作者 李春龙 刘扬 +4 位作者 辛鑫 秦红燕 吕明康 卫冲 赵振 《机电工程》 北大核心 2025年第8期1479-1489,共11页
在多源域迁移学习中强行共享源域和目标域私有特征会引起噪声干扰从而降低预测性能,在特征对齐过程中未考虑统筹全局和局部的特征,会造成跨工况轴承剩余使用寿命(RUL)预测精确性缺乏的问题。为此,提出了一种基于细粒度多层次特征分离(FG... 在多源域迁移学习中强行共享源域和目标域私有特征会引起噪声干扰从而降低预测性能,在特征对齐过程中未考虑统筹全局和局部的特征,会造成跨工况轴承剩余使用寿命(RUL)预测精确性缺乏的问题。为此,提出了一种基于细粒度多层次特征分离(FGMLFS)的多工况滚动轴承RUL预测方法。首先,设计了特定领域学习模块用于学习每个域的特定表示,去除了领域特定的私有特征,保留了域间可迁移的通用特征,并利用独立成分分析和相对熵有效分离域不变和域特定表示,确保了域间特征的一致性;然后,构建了多层次细粒度对齐模块,依据最大均值差异(MMD)和局部加权MMD策略,对域级和类别级特征进行了对齐,减少了源域与目标域的分布差异;最后,引入了辅助分类器模块,设计了动态加权最小类混淆损失优化特征空间对齐质量,增强了模型的预测准确性,采用滚动轴承PHM2012数据集对提出的FGMLFS方法进行了实验验证。研究结果表明:FGMLFS方法与改进的残差卷积域自适应网络(ERCDAN)相比,预测得分提升了0.14,且平均绝对误差和均方根误差降低了0.11和0.12。该结果验证了FGMLFS方法在轴承寿命预测中的有效性。 展开更多
关键词 剩余使用寿命预测 特征分离 子域自适应 迁移学习 最大均值差异 相对熵 改进的残差卷积域自适应网络 细粒度多层次特征分离
在线阅读 下载PDF
基于链接策略和不同粒度特征融合的极限多标签文本分类模型
8
作者 胡婕 郑启扬 +1 位作者 曹芝兰 刘梦赤 《中文信息学报》 北大核心 2025年第3期84-95,共12页
现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语... 现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语义。然后,通过注意力机制将标签语义和文档内容相结合生成感知文本,有效地探索文本信息和标签语义的交互关系。此外,该文通过融合机制将粗粒度层次特征和细粒度特征相结合,帮助模型更好地学习不同层次粒度的文档语义信息。在三个公开的数据集Eurlex-4K、Wiki10-30K和Kan-Shan Cup上进行了模型验证,实验结果表明,该文所提模型P@k值优于对比模型,综合性能得到有效提升。 展开更多
关键词 极限多标签文本分类 链接策略 感知文本 细粒度特征
在线阅读 下载PDF
基于细粒度视觉与音视双分支融合的情感视频字幕生成
9
作者 龚禹轩 韩婷婷 《数据采集与处理》 北大核心 2025年第5期1165-1176,共12页
情感视频字幕生成作为融合视觉语义解析与情感感知的跨模态任务,其核心挑战在于精准捕捉视觉内容中蕴含的情感线索。现有方法存在两点显著不足:一是对视频中主体(人物、物体等)与其外观特征、动作特征间的细粒度语义关联挖掘不够充分,... 情感视频字幕生成作为融合视觉语义解析与情感感知的跨模态任务,其核心挑战在于精准捕捉视觉内容中蕴含的情感线索。现有方法存在两点显著不足:一是对视频中主体(人物、物体等)与其外观特征、动作特征间的细粒度语义关联挖掘不够充分,导致视觉内容理解缺乏精细化支撑;二是忽视了音频模态在情感判别与内容语义对齐中的辅助价值,限制了跨模态信息的综合利用。针对上述问题,本文提出细粒度视觉与音视双分支融合框架。其中,细粒度视觉特征融合模块通过视觉、物体、动作特征的两两交互与深度融合,有效建模视频实体与视觉上下文间的细粒度语义关联,实现对视频内容的精细化解析;音频-视觉双分支全局融合模块则构建跨模态交互通道,将整合后的视觉特征与音频特征进行深层融合,充分发挥音频信息在情感线索传递与语义约束上的补充作用。在公开基准数据集上对本文方法进行验证,其评价指标均优于CANet、EPAN等对比方法,情感指标比EPAN方法平均提高4%,语义指标平均提升0.5,综合指标平均提升0.7。实验结果表明本文方法能有效提升情感视频字幕生成的质量。 展开更多
关键词 情感视频字幕生成 跨模态情感感知 细粒度特征融合 注意力机制 视频理解
在线阅读 下载PDF
一种双分支特征交互融合的高效红外图像彩色化方法
10
作者 陈宇 詹伟达 +2 位作者 蒋一纯 朱德鹏 韩登 《西安交通大学学报》 北大核心 2025年第8期211-222,共12页
针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并... 针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并通过全局特征提取分支获取全局特征,满足对长程依赖的需求。设计交互融合模块,对两个分支提取到的特征进行有效整合,显著增强了模型的整体性能。在解码器部分提出上下文聚合模块,进一步优化多尺度语义特征的聚合能力,改善了彩色化结果的边缘清晰度和细节表现力。在KAIST和FLIR数据集上进行广泛实验验证,结果表明:与现有方法相比,所提方法在两个数据集上均具有更高的彩色化质量,峰值信噪比分别达到28.645、30.459 dB,结构相似度达到0.507、0.725,均优于对比方法,且有效性和先进性也得到了验证。研究结果可为提升红外图像的可读性与可解释性以及提高夜视与恶劣环境下的观测能力提供参考。 展开更多
关键词 红外图像彩色化 细粒度特征 长程依赖 交互融合 上下文聚合
在线阅读 下载PDF
基于细粒度视觉特征和知识图谱的视觉故事生成算法 被引量:6
11
作者 李朦朦 江爱文 +3 位作者 龙羽中 宁铭 彭虎 王明文 《中文信息学报》 CSCD 北大核心 2022年第9期139-148,共10页
视觉故事生成是图像内容描述衍生的跨模态学习任务,在图文游记自动生成、启蒙教育等领域有较好的应用研究意义。目前主流方法存在对图像细粒度特征描述薄弱、故事文本的图文相关性低、语言不丰富等问题。为此,该文提出了基于细粒度视觉... 视觉故事生成是图像内容描述衍生的跨模态学习任务,在图文游记自动生成、启蒙教育等领域有较好的应用研究意义。目前主流方法存在对图像细粒度特征描述薄弱、故事文本的图文相关性低、语言不丰富等问题。为此,该文提出了基于细粒度视觉特征和知识图谱的视觉故事生成算法。该算法针对如何对图像内容进行充分挖掘和扩展表示,在视觉和高层语义方面,分别设计实现了图像细粒度视觉特征生成器和图像语义概念词集合生成器两个重要模块。在这两个模块中,细粒度视觉信息通过含有实体关系的场景图结构进行图卷积学习,高层语义信息综合外部知识图谱与相邻图像的语义关联进行扩充丰富,最终实现对图像序列内容较为全面细致的表示。该文算法在目前视觉故事生成领域规模最大的VIST数据集上与主流先进的算法进行了测试。实验结果表明,该文所提算法生成的故事文本,在图文相关性、故事逻辑性、文字多样性等方面,在Distinct-N和TTR等客观指标上均取得较大领先优势,具有良好的应用前景。 展开更多
关键词 视觉故事生成 场景图 知识图谱 文本生成 细粒度视觉特征
在线阅读 下载PDF
基于迁移学习与细粒度文本特征的未见关系链接研究 被引量:3
12
作者 徐红霞 《情报杂志》 CSSCI 北大核心 2023年第12期153-158,167,共7页
[研究目的]在知识海量增长的时代,知识图谱问答面临信息需求与知识图谱加速更新的现实情境,亟需探索关系链接模型在关系类型频繁更新时仍能保持链接效果的方法,实现未见关系类别与用户提问的精准语义匹配。[研究方法]针对模型泛化性不... [研究目的]在知识海量增长的时代,知识图谱问答面临信息需求与知识图谱加速更新的现实情境,亟需探索关系链接模型在关系类型频繁更新时仍能保持链接效果的方法,实现未见关系类别与用户提问的精准语义匹配。[研究方法]针对模型泛化性不足与灾难性遗忘问题,引入Adapter-Bert迁移学习框架;针对模型对辨别性语义部分的捕获能力不足问题,引入实体特征与问题变换,并将稠密向量与问句抽象意义形式化表示两种不同的语义表示方式进行融合。[研究结论]结果表明,方法在未见关系链接任务上的准确率达到98.80%,相较bert基线模型有显著提高,提升了未见关系链接的效果。 展开更多
关键词 自然语言处理 未见关系 迁移学习 细粒度文本特征 抽象意义表示
在线阅读 下载PDF
融合细粒度词特征的老挝语词性标注研究
13
作者 唐文 周兰江 张建安 《小型微型计算机系统》 CSCD 北大核心 2022年第3期661-666,共6页
目前流行的词性标注方法严重依赖语料规模及人工提取特征的质量;然而,老挝语资源稀缺,语料及特征选取面临很大挑战,且老挝语句子本身存在普遍过长的特点.因此,该文提出一种融合细粒度词特征的老挝语词性标注方法,构建了融合细粒度词特征... 目前流行的词性标注方法严重依赖语料规模及人工提取特征的质量;然而,老挝语资源稀缺,语料及特征选取面临很大挑战,且老挝语句子本身存在普遍过长的特点.因此,该文提出一种融合细粒度词特征的老挝语词性标注方法,构建了融合细粒度词特征的Att-BiLSTM-CRF模型.首先,以老挝音素和声调符号作为基本单元来进行老挝细粒度词特征的提取,使模型获取更加丰富的语料信息;然后,将细粒度词特征输入BiLSTM中获取句子级别特征;其次,使用自注意力机制防止老挝句子长远上下文信息丢失;最后,使用CRF提取相邻词性约束关系,从而获取最优词性标签.实验结果表明,在有限语料集下,该方法精确率、召回率和F1值分别为93.70%、93.87%、93.62%. 展开更多
关键词 词性标注 老挝语 细粒度特征 注意力机制
在线阅读 下载PDF
基于Transformer的细粒度图像中文描述 被引量:3
14
作者 肖雄 徐伟峰 +2 位作者 王洪涛 苏攀 高思华 《吉林大学学报(理学版)》 CAS 北大核心 2022年第5期1103-1112,共10页
针对图像中文描述中传统循环神经网络(RNN)结构不利于生成长句、缺乏细节语义信息的问题,提出一种用Transformer多头注意力(multi-head attention, MHA)网络,融合粗粒度的全局特征和细粒度的区域目标实体特征方法.该方法通过多尺度特征... 针对图像中文描述中传统循环神经网络(RNN)结构不利于生成长句、缺乏细节语义信息的问题,提出一种用Transformer多头注意力(multi-head attention, MHA)网络,融合粗粒度的全局特征和细粒度的区域目标实体特征方法.该方法通过多尺度特征的融合,使图像注意力更易聚焦于细粒度的目标区域,得到更具细粒度语义特征的图像表示,从而有效改善了图像描述.在数据集ICC上使用多种评价指标进行验证,结果表明,该模型在各项指标上均取得了更好的图像描述效果. 展开更多
关键词 图像中文描述 细粒度特征 多头注意力
在线阅读 下载PDF
基于上下文通道注意力机制的人脸属性估计与表情识别 被引量:2
15
作者 徐杰 钟勇 +2 位作者 王阳 张昌福 杨观赐 《计算机应用》 北大核心 2025年第1期253-260,共8页
人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先... 人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。 展开更多
关键词 人脸属性估计 面部表情识别 注意力机制 细粒度特征 特征差异
在线阅读 下载PDF
轻量化炮孔图像检测与定位方法
16
作者 潘杉 于挺 +2 位作者 岳中文 田子建 金庆雨 《煤炭学报》 北大核心 2025年第3期1838-1848,共11页
在岩巷掘进工作面爆破作业中,目前采用人工装药或由经验丰富的人员操作机械臂进行装药,作业的有效性和安全性难以保证。装药机械臂的智能化发展是实现掘进面爆破作业中药物填充操作安全高效运行的关键,而炮孔图像检测算法是装药机械臂... 在岩巷掘进工作面爆破作业中,目前采用人工装药或由经验丰富的人员操作机械臂进行装药,作业的有效性和安全性难以保证。装药机械臂的智能化发展是实现掘进面爆破作业中药物填充操作安全高效运行的关键,而炮孔图像检测算法是装药机械臂智能化控制系统的核心算法。为实现装药机械臂的智能化控制,保证炮孔图像检测精度的同时降低控制装置的功耗,使装药机械臂嵌入式控制装置满足本质安全型电气产品的安全要求,提出了一种轻量化炮孔检测与定位算法Mv3-SCD。该算法在炮孔检测精度方面,针对炮孔受围岩背景、岩石阴影影响产生的误检现象,以及炮孔在图像中表现出上下文信息少、可识别特征有限导致的漏检问题,首先设计了一种炮孔检测头结构,通过使用高分辨率的检测头来减少过多的下采样导致的炮孔特征损失;然后引入了Mv3_Block使算法在浅层特征便具备较强的炮孔语义抽象能力,通过配合空洞金字塔池化模块增大感受野,以捕获复杂围岩背景下炮孔和岩石遮挡形成的阴影之间的细粒度差异特征;最后,为了提高炮孔边界框回归的准确率,对损失函数进行了优化。针对炮孔图像检测与定位算法网络模型参数量大、每秒帧数小的问题,提出了一种轻量级的Sc_C2f模块来对网络结构进行优化。为了验证算法的有效性,分别从主观和客观2个方面对Mv3-SCD系列进行了分析。与最小基线模型相比,Mv3-SCDn炮孔算法具有最优的炮孔检测效果,炮孔检测模型参数量下降了7.17%,检测速度提高了45.44%。实验结果表明,提出的算法能够有效提高智能装药机械臂的精准度和网络模型的轻量化程度。 展开更多
关键词 炮孔检测与定位 目标检测 特征提取 轻量化模型 细粒度特征
在线阅读 下载PDF
局部与全局双重特征融合的自然场景文本检测 被引量:2
17
作者 李云洪 闫君宏 胡蕾 《数据采集与处理》 CSCD 北大核心 2022年第2期415-425,共11页
自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全... 自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全局特征融合,对恒等残差块进行改进实现局部细粒度特征融合,从而减少特征信息丢失,增强对文本区域特征提取力度,并采用多边形偏移文本域与文本边缘信息相结合的方式准确定位文本区域。为了评估本文方法的有效性,在现有经典数据集ICDAR2015和CTW1500上进行了多组对比实验,实验结果表明在复杂场景下该方法文本检测的性能更加卓越。 展开更多
关键词 文本检测 跳跃连接 细粒度特征融合 全局特征融合 多边形偏移文本域
在线阅读 下载PDF
联合多尺度注意力与混合池化的手腕创伤X光图像检测
18
作者 林淑娟 钟铭恩 +2 位作者 谭佳威 范康 林志强 《电子测量技术》 北大核心 2025年第16期180-188,共9页
针对X光图像中的骨折、软组织肿胀、骨病变等多类创伤的辅助检测问题,提出一种基于深度卷积神经网络的目标检测算法模型WristXNet。首先设计了多尺度注意力特征聚合模块C2f_MSAF来增强模型对多尺度目标的特征理解能力;其次构建了混合池... 针对X光图像中的骨折、软组织肿胀、骨病变等多类创伤的辅助检测问题,提出一种基于深度卷积神经网络的目标检测算法模型WristXNet。首先设计了多尺度注意力特征聚合模块C2f_MSAF来增强模型对多尺度目标的特征理解能力;其次构建了混合池化空间金字塔模块HPSP来增强对不同类别目标关联特征的提取能力;随后引入动态上采样模块DySample来进一步增强对细粒度特征的捕捉能力;最后设计了具有解耦结构的轻量化检测头LDDHead来提升模型计算效率。在儿童手腕创伤X光图像公开数据集GRAZPEDWRI-DX上的实验结果表明,所提算法针对X光图像中的7类常见目标的平均检测精度mAP取得最高值68.5%,相比现有最优算法提升了1.6%,且模型大小仅为3.3 M,处理效率达到每秒156.9张图像,体现了良好的综合性能。 展开更多
关键词 医学图像处理 腕骨X光图像 多尺度注意力 混合池化 细粒度特征
在线阅读 下载PDF
一种融合语义分析特征提取的推荐算法 被引量:15
19
作者 陈嘉颖 于炯 杨兴耀 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期562-575,共14页
推荐系统是大数据环境下解决用户个性化推荐的关键技术.针对现有推荐算法所面临的难以分析提取用户、项目本质特征的问题,将知识图谱作为异质信息融入协同过滤推荐算法进行项目语义特征分析,提出一种融合语义分析特征提取的推荐算法.首... 推荐系统是大数据环境下解决用户个性化推荐的关键技术.针对现有推荐算法所面临的难以分析提取用户、项目本质特征的问题,将知识图谱作为异质信息融入协同过滤推荐算法进行项目语义特征分析,提出一种融合语义分析特征提取的推荐算法.首先根据推荐平台中项目的非结构化评论文本信息,结合知识图谱利用实体识别与连接技术在知识库中提取项目特征相关实体与关系,构建子知识库;然后通过知识图谱表示学习方法对子知识库进行表示学习,并将其用于项目和用户的低维向量表示;设计知识感知的协同学习框架,定义损失函数优化用户、项目的细粒度特征向量;最后根据用户、项目表征结果对目标用户进行Top-N推荐.在2个数据集上进行验证实验,结果表明:改进的算法在推荐准确率、召回率方面优于对比算法,能够为用户推荐更符合其偏好的项目. 展开更多
关键词 推荐系统 语义分析 细粒度特征 知识感知 协同学习
在线阅读 下载PDF
基于SqueezeNet深度网络的中药材粉末显微特征图像识别研究 被引量:15
20
作者 王一丁 石铎 +1 位作者 李耀利 蔡少青 《电子显微学报》 CAS CSCD 北大核心 2019年第2期130-138,共9页
中药材粉末显微特征图像具有复杂的纹理特点,传统算法难以构建高识别率的分类器。针对此提出一种基于SqueezeNet卷积网络的改进型双通道算法。首先,分离背景并提取感兴趣区,同时自动截取感兴趣中心区域1/4面积作为细粒度特征图像;其次,... 中药材粉末显微特征图像具有复杂的纹理特点,传统算法难以构建高识别率的分类器。针对此提出一种基于SqueezeNet卷积网络的改进型双通道算法。首先,分离背景并提取感兴趣区,同时自动截取感兴趣中心区域1/4面积作为细粒度特征图像;其次,对感兴趣区和细粒度特征图像进行尺度归一化,去均值,调整方差以及多角度旋转等预处理;之后,将处理后的感兴趣区和细粒度特征图像分别作为两个独立SqueezeNet深度网络的输入源,并对两个网络进行独立训练;最后,将得到的两个模型作为两个通道连接,识别结果利用概率加权算法进行融合。应用提出的改进型双通道算法对15种中药材粉末显微导管特征图像进行识别,正确识别率达到90. 33%。该方法具有较高的正确识别率和理想的识别效果。 展开更多
关键词 中药材粉末显微特征图像识别 显微结构特征 卷积神经网络 SqueezeNet 细粒度特征 概率加权融合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部