期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于全局一致的非配对低照度图像增强方法
1
作者 江泽涛 黄钦阳 +3 位作者 张惠鹃 金鑫 黄景帆 廖培期 《计算机研究与发展》 北大核心 2025年第4期876-887,共12页
由于低照度配对图像的制作成本昂贵且难于制作,而非配对低照度图像增强方法不依赖配对图像数据因而更有实用价值,但其缺乏详细的监督信号导致输出图像存在全局曝光不一致、色彩失真和大量噪声等视觉退化问题,在实际应用中存在挑战.为了... 由于低照度配对图像的制作成本昂贵且难于制作,而非配对低照度图像增强方法不依赖配对图像数据因而更有实用价值,但其缺乏详细的监督信号导致输出图像存在全局曝光不一致、色彩失真和大量噪声等视觉退化问题,在实际应用中存在挑战.为了更好地满足实用需求,提出一种基于全局一致的非配对低照度增强方法(unpaired low-light enhancement method based on global consistency,GCLLE).首先,该方法通过全局一致性保持模块(global consistency preserving module,GCPM)将编码器和解码器中相同尺度的特征重新建模并融合以矫正不同尺度的上下文信息,保证输出图像全局曝光调整一致性和全局结构一致性,使得图像亮度分布均匀并避免扭曲和失真;利用局部平滑和调制模块(local smoothing and modulation module,LSMM)学习一组局部的低阶曲线映射,为图像提供更宽的动态范围并进一步提高质量,实现真实和自然的增强效果;提出使用双路池化融合深层特征的深度特征强化模块(deep feature enhancement module,DFEM)压缩无关信息并突出更有区分度的编码特征,减少了不准确信息并使得解码器更容易捕获图像中的低强度信号,保留图像更多细节.不同于关注配对图像像素间一对一映射关系的配对增强方法,GCLLE通过缩小低照度图像与非配对正常照度图像之间的风格差异实现增强.在MIT和LSRW数据集上进行大量的实验,结果表明所提方法在多个客观指标上超过了现有典型低照度增强方法,具有更好的增强效果. 展开更多
关键词 低照度图像 图像增强 非配对学习 生成对抗网络 深度学习
在线阅读 下载PDF
基于外部先验和自先验注意力的图像描述生成方法 被引量:2
2
作者 李永杰 钱艺 文益民 《计算机科学》 CSCD 北大核心 2024年第7期214-220,共7页
图像描述是一种结合计算机视觉和自然语言处理的跨模态任务,旨在理解图像内容并生成恰当的句子。现有的图像描述方法通常使用自注意力机制来捕获样本内的长距离依赖关系,但这种方式不仅忽略了样本间的潜在相关性,而且缺乏对先验知识的利... 图像描述是一种结合计算机视觉和自然语言处理的跨模态任务,旨在理解图像内容并生成恰当的句子。现有的图像描述方法通常使用自注意力机制来捕获样本内的长距离依赖关系,但这种方式不仅忽略了样本间的潜在相关性,而且缺乏对先验知识的利用,导致生成内容与参考描述存在一定差异。针对上述问题,文中提出了一种基于外部先验和自先验注意力(External Prior and Self-prior Attention, EPSPA)的图像描述方法。其中,外部先验模块能够隐式地考虑到样本间的潜在相关性进而减少来自其他样本的干扰信息。同时,自先验注意力能够充分利用上一层的注意力权重来模拟先验知识,使其指导模型进行特征提取。在公开数据集上使用多种指标对EPSPA进行评估,实验结果表明该方法能够在保持低参数量的前提下表现出优于现有方法的性能。 展开更多
关键词 图像描述 自注意力机制 潜在相关性 外部先验模块 自先验注意力
在线阅读 下载PDF
基于聚簇模型重用的概念漂移数据流半监督分类算法 被引量:1
3
作者 康伟 黎利辉 文益民 《计算机科学》 CSCD 北大核心 2024年第4期124-131,共8页
带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史... 带概念漂移的半监督数据流分类任务中,仅有少部分的数据被标记,这给分类器的训练、概念漂移的检测以及分类器对新概念的适应带来了巨大的挑战。现有的半监督聚簇分类算法仅对分类器池中的聚簇模型进行简单的增量更新,未能有效重用历史聚簇模型。因此,文中提出了一种新的聚簇模型重用的半监督分类算法,称为CDCMR。首先,数据流以数据块的形式到来,对数据块分完类后,训练一个簇数自适应确定的聚簇模型。其次,通过计算分类器池中的各组件分类器与聚簇模型之间的相似度,挑选多个组件分类器。再次,用当前数据块对挑选出来的组件分类器进行模型重用后,与聚簇模型集成。然后,将分类器池划分为新旧更替和多样性最大化分类器池进行更新。最后,对下一个数据块的样本进行集成分类。在多个人工和真实数据集上进行实验,结果表明,所提算法1)能有效适应概念漂移,与现有方法相比其性能有显著性提升。 展开更多
关键词 数据流 半监督学习 概念漂移 聚簇模型重用 集成学习
在线阅读 下载PDF
基于改进CPMs和SqueezeNet的轻量级人体骨骼关键点检测模型 被引量:4
4
作者 强保华 翟艺杰 +4 位作者 陈金龙 谢武 郑虹 王学文 张世豪 《计算机应用》 CSCD 北大核心 2020年第6期1806-1811,共6页
针对目前的人体骨骼关键点检测模型参数多、训练时间长和检测速度慢的问题,提出了一种将人体骨骼关键点检测模型CPMs与小型卷积神经网络模型SqueezeNet相结合的检测方法。首先,采用4个Stage的CPMs(CPMsStage4)对人物图像进行关键点检测... 针对目前的人体骨骼关键点检测模型参数多、训练时间长和检测速度慢的问题,提出了一种将人体骨骼关键点检测模型CPMs与小型卷积神经网络模型SqueezeNet相结合的检测方法。首先,采用4个Stage的CPMs(CPMsStage4)对人物图像进行关键点检测;然后,在CPMs-Stage4中引入SqueezeNet的Fire Module网络结构,利用Fire Module结构大大压缩模型参数,得到一种新的轻量级人体骨骼关键点检测模型SqueezeNet15-CPMs-Stage4。在扩展的LSP数据集上的验证结果显示,与CPMs相比,SqueezeNet15-CPMs-Stage4模型在训练时间上减少86.68%,在单张图像检测时间上减少44.27%,准确率达到90.4%;与改进的VGG-16、DeepCut和DeeperCut三种参照模型相比,SqueezeNet15-CPMs-Stage4模型在训练时间、检测速度和准确率方面均是最优的。实验结果表明,所提模型不仅检测准确率高,而且训练时间短、检测速度快,能够有效降低人体骨骼关键点检测模型的训练成本。 展开更多
关键词 人体骨骼关键点检测 人体姿态估计 深度学习 卷积神经网络 轻量级 CPMS SqueezeNet
在线阅读 下载PDF
结合特征增强和多尺度感受野的低照度目标检测 被引量:5
5
作者 江泽涛 翟丰硕 +2 位作者 钱艺 肖芸 张少钦 《计算机研究与发展》 EI CSCD 北大核心 2023年第4期903-915,共13页
低照度图像普遍存在噪声、颜色失真和低对比度等图像退化问题,不仅影响视觉体验,而且严重影响低照度目标检测精度.为了更好地完成低照度目标检测任务,提出一种结合特征增强和多尺度感受野(feature enhancement and multi-scale receptiv... 低照度图像普遍存在噪声、颜色失真和低对比度等图像退化问题,不仅影响视觉体验,而且严重影响低照度目标检测精度.为了更好地完成低照度目标检测任务,提出一种结合特征增强和多尺度感受野(feature enhancement and multi-scale receptive field,FEMR)的低照度目标检测算法.首先,像素级高阶映射(pixel-level high-order mapping,PHM)模块学习低照度到正常照度的高阶映射关系,进而提高低照度目标特征显著性,从而获得初步增强的特征信息.然后,关键信息增强(key information enhancement,KIE)模块结合多种注意力机制,突出重要特征并过滤噪声信息,获得进一步增强的特征信息.此外,长距离特征捕获(long distance feature capture,LFC)模块引入多种尺度的条状感受野,捕获低照度场景中孤立区域的长距离关系.实验表明,所提算法在低照度目标检测精度方面具有较好的表现,同时能直接输出正常照度风格图像下的检测结果,实现端到端的低照度目标检测,便于人眼直接评估检测结果的精度. 展开更多
关键词 低照度 目标检测 特征增强 多尺度感受野 长距离关系
在线阅读 下载PDF
概念漂移数据流半监督分类综述 被引量:16
6
作者 文益民 刘帅 +2 位作者 缪裕青 易新河 刘长杰 《软件学报》 EI CSCD 北大核心 2022年第4期1287-1314,共28页
在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而... 在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而,现有研究主要关注有监督的数据流分类,针对带概念漂移的数据流的半监督分类的研究尚未引起足够的重视.因此,在全面收集数据流半监督分类研究工作的基础上,对现有带概念漂移的数据流的半监督分类算法进行了多角度划分;并以算法采用的分类器类型为线索,对已有的多个算法进行了介绍与总结,包括现有数据流半监督分类采用的概念漂移检测方法;在一些被广泛使用的真实数据集和人工数据集上,对部分代表性数据流半监督分类算法进行了多方面的比较与分析;最后,提出了当前概念漂移数据流半监督分类中一些值得进一步深入探讨的问题.实验结果表明:数据流半监督分类算法的分类准确率与众多因素有关,但与数据分布的变化关系最大.本综述将有助于感兴趣的研究者快速进入数据流半监督分类问题领域. 展开更多
关键词 数据挖掘 概念漂移 数据流 集成学习 半监督分类
在线阅读 下载PDF
基于改进的BSMOTE和时序特征的风机故障采样算法 被引量:5
7
作者 杨鲜 赵计生 +4 位作者 强保华 米路中 彭博 唐成华 李宝莲 《计算机应用》 CSCD 北大核心 2021年第6期1673-1678,共6页
针对风机数据集的不平衡问题,提出了一种BSMOTE-Sequence采样算法,在合成新样本时综合考虑空间和时间特征,并对新样本进行清洗,从而有效减少噪声点的生成。首先,根据每个少数类样本的近邻样本的类别比例,将少数类样本划分为安全类样本... 针对风机数据集的不平衡问题,提出了一种BSMOTE-Sequence采样算法,在合成新样本时综合考虑空间和时间特征,并对新样本进行清洗,从而有效减少噪声点的生成。首先,根据每个少数类样本的近邻样本的类别比例,将少数类样本划分为安全类样本、边界类样本和噪声类样本。然后,对每个边界类样本都遴选出空间距离、时间跨度最接近的少数类样本集,利用线性插值法合成新样本,并过滤掉噪声类样本以及类间重叠样本。最后,以支持向量机(SVM)、卷积神经网络(CNN)、长短期记忆(LSTM)人工神经网络作为风机齿轮箱故障检测模型,F1-Score、曲线下面积(AUC)和G-mean作为模型性能评价指标,在真实风机数据集上把所提算法与常用的多种采样算法进行对比,实验结果表明:相比已有算法,BSMOTE-Sequence算法所生成样本的分类效果更好,使得检测模型的F1-Score、AUC和G-mean平均提高了3%,该算法能有效地适用于数据具有时序规律且不平衡的风机故障检测领域。 展开更多
关键词 风机故障检测 不均衡数据 时序特征 采样算法 类间重叠样本
在线阅读 下载PDF
具有双层路由注意力的YOLOv8道路场景目标检测方法 被引量:26
8
作者 魏陈浩 杨睿 +3 位作者 刘振丙 蓝如师 孙希延 罗笑南 《图学学报》 CSCD 北大核心 2023年第6期1104-1111,共8页
随着机动车的数量不断增加,道路交通环境变得更加复杂,尤其是光照变化以及复杂背景都会干扰目标检测算法的准确性和精度,同时道路场景下多变形态的目标也会给检测任务造成干扰。针对这一系列问题,提出了一种YOLOv8n_T方法,在YOLOv8的基... 随着机动车的数量不断增加,道路交通环境变得更加复杂,尤其是光照变化以及复杂背景都会干扰目标检测算法的准确性和精度,同时道路场景下多变形态的目标也会给检测任务造成干扰。针对这一系列问题,提出了一种YOLOv8n_T方法,在YOLOv8的基础上首先针对骨干网络构建了基于可变形卷积的D_C2f块,强化了特征提取网络对复杂背景下目标的特征学习,更好地适应道路目标复杂多变的情形;其次增加了双层路由注意力模块,以查询自适应的方式去除不相关的区域,留下相关度最高的区域;最后针对道路上行人、交通灯等小目标增加小目标检测层。实验表明,本文提出的YOLOv8n_T有效提高了模型在道路场景下的目标检测精度,在BDD100K数据集上的平均精度比原始YOLOv8n提升了6.8个百分点,比YOLOv5n提升了11.2个百分点。 展开更多
关键词 可变形卷积 道路场景 目标检测 YOLO 注意力机制
在线阅读 下载PDF
一种新的半监督归纳迁移学习框架:Co-Transfer 被引量:3
9
作者 文益民 员喆 余航 《计算机研究与发展》 EI CSCD 北大核心 2023年第7期1603-1614,共12页
在许多实际的数据挖掘应用场景,如网络入侵检测、Twitter垃圾邮件检测、计算机辅助诊断等中,与目标域分布不同但相关的源域普遍存在.一般情况下,在源域和目标域中都有大量未标记样本,对其中的每个样本都进行标记是件困难的、昂贵的、耗... 在许多实际的数据挖掘应用场景,如网络入侵检测、Twitter垃圾邮件检测、计算机辅助诊断等中,与目标域分布不同但相关的源域普遍存在.一般情况下,在源域和目标域中都有大量未标记样本,对其中的每个样本都进行标记是件困难的、昂贵的、耗时的事,有时也没必要.因此,充分挖掘源域和目标域中标记和未标记样本来解决目标域中的分类任务非常重要且有意义.结合归纳迁移学习和半监督学习,提出一种名为Co-Transfer的半监督归纳迁移学习框架.Co-Transfer首先生成3个TrAdaBoost分类器用于实现从原始源域到原始目标域的迁移学习,同时生成另外3个TrAdaBoost分类器用于实现从原始目标域到原始源域的迁移学习.这2组分类器都使用从原始源域和原始目标域的原有标记样本的有放回抽样来训练.在Co-Transfer的每一轮迭代中,每组TrAdaBoost分类器使用新的训练集更新,其中一部分训练样本是原有的标记样本,一部分是由本组TrAdaBoost分类器标记的样本,还有一部分则由另一组TrAdaBoost分类器标记.迭代终止后,把从原始源域到原始目标域的3个TrAdaBoost分类器的集成作为原始目标域分类器.在UCI数据集和文本分类数据集上的实验结果表明,Co-Transfer可以有效地学习源域和目标域的标记和未标记样本从而提升泛化性能. 展开更多
关键词 半监督学习 迁移学习 多任务学习 双向迁移 集成学习
在线阅读 下载PDF
面向机械臂操作的视觉信息实时重建方法 被引量:1
10
作者 贾清玉 常亮 +4 位作者 杨先一 强保华 张世豪 谢武 杨明浩 《计算机应用》 CSCD 北大核心 2023年第4期1255-1260,共6页
现阶段的机械臂技能传授方法主要通过三维实时重建技术搭建虚拟空间进行模拟训练。然而人与机械臂视角不同,传统视觉信息重建方法由于重建误差大、时间长,而且实验环境苛刻、所需传感器较多等原因,导致机械臂在虚拟空间内习得的技能不... 现阶段的机械臂技能传授方法主要通过三维实时重建技术搭建虚拟空间进行模拟训练。然而人与机械臂视角不同,传统视觉信息重建方法由于重建误差大、时间长,而且实验环境苛刻、所需传感器较多等原因,导致机械臂在虚拟空间内习得的技能不能很好地迁移于现实环境。针对以上问题,提出了一种面向机械臂操作的视觉信息实时重建方法。首先,通过Mask-RCNN(Mask-Region Convolutional Neural Network)对实时采集到的RGB图像提取信息;然后,将提取后的RGB图像及其他视觉信息联合编码,并通过ResNet-18将视觉信息映射为机械臂操作空间的三维位置信息;最后,为减小重建误差,提出了一种聚类簇中心距离受限离群值调整方法(CC-DIS),并利用OpenGL(Open Graphics Library)将调整后的位置信息可视化,完成机械臂操作空间三维实时重建。实验结果表明,所提的实时重建方法具有较快的重建速度和较高的重建精度,完成一次三维重建仅需62.92 ms,重建速度高达每秒16帧,重建相对误差约为5.23%,能有效用于机械臂技能传授任务。 展开更多
关键词 技能传授 Mask-RCNN ResNet-18 三维实时重建 机械臂
在线阅读 下载PDF
基于改进DAN的自然场景下越南文字的识别 被引量:1
11
作者 王利兵 俸亚特 文益民 《数据采集与处理》 CSCD 北大核心 2023年第5期1058-1068,共11页
越南语字符由拉丁字符结合变音符号组成,由于变音符号的存在易导致注意力漂移,并且越南语文字字符类别较多,字符间差异性较小,部分字符仅为变音符号的差异,使得越南文字的识别具有挑战性。本文在解耦注意力网络(Decoupled attention net... 越南语字符由拉丁字符结合变音符号组成,由于变音符号的存在易导致注意力漂移,并且越南语文字字符类别较多,字符间差异性较小,部分字符仅为变音符号的差异,使得越南文字的识别具有挑战性。本文在解耦注意力网络(Decoupled attention network, DAN)的基础上,设计了视觉特征与序列特征融合模块(Visual feature and sequence feature fusion module, VSFM),分别利用双向门控循环单元(Bidirectional gated recurrent unit, Bi-GRU)在水平方向和竖直方向进行序列建模,进一步缓解注意力漂移,增强变音符号与拉丁字符间的关联性。然后设计了增强型解耦文本解码器模块(Enhanced decoupled text decoder module, ETDM),在解码器中分类时结合了更多的特征信息,可以更加有效地识别相似字符。一系列的实验验证了本文提出方法的有效性。 展开更多
关键词 声调语言文字 越南语文字 变音符号 注意力漂移 场景文本识别
在线阅读 下载PDF
基于判别性矩阵分解的多标签跨模态哈希检索 被引量:1
12
作者 谭钰 王小琴 +2 位作者 蓝如师 刘振丙 罗笑南 《计算机应用》 CSCD 北大核心 2023年第5期1349-1354,共6页
现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索... 现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性,忽略了哈希向量的平衡条件,导致所学习到的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法——基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解(CMF)获得了一个共享的隐式子空间;同时利用数据之间共有标签的比例来描述异构数据的相似程度;此外,利用标签的平衡信息构造平衡矩阵,生成具有平衡特性的哈希向量,并最大化不同类别标签之间的类间距。在两个常用多标签数据集MIRFlickr和NUS-WIDE上与7种先进的跨模态哈希方法进行对比,在“以图搜文”(I2T)和“以文搜图”(T2I)任务上,DMFH均取得了最高的平均精度均值(mAP),而且T2I任务的mAP更优,说明DMFH能够更有效地利用文本模态中的多标签语义信息。还分析了所构造的平衡矩阵与相似性矩阵的有效性,验证了DMFH算法能有效保持语义信息和相似性关系,在多标签跨模式检索中是有效的。 展开更多
关键词 跨模态检索 矩阵分解 哈希学习 平衡向量 多标签数据
在线阅读 下载PDF
基于改进Mask R-CNN的越南场景文字检测
13
作者 俸亚特 文益民 《计算机应用》 CSCD 北大核心 2021年第12期3551-3557,共7页
针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并... 针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络MaskR-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并将文字区域的掩码矩阵大小从14×14调整为14×28以更好地适应文字区域。针对用常规非极大值抑制(NMS)算法不能剔除重复文字检测框的问题,设计了一个针对文字区域的文本区域过滤模块并添加在检测模块之后,以有效地剔除冗余检测框。使用模型联合训练的方法训练网络,训练过程包含两部分:第一部分为特征金字塔网络(FPN)和区域生成网络(RPN)的训练,训练使用的数据集为大规模公开的拉丁文字数据,目的是增强模型在不同场景下提取文字的泛化能力;第二部分为候选框坐标回归模块和区域分割模块的训练,此部分模型参数使用像素级标注的越南场景文字数据进行训练,使模型能对包括声调符号的越南文字区域进行分割。大量交叉验证实验和对比实验结果表明,与MaskR-CNN相比,所提算法在不同的交并比(IoU)阈值下都具有更好的准确率与召回率。 展开更多
关键词 MaskR-CNN 越南场景文字检测 声调符号 模型联合训练 分割模型 重复检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部