期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
基于数据增广和伪标签生成的波阻抗反演
1
作者 程程 赵岩 《石油地球物理勘探》 北大核心 2025年第3期642-654,共13页
基于深度学习的波阻抗反演往往需要大量标签数据驱动模型进行网络训练,但实际情况中标签数据(测井数据)获取难度较大、成本较高,通常只有少量的标签数据可用于训练。为此,提出一种基于数据增广和伪标签生成的半监督波阻抗反演方法。首先... 基于深度学习的波阻抗反演往往需要大量标签数据驱动模型进行网络训练,但实际情况中标签数据(测井数据)获取难度较大、成本较高,通常只有少量的标签数据可用于训练。为此,提出一种基于数据增广和伪标签生成的半监督波阻抗反演方法。首先,利用三次样条插值法对标签波阻抗数据进行插值后随机重采样;然后,用正演方法计算增广波阻抗相对应的地震记录;最后,将增广后的地震记录和波阻抗作为网络训练集,训练网络并预测波阻抗。将筛选出的高质量预测数据作为伪标签,并对伪标签进行数据增广,大量扩充训练数据集。由于时间卷积网络(Temporal Convolutional Network,TCN)在时序数据建模上具有优势,可以捕获数据的长期依赖关系,很好地完成波阻抗反演任务。Marmousi模型的测试结果显示,所提方法适用于少量标签数据的波阻抗反演问题,具有良好的抗噪性能,且对于不同的标签分布情况依旧有较好的反演精度。实际勘探数据的反演结果表明,该方法能有效地解决地震波阻抗反演问题。 展开更多
关键词 波阻抗反演 时间卷积网络 数据增广 伪标签 半监督学习
在线阅读 下载PDF
噪声鲁棒的蒙古语语音数据增广模型结构
2
作者 马志强 孙佳琦 +1 位作者 李晋益 王嘉泰 《中文信息学报》 北大核心 2025年第8期82-89,共8页
蒙古语语料库中语音多样性匮乏,虽然花费人力和经费收集数据在一定程度上能够增加语音的数量,但整个过程需要耗费大量的时间。数据增广能够解决这种数据匮乏问题,但数据增广模型的训练数据包含的环境噪声无法控制,导致增广语音中存在背... 蒙古语语料库中语音多样性匮乏,虽然花费人力和经费收集数据在一定程度上能够增加语音的数量,但整个过程需要耗费大量的时间。数据增广能够解决这种数据匮乏问题,但数据增广模型的训练数据包含的环境噪声无法控制,导致增广语音中存在背景噪声。该文提出一种TTS和语音增强相结合的语音数据增广方法,以语音的频谱图为基础,从频域和时域两个维度进行语音增强。通过多组实验证明,蒙古语增广语音的合格率达到70%,增广语音的CBAK和COVL分别下降了0.66和0.81,WER和SER下降了2.75%和2.05%。 展开更多
关键词 语音 数据增广 噪声鲁棒性 蒙古语
在线阅读 下载PDF
多因素引导的行人重识别数据增广方法研究
3
作者 刘志刚 张国辉 +1 位作者 高月 刘苗苗 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期235-242,共8页
为解决行人重识别研究领域中行人标注图像获取困难的问题,提出一种多因素引导的行人数据增广方法。首先,在生成器网络中设计了一种局部多尺度引导机制,通过特征融合抑制生成图像的局部伪影;其次,提出了长距离相关性引导机制,通过外注意... 为解决行人重识别研究领域中行人标注图像获取困难的问题,提出一种多因素引导的行人数据增广方法。首先,在生成器网络中设计了一种局部多尺度引导机制,通过特征融合抑制生成图像的局部伪影;其次,提出了长距离相关性引导机制,通过外注意力引导生成图像的长距离依赖,提高生成行人图像的整体视感质量;最后,提出一种抗博弈判别网络,通过嵌入到生成对抗网络,从而构建一种三网络稳定博弈架构模型,增加生成对抗网络训练的稳定性。通过VIPeR、Market-1501、DukeMTMC-reID这3种不同规模数据集的仿真实验,结果表明该方法与目前主流方法相比,mAP与Rank-1精度上均有不同程度的提升,在小规模数据集上的提升较为显著。 展开更多
关键词 行人重识别 生成对抗网络 数据增广 局部多尺度 注意力机制
在线阅读 下载PDF
基于生成对抗网络的车牌图像篡改检测数据增广 被引量:1
4
作者 李来源 霍聪聪 谭舜泉 《计算机应用》 CSCD 北大核心 2024年第S01期301-308,共8页
现有的篡改检测方法,主要使用基于数据驱动的深度学习模型,检测效果与训练数据的质量和数量成正比,且人工制作高质量的篡改图片费时费力。针对高质量车牌篡改图片数据量少的情况,提出一种针对车牌场景的篡改图片数据增广方法。结合车牌... 现有的篡改检测方法,主要使用基于数据驱动的深度学习模型,检测效果与训练数据的质量和数量成正比,且人工制作高质量的篡改图片费时费力。针对高质量车牌篡改图片数据量少的情况,提出一种针对车牌场景的篡改图片数据增广方法。结合车牌定位模块、车牌矫正模块、基于生成对抗网络(GAN)的图像擦除模块和文字风格迁移模块,构建一个车牌字符篡改系统,以模拟真实场景的车牌篡改流程。相较于传统篡改方法,借助GAN生成的篡改字符种类更多元化、更具备多样性。实验结果表明,使用所提系统生成的车牌篡改图片可以达到篡改区域语义高度合理,且肉眼不可分辨的视觉效果;将它作为扩充数据训练篡改检测模型,曲线下面积(AUC)提升了42.9%,F1值提升了33.0%,漏检率下降了16.6%。同时,使用所提系统生成的车牌篡改图片搭配多种数据处理方法在不同篡改检测网络上均能有效提升检测性能;使用扩充数据训练后,篡改检测网络不仅可以成功检测传统篡改方法的篡改痕迹,针对现阶段流行的生成式篡改,检测效果也明显提升。 展开更多
关键词 生成对抗网络 图像擦除 文本风格迁移 篡改检测定位 数据增广
在线阅读 下载PDF
基于KShape数据增广与混合神经网络的注水系统故障诊断 被引量:1
5
作者 于继飞 姬煜晨 +5 位作者 常振宁 隋先富 曹砚锋 杨阳 彭建霖 李昂 《科学技术与工程》 北大核心 2024年第24期10235-10243,共9页
为解决海上油田注水系统故障诊断问题,提出基于KShape数据增广与混合神经网络的故障诊断模型。首先采用KShape时间序列聚类算法实现样本数据增广,然后通过融合双向长短时记忆网络(bidirectional long short-term memory network, BiLSTM... 为解决海上油田注水系统故障诊断问题,提出基于KShape数据增广与混合神经网络的故障诊断模型。首先采用KShape时间序列聚类算法实现样本数据增广,然后通过融合双向长短时记忆网络(bidirectional long short-term memory network, BiLSTM)和全卷积神经网络(fully convolutional neural network, FCN)构建混合神经网络模型,最后应用贝叶斯优化算法对模型参数进行全局寻优。结果表明:提出的数据增广方法在数字油田大数据的基础上,能够有效扩充注水系统工况样本。提出的混合神经网络模型较BiLSTM和FCN单一模型效果更好,该模型综合了BiLSTM网络对时间序列数据依赖关系的良好捕捉能力以及FCN网络对局部特征的有效提取能力,较两者在准确率上分别提升4.9%和1.8%。贝叶斯优化方法在寻找更优超参数组合方面有显著效果,为提高模型的鲁棒性和泛化性能起到了重要作用。该方法较传统调参方法在准确率上提升5%,较网格搜索和随机搜索方法分别提升3.7%和1.9%。同时,该方法产生的不同超参数组合下的模型准确率中位数为84.5%,模型准确率在90%以上的占比达到18%。所提出的故障诊断模型,可有效识别地层堵塞、配水器堵塞和油管漏失等故障,为海上油田注水系统故障诊断提供了新的解决方案和有效的技术支持。 展开更多
关键词 KShape 数据增广 混合神经网络 贝叶斯优化 故障诊断 注水系统
在线阅读 下载PDF
基于GAN的车门上饰板表面缺陷检测数据增广算法
6
作者 汪文才 仇梁 徐海福 《制造技术与机床》 北大核心 2024年第7期170-176,共7页
为了解决车门上饰板缺陷检测任务中缺陷数据集过少的问题,文章提出了一种基于生成对抗网络(generative adversarial network,GAN)的缺陷生成模型(condition defect GAN,CDGAN),主要目标是生成具有各种类型缺陷的车门上饰板图像,以增加... 为了解决车门上饰板缺陷检测任务中缺陷数据集过少的问题,文章提出了一种基于生成对抗网络(generative adversarial network,GAN)的缺陷生成模型(condition defect GAN,CDGAN),主要目标是生成具有各种类型缺陷的车门上饰板图像,以增加训练数据的多样性,提高缺陷检测模型的检测性能。CDGAN模型分为两个网络:缺陷生成网络和图像转换网络。缺陷生成网络生成位于数据集边界框内的缺陷图像,图像转换网络将这些缺陷与无缺陷的图像进行合并生成缺陷图像。实验表明,生成的缺陷图像显著提高了YOLOv5模型的缺陷检测能力,在车门上饰板缺陷数据集上取得了94.9%的平均精度(mAP@50)。该方法已经应用在车门上饰板的生产制造中,在实际的工业应用中证明了该方法的可行性。 展开更多
关键词 缺陷检测 数据增广 生成对抗网络 YOLOv5 机器视觉
在线阅读 下载PDF
基于数据增广和CNN的地震随机噪声压制 被引量:72
7
作者 王钰清 陆文凯 +2 位作者 刘金林 张猛 苗永康 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2019年第1期421-433,共13页
卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一... 卷积神经网络(Convolutional Neural Network,CNN)是一种基于数据驱动的学习算法,简化了传统从特征提取到分类的两阶段式处理任务,被广泛应用于计算机科学的各个领域.在标注数据不足的地震数据去噪领域,CNN的推广应用受到限制.针对这一问题,本文提出了一种基于数据生成和增广的地震数据CNN去噪框架.对于合成数据,本文对无噪地震数据添加不同方差的高斯噪声,增广后构成训练集,实现基于小样本的CNN训练.对于实际地震数据,由于无法获得真实的干净数据和噪声来生成训练样本集,本文提出一种直接从无标签实际有噪数据生成标签数据集的方法.在所提出的方法中,我们利用目前已有的去噪方法从实际地震数据中分别获得估计干净数据和估计噪声,前者与未知的干净数据具有相似纹理,后者与实际噪声具有相似的概率分布.人工合成数据和实际数据实验结果表明,相较于F-X反褶积,BM3D和自适应频域滤波算法,本文方法能更好地压制随机噪声和保护有效信号.最后,本文采用神经网络可视化方法对去噪CNN的机理进行了探索,一定程度上解释了网络每一层的学习内容. 展开更多
关键词 卷积神经网络 数据增广 地震噪声压制 神经网络可视化
在线阅读 下载PDF
基于数据增广训练的深度神经网络方法压制地震多次波 被引量:14
8
作者 王坤喜 胡天跃 +2 位作者 刘小舟 王尚旭 魏建新 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2021年第11期4196-4214,共19页
地震数据中存在的多次波影响偏移成像,误导地震资料的解释,因此通常视为相干噪声而被去除.为了对多次波进行智能化衰减,本文提出了一种基于数据增广训练的使用深度神经网络的多次波压制方法.设计的深度神经网络包括卷积编码和卷积解码过... 地震数据中存在的多次波影响偏移成像,误导地震资料的解释,因此通常视为相干噪声而被去除.为了对多次波进行智能化衰减,本文提出了一种基于数据增广训练的使用深度神经网络的多次波压制方法.设计的深度神经网络包括卷积编码和卷积解码过程,其中卷积编码过程学习全波场数据中的一次波特征,卷积解码过程利用这些特征来重构一次波并压制多次波和随机噪声.在训练阶段,旋转训练集并在输入数据中加入随机噪声构成增广训练数据集来提升神经网络的抗噪稳定性和泛化性,通过迁移学习让深度神经网络具备跨工区压制多次波的能力.简单模型与Sigsbee2B模型三套模拟数据的实例验证了本文方法在一次波重构和多次波压制中的有效性、稳定性和良好泛化性;一套崎岖海底模型地震物理模拟数据的应用实例表明本文方法具有应用于复杂条件下压制地震多次波的能力. 展开更多
关键词 深度神经网络 数据增广训练 多次波压制 迁移学习
在线阅读 下载PDF
数据增广的编解码卷积网络地震层间多次波压制方法 被引量:17
9
作者 刘小舟 胡天跃 +3 位作者 刘韬 魏哲枫 谢飞 安圣培 《石油地球物理勘探》 EI CSCD 北大核心 2022年第4期757-767,I0001,共12页
层间多次波压制是地震资料去噪领域的一项前沿技术挑战,对获取高质量数据、了解地下真实构造具有十分重要的意义。现有的层间多次波压制方法耗时长,对人工参数调整要求高,处理低信噪比数据时可能导致层间多次波泄露。为此,提出一种基于... 层间多次波压制是地震资料去噪领域的一项前沿技术挑战,对获取高质量数据、了解地下真实构造具有十分重要的意义。现有的层间多次波压制方法耗时长,对人工参数调整要求高,处理低信噪比数据时可能导致层间多次波泄露。为此,提出一种基于数据增广的编解码卷积神经网络层间多次波压制方法。首先,利用基于虚同相轴的层间多次波压制方法从原始数据中估计出一次波和层间多次波,生成一次波标签数据。然后,构建两种增广训练集:一方面,通过改变训练样本中层间多次波的振幅、极性及旅行时,进行层间多次波波场数据的增广,提高层间多次波压制网络的泛化能力;另一方面,通过对原始数据添加不同信噪比的高斯噪声进行噪声注入的数据增广,提高网络的抗噪性能。最后,结合去噪卷积神经网络(DnCNN)和U形全卷积神经网络(U-Net)的优势搭建了适合层间多次波压制的深层编、解码网络,进行神经网络训练和预测。合成数据和实际数据的处理结果表明,该方法能够有效压制地震层间多次波并保护一次波,具有较强的泛化能力和抗噪性能,可显著提高计算效率。 展开更多
关键词 层间多次波压制 虚同相轴 卷积神经网络 编解码网络 数据增广
在线阅读 下载PDF
机器视觉应用中的图像数据增广综述 被引量:33
10
作者 林成创 单纯 +11 位作者 赵淦森 杨志荣 彭璟 陈少洁 黄润桦 李壮伟 易序晟 杜嘉华 李双印 罗浩宇 樊小毛 陈冰川 《计算机科学与探索》 CSCD 北大核心 2021年第4期583-611,共29页
深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障。收集和准确标注图像数据集是一个极其费时且代价昂贵的过程。随着机器视觉的广泛应用,这个问题将会越来越突出。图像增广技术是... 深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障。收集和准确标注图像数据集是一个极其费时且代价昂贵的过程。随着机器视觉的广泛应用,这个问题将会越来越突出。图像增广技术是一种有效解决深度学习在少量或者低质量训练数据中进行训练的一种技术手段,该技术不断地伴随着深度学习与机器视觉的发展。系统性梳理当前图像增广技术研究,从增广对象、增广空间、标签处理和增广策略生成的角度,分析现有图像增广技术的研究范式。依据研究范式提出现有图像增广技术的分类系统,重点介绍每类图像增广研究的代表性研究成果。最后,对现有图像增广研究进行总结,指出当前图像增广研究中存在的问题及未来的发展趋势。 展开更多
关键词 深度学习 计算机视觉 图像广 数据增广 图像
在线阅读 下载PDF
基于数据增广和模型集成策略的图神经网络在抑郁症识别上的应用 被引量:4
11
作者 杨炳新 郭艳蓉 +1 位作者 郝世杰 洪日昌 《计算机科学》 CSCD 北大核心 2022年第7期57-63,共7页
目前对抑郁症的主流诊断方式是通过医生和患者之间的沟通交流来填写相关的问卷量表,这需要相应的临床知识并且诊断结果存在主观性,给抑郁症诊断带来了很多挑战。利用信息处理技术对生理信号进行分析,构建精准客观的辅助诊断模型具有重... 目前对抑郁症的主流诊断方式是通过医生和患者之间的沟通交流来填写相关的问卷量表,这需要相应的临床知识并且诊断结果存在主观性,给抑郁症诊断带来了很多挑战。利用信息处理技术对生理信号进行分析,构建精准客观的辅助诊断模型具有重要价值,然而目前抑郁症辅助诊断的公共数据集普遍存在样本偏少的情况,使得辅助诊断的精度普遍偏低。基于此,文中提出了一种基于数据增广和模型集成策略的图神经网络的抑郁症识别方法,该方法利用53位受试者的128通道脑电信号(Electroencephalogram,EEG),对采集到的脑电信号进行数据切分并将其用于数据增广后,利用皮尔逊相关系数计算不同通道之间的相关度,从而构造脑网络,并利用图神经网络学习脑网络的特征,然后将得到的预测结果利用模型集成策略进行多数投票,得到受试者最终的预测结果。经过实验证明,所提方法提高了网络的分类能力,解决了因样本小而带来的分类能力差的问题,在兰州大学普适感知与智能系统实验室提供的MODMA数据集(包含24名抑郁症患者和29名正常对照组)上取得了77%的分类准确率,与其他方法相比,所提方法的分类准确率有明显的提升。 展开更多
关键词 抑郁症识别 分类 图神经网络 脑电信号 数据增广 模型集成
在线阅读 下载PDF
基于优化分类的数据增广方法 被引量:9
12
作者 蒋梦莹 林小竹 柯岩 《计算机工程与设计》 北大核心 2018年第11期3559-3563,共5页
为提高卷积神经网络对图像分类的正确率,对数据增广提高网络正确率进行研究,提出优化分类的数据增广方法。通过对测试集所有类别进行分析,找到分类效果不好的单类进行数据扩增,改善网络模型因训练样本少、结构复杂引起分类效果差的现象... 为提高卷积神经网络对图像分类的正确率,对数据增广提高网络正确率进行研究,提出优化分类的数据增广方法。通过对测试集所有类别进行分析,找到分类效果不好的单类进行数据扩增,改善网络模型因训练样本少、结构复杂引起分类效果差的现象。基于Caffe深度学习框架,采用CaffeNet网络模型对Caltech-101和Corel1K数据集进行训练分析,提取图像特征信息,对测试集进行验证,将优化分类前后的测试集正确率进行对比,优化后的正确率有较大的提升。 展开更多
关键词 卷积神经网络 图像分类 数据增广 优化分类 Caffe
在线阅读 下载PDF
结合数据增广和迁移学习的高分辨率遥感影像场景分类 被引量:13
13
作者 乔婷婷 李鲁群 《测绘通报》 CSCD 北大核心 2020年第2期37-42,共6页
深度学习在计算机视觉领域取得了显著的成果,如图像分类、人脸识别、图像检索等。对于遥感领域而言,获取用于训练CNN的有标签数据集通常是一个重大挑战。本文研究了如何将CNN用于高分辨率遥感影像的场景分类,为了克服缺乏大量有标签遥... 深度学习在计算机视觉领域取得了显著的成果,如图像分类、人脸识别、图像检索等。对于遥感领域而言,获取用于训练CNN的有标签数据集通常是一个重大挑战。本文研究了如何将CNN用于高分辨率遥感影像的场景分类,为了克服缺乏大量有标签遥感影像数据集的问题,结合CNN采用了两种技术:数据增广和迁移学习。在UC Merced Land Use数据集上,验证了VGG16、VGG19、Res Net50、InceptionV3、Dense Net121等5种网络的性能,分别达到了98.10%、96.19%、99.05%、97.62%、99.52%的分类准确率。 展开更多
关键词 高分辨率遥感影像 场景分类 卷积神经网络 数据增广 迁移学习
在线阅读 下载PDF
中文开放域问答系统数据增广研究 被引量:2
14
作者 杜家驹 叶德铭 孙茂松 《中文信息学报》 CSCD 北大核心 2022年第11期121-130,共10页
开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能... 开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响。此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果。实验结果表明,该文提出的方法在实际场景下带来了性能提升。 展开更多
关键词 开放域问答 鲁棒性 数据增广
在线阅读 下载PDF
基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别 被引量:12
15
作者 杨鹤 于红 +5 位作者 刘巨升 杨惠宁 孙哲涛 程名 任媛 张思佳 《大连海洋大学学报》 CAS CSCD 北大核心 2021年第4期661-669,共9页
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替... 为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary,DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection,SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection,SPI)进行语料库的数据增广,首先构建“水产品名称”同类词词典和领域同义词词典,通过两个词典分别对“水产品名称”类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力。结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果。研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果。 展开更多
关键词 深度学习 实体识别 数据增广 BERT 双向长短时记忆网络 渔业标准
在线阅读 下载PDF
数据增广和主动学习在波阻抗反演中的应用 被引量:10
16
作者 伊小蝶 吴帮玉 +1 位作者 孟德林 曹相湧 《石油地球物理勘探》 EI CSCD 北大核心 2021年第4期707-715,I0008,共10页
在实际应用中,深度卷积网络以大量数据驱动模型进行网络训练,以获得地震数据与阻抗之间的映射关系,但需大量合成数据对网络训练后,再应用少量实际数据对网络进行迁移学习。为此,提出了一种基于数据增广和主动学习的地震波阻抗反演方法... 在实际应用中,深度卷积网络以大量数据驱动模型进行网络训练,以获得地震数据与阻抗之间的映射关系,但需大量合成数据对网络训练后,再应用少量实际数据对网络进行迁移学习。为此,提出了一种基于数据增广和主动学习的地震波阻抗反演方法。数据增广首先通过同频率重采样对单道原波阻抗数据进行增广,再求取增广后的反射系数和随机核,最后计算增广后的地震数据。将增广后的地震和波阻抗数据作为训练集,结合主动学习思想选择最大误差样本对网络进行迭代训练。该方法不仅可以避免地震子波估计,而且能用少量的标签数据训练出预测精度更高的网络。Marmousi 2模型测试结果表明,该方法仅需十分之一标签数据和迭代次数就能达到与随机迭代训练方法相近的预测精度,且预测误差在剖面上分布更均匀。 展开更多
关键词 波阻抗反演 卷积残差网络 数据增广 深度学习 主动学习
在线阅读 下载PDF
一种基于TimeGAN和OCSVM的多元退化设备小子样数据增广方法 被引量:11
17
作者 孙晨峰 吕卫民 +1 位作者 戴洪德 张浩晨 《电子学报》 EI CAS CSCD 北大核心 2022年第11期2678-2687,共10页
工作在复杂环境下的多元退化设备面临失效数据少、多源信息融合准确度低和监督学习数据不平衡等问题,对此本文提出一种基于时间序列生成对抗网络(Time-series Generative Adversarial Networks,TimeGAN)与单分类支持向量机(One-Class Su... 工作在复杂环境下的多元退化设备面临失效数据少、多源信息融合准确度低和监督学习数据不平衡等问题,对此本文提出一种基于时间序列生成对抗网络(Time-series Generative Adversarial Networks,TimeGAN)与单分类支持向量机(One-Class Support Vector Machine,OCSVM)组合模型的小子样数据增广方法.方法引入了TimeGAN模型拟合真实数据时间序列相关性,从而生成新的多元退化设备数据.本文提出了一种基于最大均值差异改进方法的可信度判据,避免强相关特征对生成数据质量评价的影响,通过使用T-分布随机邻近嵌入(T-distributed Stochastic Neighbor Embedding,T-SNE)和全局最大均值差异(Global Maximum Mean Discrepancy,GMMD)的组合方法,定性定量地评价生成数据的质量水平.基于训练后的OCSVM模型,对生成数据进行异常检测与剔除,进一步提高生成数据的质量.以航空发动机数据集C-MAPSS为例进行方法验证分析,通过与其他数据增强模型对比验证了所提方法的可行性和有效性. 展开更多
关键词 小子样数据 数据增广 多元退化设备 时间序列生成对抗网络 单分类支持向量机
在线阅读 下载PDF
结合Cannikin’s Law的离线数据增广方法研究
18
作者 邓雪 赵皓 +2 位作者 张静 梅菠萍 张华 《计算机工程与应用》 CSCD 北大核心 2023年第1期207-212,共6页
数据增广是提升深度学习模型性能的有效方法之一。针对多类别目标检测任务中检测性能不平衡问题,提出一种针对“短板类别”(检测性能远低于模型平均检测性能的类别)的离线数据增广方法。受Cannikin’s Law的启发,采用基于复制粘贴(copy-... 数据增广是提升深度学习模型性能的有效方法之一。针对多类别目标检测任务中检测性能不平衡问题,提出一种针对“短板类别”(检测性能远低于模型平均检测性能的类别)的离线数据增广方法。受Cannikin’s Law的启发,采用基于复制粘贴(copy-paste)机制的场景多样性增广方法。随机采集训练集中“短板类别”实例区域,通过相似性度量机制选取训练集中增广目标样本进行随机粘贴。为了降低随机粘贴导致的遮挡问题,采用基于自遮挡(cut-replace)机制的增广方法提升模型遮挡表达能力。通过截取样本自身区域,对特征表达最显著区域进行遮挡。实验表明,FCOS目标检测框架在PASCAL VOC数据上的平均检测精度(mean average precision,mAP)从79.10%提升到83.90%,其中短板类别更为显著,提升了20.8个百分点。在MS-COCO数据上平均检测精度提升了0.9个百分点。 展开更多
关键词 数据增广 Cannikin’s Law 相似性度量机制 自遮挡 目标检测
在线阅读 下载PDF
数据增广策略在英语语法纠错中的应用综述 被引量:6
19
作者 孙晓东 杨东强 《计算机工程与应用》 CSCD 北大核心 2022年第7期43-54,共12页
近年来,将语法错误纠正当作机器翻译任务在英语语法纠错领域取得重大进展,对于数据驱动的自然语言处理方法,大规模、高质量的标注语料成为翻译等相关任务最重要的资源。在调查中,主要关注英语语法纠错领域的数据集和数据增广方法。全面... 近年来,将语法错误纠正当作机器翻译任务在英语语法纠错领域取得重大进展,对于数据驱动的自然语言处理方法,大规模、高质量的标注语料成为翻译等相关任务最重要的资源。在调查中,主要关注英语语法纠错领域的数据集和数据增广方法。全面地概括了英语语法纠错领域使用的数据集、数据合成、评价方法及应用现状,并对其进行归纳分析;对今后如何提高英语语法纠错模型的性能进行了总结和展望。 展开更多
关键词 数据驱动 数据增广 英语语法纠错
在线阅读 下载PDF
基于生成对抗神经网络的雷达遥感数据增广方法 被引量:4
20
作者 康旭 张晓峰 《系统仿真学报》 CAS CSCD 北大核心 2022年第4期920-927,共8页
在雷达探测领域,数据样本无论在完备性还是多样性上,均不能满足深度学习模型有效训练的要求,模型极易出现过拟合现象,从而限制了相关技术在雷达探测领域的广泛应用。面向雷达探测领域的智能化应用需求,针对雷达数据样本不足问题,提出基... 在雷达探测领域,数据样本无论在完备性还是多样性上,均不能满足深度学习模型有效训练的要求,模型极易出现过拟合现象,从而限制了相关技术在雷达探测领域的广泛应用。面向雷达探测领域的智能化应用需求,针对雷达数据样本不足问题,提出基于生成对抗神经网络的微波成像体制雷达数据增广方法。针对雷达数据样本特征不显著问题,结合标签平滑正则化方法,实现增广数据样本的自动标注,通过构建增广样本与真实样本协同的深度学习模型训练框架,实现模型在小规模雷达数据样本集上的鲁棒训练。基于公开雷达探测数据集,验证了该方法的有效性。 展开更多
关键词 深度学习 雷达遥感探测 生成对抗神经网络 数据增广
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部