期刊文献+
共找到1,208篇文章
< 1 2 61 >
每页显示 20 50 100
基于大模型检索增强生成的气象数据库问答模型实现 被引量:4
1
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测 被引量:1
2
作者 陈峥 彭月 +3 位作者 胡竞元 申江卫 肖仁鑫 夏雪磊 《储能科学与技术》 北大核心 2025年第1期319-330,共12页
为解决采用数据驱动的方法对锂离子电池容量进行预测时,难以获取完整充电数据、数据采样精度低和特征因子提取质量不佳等问题,本工作提出了一种基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测方法。首先,为提升数据精度,利用... 为解决采用数据驱动的方法对锂离子电池容量进行预测时,难以获取完整充电数据、数据采样精度低和特征因子提取质量不佳等问题,本工作提出了一种基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测方法。首先,为提升数据精度,利用三次样条插值对充电数据进行补充。其次,通过挖掘充电电压曲线与容量衰退之间的规律,确定特征因子为某充电时间区间的电压增量,并利用增强鲸鱼算法,从短期充电数据中实现了老化特征的有效提取。随后,构建了高斯过程回归容量预测模型,在确定训练数据量后,对比了不同算法的预测结果,验证了所构建模型的有效性。最后,将该方法在不同电池上进行测试,验证了预测精度和泛化能力。结果表明:对于实验室数据集,将前15%老化特征作为训练集时,可将该类电池最大误差控制在2.49%以内,且97%的预测误差控制在1.5%内;对于公开数据集,仅12组训练数据就能将该类电池最大误差控制在1%以内,实现了利用低精度和短期充电数据对电池容量的准确预测。 展开更多
关键词 锂离子电池 短期充电数据 容量预测 增强鲸鱼优化算法 高斯过程回归
在线阅读 下载PDF
基于改进ACGAN算法的带钢小样本数据增强方法 被引量:1
3
作者 师红宇 王嘉鑫 李怡 《计算机集成制造系统》 北大核心 2025年第1期211-218,共8页
为了解决带钢小样本数据集在深度学习中出现的模式崩溃、图像模糊和错判等问题,提出一种改进的ACGAN数据增强方法。首先,模型中引入带梯度惩罚项的Wasserstein距离作为损失函数,解决了模式崩溃和训练不稳定问题;其次,生成器网络中改进... 为了解决带钢小样本数据集在深度学习中出现的模式崩溃、图像模糊和错判等问题,提出一种改进的ACGAN数据增强方法。首先,模型中引入带梯度惩罚项的Wasserstein距离作为损失函数,解决了模式崩溃和训练不稳定问题;其次,生成器网络中改进标签反卷积网络,使标签信息更好地贯穿整个生成网络,并在其末端设计了去噪结构,提高了生成图像质量;接着,判别器网络中引入级联融合思想,增强了网络判别能力;最后,将改进前后的模型在NEU带钢表面缺陷数据集和MNIST数据集上进行对比实验,结果表明:所提模型生成各类样本图像的清晰度、准确性明显提高,并且客观指标FID的平均值在NEU带钢表面缺陷数据集上下降了15.8%,在MNIST数据集下降了73%,为带钢小样本数据集的扩充提供了一种新方法。 展开更多
关键词 图像生成 生成对抗网络 数据增强 小样本
在线阅读 下载PDF
基于压裂信号和数据增强的脆性智能预测方法
4
作者 王婷婷 杜学童 +2 位作者 赵万春 蔡萌 史晓东 《吉林大学学报(地球科学版)》 北大核心 2025年第3期1014-1027,共14页
储层脆性的精确预测对地下岩土工程灾害预警和油气开采具有重要意义。基于岩石受压破裂时产生的声发射信号,提出一种脆性智能预测方法。实验制备4类尺寸相同但脆性不同的岩石进行室内单轴岩石压裂,将采集到的破裂信号经预处理后制作样... 储层脆性的精确预测对地下岩土工程灾害预警和油气开采具有重要意义。基于岩石受压破裂时产生的声发射信号,提出一种脆性智能预测方法。实验制备4类尺寸相同但脆性不同的岩石进行室内单轴岩石压裂,将采集到的破裂信号经预处理后制作样本数据集。针对训练数据不足和传统数据增强方法的局限性等问题,在深度卷积生成对抗网络(deep convolutional generative adversarial networks,DCGAN)的基础上进行改进,设计一种基于谱归一化的深度卷积注意力生成对抗网络(CS-DCGAN)模型,输出高质量样本时频图像,丰富原始样本数据集,作为残差网络的输入;对图像的有效信息进行特征提取、学习、迭代训练以建立脆性智能预测模型,通过不断调整模型的超参数以提高模型预测精度;最后进行多指标评估。实验结果表明,相较于传统DCGAN,CS-DCGAN生成的样本质量较高,FID(Frechet inception distance)最小值为67.96,能够缓解过拟合等问题,提高了残差网络的性能,对不同脆性的平均识别准确率最高可达94.95%,证明了所提方法的有效性。 展开更多
关键词 岩石脆性 声发射信号 生成对抗网络 残差网络 数据增强
在线阅读 下载PDF
基于CTGAN数据增强的土石坝溃坝峰值流量预测
5
作者 李炎隆 田智雯 +2 位作者 张野 邱文 王婷 《水利水电科技进展》 北大核心 2025年第3期70-76,共7页
为准确预测土石坝溃坝峰值流量,建立了包含156个土石坝溃坝案例的数据库,并基于溃坝过程和相关性分析,选取坝型、溃坝模式、溃口以上水深和溃口以上库容为预测洪峰流量的控制变量。由于数据量有限且溃坝数据难以获取,使用条件表格生成... 为准确预测土石坝溃坝峰值流量,建立了包含156个土石坝溃坝案例的数据库,并基于溃坝过程和相关性分析,选取坝型、溃坝模式、溃口以上水深和溃口以上库容为预测洪峰流量的控制变量。由于数据量有限且溃坝数据难以获取,使用条件表格生成对抗网络(CTGAN)增强土石坝溃坝数据,以增加样本多样性,丰富模型训练信息,并提高泛化能力。基于增强数据,采用CatBoost算法构建溃坝峰值流量预测模型。结果表明,基于增强数据建立的模型预测精度更高,拟合系数达0.93,展现出卓越的预测性能。结合可解释机器学习(SHAP)模型分析发现溃口以上库容对峰值流量的影响最为显著,溃口以上水位次之。 展开更多
关键词 土石坝 峰值流量 CTGAN 数据增强 CatBoost SHAP
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
6
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
融合数据增强的互花米草入侵关联要素实体识别方法
7
作者 李忠伟 张文丰 +1 位作者 李永 李明轩 《计算机工程与设计》 北大核心 2025年第2期603-609,共7页
为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要... 为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要素的上下文信息;使用BiLSTM进一步提取特征,利用CRF得到实体的标签约束。通过对比不同模型在自建数据集上的精确率、召回率和F1分数,验证了该模型在互花米草入侵领域实体识别的有效性。 展开更多
关键词 命名实体识别 互花米草入侵 深度学习 数据增强 预训练模型 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于个性化数据增强的自监督序列推荐算法
8
作者 王帅 史艳翠 《计算机工程》 北大核心 2025年第8期190-202,共13页
序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题... 序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题,提出融合用户偏好的个性化数据增强方法,通过用户评分引导增强过程,同时对长、短序列使用不同的增强方法组合,生成符合用户偏好的增强序列;其次,为了缓解训练中出现的数据特征学习不平衡问题,设计一种混合增强训练法,在训练前期,通过随机选择增强方法生成增强序列,提高模型的性能和泛化能力,在训练后期,选择与原始序列相似度较高的增强序列,使模型全面学习用户的实际偏好和行为模式;最后,将传统的序列预测目标与SSL目标相结合,推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证,结果表明,相较于基线模型中的最优结果,所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%,NDCG@5指标分别提升了11.40%、3.50%和2.16%,上述实验结果验证了该方法的合理性和有效性。 展开更多
关键词 序列推荐 自监督学习 数据增强 推荐系统 数据特征
在线阅读 下载PDF
基于神经质量模型的运动想象脑电数据增强
9
作者 付荣荣 孟云 +2 位作者 黄晓东 陈浩 吴娜 《计量学报》 北大核心 2025年第5期762-768,共7页
针对脑机交互系统发展中数据不足的问题,通过神经质量模型合成事件相关去同步(ERD)和事件相关同步(ERS)特征,节省模型训练时间,避免数据过拟合。引入了基于脑同侧运动感觉区μ/β节律的ROI神经元群模型,调整幅值的加减常数后,生成模拟ER... 针对脑机交互系统发展中数据不足的问题,通过神经质量模型合成事件相关去同步(ERD)和事件相关同步(ERS)特征,节省模型训练时间,避免数据过拟合。引入了基于脑同侧运动感觉区μ/β节律的ROI神经元群模型,调整幅值的加减常数后,生成模拟ERD/ERS信号。实验证明,模拟信号与真实信号在共空间模式特征上相似,滤波和共空间模式特征提取后的机器学习分类准确率接近真实数据。混合不同比例的模拟和真实数据,对分类准确率的影响不大,验证了基于神经质量模型的模拟信号对ERD/ERS信号进行数据增强的有效性。这一方法有望在小样本数据集下用于算法创新和检验,同时可以缩短实验时间,为脑机交互系统的发展提供有力支持。 展开更多
关键词 脑机交互 数据增强 脑电信号 神经元群模型 事件相关同步 事件相关去同步
在线阅读 下载PDF
基于数据增强的轴向柱塞泵故障诊断
10
作者 钟金豹 孟祥一 +3 位作者 范浩熙 王永鹏 冯相龙 张剑 《机床与液压》 北大核心 2025年第13期153-159,共7页
针对轴向柱塞泵故障诊断中因故障样本稀缺及数据分布不均衡导致的模型泛化能力不足的问题,提出一种基于Wasserstein生成对抗网络(WGAN-GP)进行数据增强的方法,以解决轴向柱塞泵故障数据提取难的问题。通过AMESim软件模拟不同轴向柱塞泵... 针对轴向柱塞泵故障诊断中因故障样本稀缺及数据分布不均衡导致的模型泛化能力不足的问题,提出一种基于Wasserstein生成对抗网络(WGAN-GP)进行数据增强的方法,以解决轴向柱塞泵故障数据提取难的问题。通过AMESim软件模拟不同轴向柱塞泵故障状态,并采集相应的流量信号和压力信号。利用高斯噪声和WGAN-GP对采集的数据进行增强,以提高样本数据的数量和质量。提取时域、频域和小波包能量特征作为初始特征参数,并将其输入长短期记忆网络(LSTM)进行故障模式识别和分类。结果表明:该方法在故障样本较少的情况下,能有效提高故障诊断的准确率和模型的泛化能力;对流量信号进行故障诊断时,数据增强前的最高识别准确率为86.84%,应用WGAN-GP算法对训练集数据进行数据增强后的识别准确率最高达98.72%;对压力信号进行故障诊断时,数据增强前的识别最高准确率为88.89%,应用WGAN-GP算法对训练集数据进行数据增强后的识别准确率最高达95.65%。数据增强算法对于提高故障诊断模型的识别准确率具有重大意义。 展开更多
关键词 轴向柱塞泵 故障诊断 特征提取 数据增强
在线阅读 下载PDF
基于动态前缀提示及数据增强的情感四元组提取方法
11
作者 钟将 刘雨轩 +3 位作者 戴启祝 王佳祺 赖心怡 胡雯月 《计算机学报》 北大核心 2025年第5期1082-1099,共18页
在方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)中,情感四元组提取是一个能全面分析情感且最具挑战性的任务。当前基于生成式的方法存在两方面局限性:(1)依赖于提示设计,无法针对任务动态优化,导致提示次优的问题;(2)未能充... 在方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)中,情感四元组提取是一个能全面分析情感且最具挑战性的任务。当前基于生成式的方法存在两方面局限性:(1)依赖于提示设计,无法针对任务动态优化,导致提示次优的问题;(2)未能充分解决隐含情感数据不平衡的问题,导致在处理这类数据时性能不佳。为解决这些问题,本文提出了一种动态前缀提示方法(Dynamic Prefix Prompt),该方法利用可调整的前缀和注意力机制来动态优化提示。此外,本文设计了一种基于大语言模型的数据增强策略,该策略通过微调的方式来对齐数据扩充任务以平衡隐含情感数据。在两个真实应用的数据集上的实验表明,本文所提出的方法在Restaurants-ACOS和Laptop-ACOS数据集上F1分数分别提升3.60和2.20,同时在隐含情感数据中F1分数平均提升了4.23和4.67,达到目前最先进的水平,验证了本文方法的有效性和优越性。 展开更多
关键词 方面级情感分析 情感四元组提取 动态前缀提示 隐含情感数据 大语言模型 数据增强
在线阅读 下载PDF
融合大语言模型和数据增强的文本情感分类模型研究
12
作者 杨巍 肖强 《情报杂志》 北大核心 2025年第8期172-179,197,共9页
[研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比... [研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比学习技术,提升样本的多样性和情感语义表征准确性。[研究结果/结论]实验结果表明,LLMGen4Sent在ChnSentiCorp和IMDB数据集上均取得了优异的性能;相对TextCNN模型,ACC准确率提升了12.22%、12.99%;相对Bert模型,ACC准确率提升了5.72%、5.88%;同时,通过消融实验也论证了LLMGen4Sent模型中各个模块的有效性。LLMGen4Sent模型能够有效捕捉文本的深层情感特征,并通过生成式数据增强技术和对比学习技术显著提高现有文本情感分类模型的准确性。 展开更多
关键词 情感分类模型 大语言模型 内容理解 数据增强 LLMGen4Sent
在线阅读 下载PDF
基于数据增强和优化DHKELM的短期光伏功率预测
13
作者 郭利进 马粽阳 胡晓岩 《太阳能学报》 北大核心 2025年第8期463-471,共9页
针对不同气象条件数据质量差异较大且光伏功率呈高波动性难以预测等问题,提出添加随机噪声的数据增强方法(DA)和改进的神经网络组合模型。首先利用谱聚类算法将光伏数据按不同气象条件进行分类,随后通过添加与输入同形状的随机噪声方法... 针对不同气象条件数据质量差异较大且光伏功率呈高波动性难以预测等问题,提出添加随机噪声的数据增强方法(DA)和改进的神经网络组合模型。首先利用谱聚类算法将光伏数据按不同气象条件进行分类,随后通过添加与输入同形状的随机噪声方法提升数据集的规模与质量。针对深度混合核极限学习机(DHKELM)超参数多等问题,提出融合佳点集初始化、黄金正弦更新策略、非线性扰动和最优个体自适应扰动的改进鹈鹕优化算法(IPOA)对其超参数寻优。最后以青海共和县光伏园内某电站数据为例,结果表明基于数据增强的改进鹈鹕算法优化深度混合核极限学习机(DA-IPOA-DHKELM)模型在不同天气、季节条件下预测误差最小,拟合度均能达到90%以上,改进模型预测精度高、算法适用性强。 展开更多
关键词 光伏功率 预测 聚类分析 数据增强 深度混合核极限学习机 改进算法
在线阅读 下载PDF
基于GAN目标数据增强的海面小目标检测
14
作者 尹翔 李婉华 《现代雷达》 北大核心 2025年第4期20-28,共9页
由于海面存在大量背景杂波,以及目标的多样性,海面小目标检测一直是一个具有挑战性的问题。近年来,基于深度学习的海面小目标检测逐渐流行,具有较好的性能。然而,这类方法严重依赖于训练样本的数量和质量,通常情况下,目标样本数量远少... 由于海面存在大量背景杂波,以及目标的多样性,海面小目标检测一直是一个具有挑战性的问题。近年来,基于深度学习的海面小目标检测逐渐流行,具有较好的性能。然而,这类方法严重依赖于训练样本的数量和质量,通常情况下,目标样本数量远少于海杂波样本数量,这会给训练带来困难同时降低检测性能。基于此,文中提出了一种基于目标数据增强的海面小目标检测方法。通过对目标的时频特征进行分析,基于生成对抗网络(GAN)生成相似的特征分布样本,从而扩展目标数据集,缩小目标样本和海杂波样本之间的数量差距,使更多的目标信息被用于检测器的训练过程中,以提高检测器性能。在IPIX数据集上的实验结果表明该方法可以获得更好的检测性能,及所提出的检测器可以实现虚警率的控制。 展开更多
关键词 数据增强 生成对抗网络 卷积神经网络 小目标检测 可控虚警
在线阅读 下载PDF
基于大语言模型的自杀意念文本数据增强与识别技术 被引量:2
15
作者 章彦博 黄峰 +2 位作者 莫柳铃 刘晓倩 朱廷劭 《心理学报》 北大核心 2025年第6期987-1000,I0011,共15页
自杀已成为全球性公共卫生难题,传统的自杀意念识别方法主要依赖患者主动求助,而基于文本分析的自动识别模型则受限于标注数据的稀缺性。本研究创新性地提出一种基于大语言模型的数据增强方法,旨在提升自杀意念文本识别的精度。研究采... 自杀已成为全球性公共卫生难题,传统的自杀意念识别方法主要依赖患者主动求助,而基于文本分析的自动识别模型则受限于标注数据的稀缺性。本研究创新性地提出一种基于大语言模型的数据增强方法,旨在提升自杀意念文本识别的精度。研究采用双阶段设计:研究1聚焦于数据增强,研究2验证增强效果。在研究1中,选用ChatGLM3-6B和Qwen-7B-Chat作为底层模型,结合有监督学习策略与零样本和少样本学习方法,优化训练数据集质量。通过8组严谨的对比实验,结果显示两类自研模型在数据增强方面表现卓越,其处理后数据集的综合得分分别达到0.90和0.92,显著优于基线模型(p<0.001)。研究2进一步评估了数据增强对识别模型性能的影响,结果表明,增强后的模型在识别准确率和正确拒绝率指标上全面超越最佳基线模型(p<0.001)。本研究不仅验证了基于大语言模型的数据增强方法在提升自杀意念识别模型性能方面的有效性,还为心理健康领域的人工智能应用开辟了新方向。这种方法有望在保护用户隐私的同时,提供及时、有效的自杀风险早期预警,为自杀预防工作提供重要的技术支持和研究思路。未来研究可着眼于扩大数据异质性、优化提示工程设计、引入人机交互范式等,进一步拓展该方法在促进临床心理诊断领域的应用。 展开更多
关键词 自杀意念 数据增强 自杀文本识别 大语言模型 人工智能
在线阅读 下载PDF
面向深度学习的图像数据增强综述 被引量:6
16
作者 杨锁荣 杨洪朝 +1 位作者 申富饶 赵健 《软件学报》 北大核心 2025年第3期1390-1412,共23页
深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用... 深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用于图像数据的必要环节.系统地回顾不同的图像数据增强方法,并提出一个新的分类方法,为研究图像数据增强提供了新的视角.从不同的类别出发介绍各类数据增强方法的优势和局限性,并阐述各类方法的解决思路和应用价值.此外,还介绍语义分割、图像分类和目标检测这3种典型计算机视觉任务中常用的公共数据集和性能评价指标,并在这3个任务上对数据增强方法进行实验对比分析.最后,讨论当前数据增强所面临的挑战和未来的发展趋势. 展开更多
关键词 深度学习 图像数据增强 图像识别 泛化性能 计算机视觉
在线阅读 下载PDF
基于数据增强与机器学习的路面构造深度预测研究 被引量:1
17
作者 吴桠楠 王超 朱兴一 《东南大学学报(自然科学版)》 北大核心 2025年第4期1088-1099,共12页
为精准预测路面构造深度,基于路面状况、气候条件、交通荷载、集料类型4类数据,开发了一种路面构造深度预测方法。根据长期路面性能数据库中的小样本数据,利用PchipInterpolator插值法扩充多段点数据,获得7339组数据。基于该数据集和12... 为精准预测路面构造深度,基于路面状况、气候条件、交通荷载、集料类型4类数据,开发了一种路面构造深度预测方法。根据长期路面性能数据库中的小样本数据,利用PchipInterpolator插值法扩充多段点数据,获得7339组数据。基于该数据集和12个特征输入,开发了XGBoost、AdaBoost、ExtraTrees、Light‐GBM、RandomForest、TCN六种机器学习模型以预测路面构造深度。结果显示,XGBoost回归模型性能最佳,训练集和测试集的决定系数分别为0.998和0.968,故优先选用XGBoost回归模型进行预测分析。数据增强显著提升了各模型的预测精度,且对TCN回归模型的积极影响最大,可提升51.09%。利用SHAP方法解释模型特征的重要性,其中影响因素排名前6位的依次为厚度、平均温度、第9类卡车交通量、4.75 mm筛孔通过率、重型卡车交通量和0.075mm筛孔通过率。特征选择分析结果显示,特征数量为9时的预测精度较特征数量为12时略有下降,但当特征数量减少至6时,模型预测精度显著降低。 展开更多
关键词 路面工程 构造深度预测 机器学习 数据增强 路面抗滑
在线阅读 下载PDF
基于多尺度注意力和数据增强的细胞核分割 被引量:1
18
作者 张兴鹏 何东 +1 位作者 杨模 叶杭滨 《计算机工程》 北大核心 2025年第2期387-396,共10页
U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在... U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在利用注意力机制可调整网络学习方向的特点和多尺度特征融合来有效缓解语义偏差。MSAF模块在前2个阶段使用通道注意力来捕获全局特征;在后2个阶段使用空间注意力来捕获局部特征;最后将多个阶段提取的特征进行融合以增强特征信息。此外,提出基于傅里叶变换的数据增强(FTDA)方法解决医学分割数据集稀少的问题。FTDA通过扰动输入图像在频域中的幅度信息实现其相位信息的数据增强。在MoNuSeg、CryoNuSeg和2018 Data Science Bowl数据集上的实验结果表明,提出方法的mIoU和Dice指标比其他先进方法表现出更好的性能。此外,提出的FTDA方法对小规模数据集也具有较好的增益效果。 展开更多
关键词 注意力机制 U-Net模型 傅里叶变换 细胞核分割 数据增强
在线阅读 下载PDF
基于改进GAN的闸门结构数据增强研究
19
作者 黄建章 张钰奇 +1 位作者 铁瑛 徐平 《水电能源科学》 北大核心 2025年第1期103-107,共5页
为保证大坝闸门的正常运行,需在闸门上布置大量传感器进行健康监测。然而在实际运行中,由于闸门所处的工作环境恶劣,经常造成传感器所采集数据发生缺失,导致采集的数据样本不充足,不具有代表性。对此,基于传统的生成对抗网络(GAN)算法,... 为保证大坝闸门的正常运行,需在闸门上布置大量传感器进行健康监测。然而在实际运行中,由于闸门所处的工作环境恶劣,经常造成传感器所采集数据发生缺失,导致采集的数据样本不充足,不具有代表性。对此,基于传统的生成对抗网络(GAN)算法,提出了Attention-GAN算法对原始数据进行扩充。试验结果表明,Attention-GAN算法生成样本与原始样本之间的相似性比传统的GAN算法得到了明显提高,其中平均余弦相似度在闸门数据集上相较于GAN提高了9.87%。可见该算法能够有效地实现小样本露顶式闸门加速度数据增强。 展开更多
关键词 Attention-GAN 数据增强 结构数据 VMD去噪
在线阅读 下载PDF
基于多阶段生成对抗网络的六足机器人故障数据增强
20
作者 张志强 斯帅 +3 位作者 佃松宜 赵涛 郭斌 刘佳 《机床与液压》 北大核心 2025年第11期1-9,共9页
六足机器人在实际运维工作中,很难采集到足够的故障数据,这导致故障数据存在不平衡,并严重影响故障诊断的效果。针对六足机器人实际应用中故障数据不平衡影响深度学习模型训练导致故障诊断精度低的问题,提出一种多阶段生成对抗网络数据... 六足机器人在实际运维工作中,很难采集到足够的故障数据,这导致故障数据存在不平衡,并严重影响故障诊断的效果。针对六足机器人实际应用中故障数据不平衡影响深度学习模型训练导致故障诊断精度低的问题,提出一种多阶段生成对抗网络数据增强算法。将多传感器的时序数据作为时间序列生成对抗网络(TimeGAN)的输入,生成具有时间动态特征的序列数据;将时间序列生成对抗网络合成的数据代替带梯度惩罚WGAN生成对抗网络(WGAN-GP)中的噪声输入数据,且判别器将图卷积网络、长短时记忆网络和注意力机制结合,更有效地挖掘多源异构传感数据的时空相关性,增强对时序数据的判别能力。实验结果表明:所提算法能有效生成具有高质量、多样性的时序特征数据;与同类型的算法相比,能显著提高故障诊断的准确率。 展开更多
关键词 数据增强 故障诊断 TimeGAN WGAN-GP
在线阅读 下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部