期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于自引导进化策略的高效自动化数据增强算法 被引量:2
1
作者 朱光辉 陈文忠 +2 位作者 朱振南 袁春风 黄宜华 《软件学报》 EI CSCD 北大核心 2024年第6期3013-3035,共23页
深度学习在图像、文本、语音等媒体数据的分析任务上取得了优异的性能.数据增强可以非常有效地提升训练数据的规模以及多样性,从而提高模型的泛化性.但是,对于给定数据集,设计优异的数据增强策略大量依赖专家经验和领域知识,而且需要反... 深度学习在图像、文本、语音等媒体数据的分析任务上取得了优异的性能.数据增强可以非常有效地提升训练数据的规模以及多样性,从而提高模型的泛化性.但是,对于给定数据集,设计优异的数据增强策略大量依赖专家经验和领域知识,而且需要反复尝试,费时费力.近年来,自动化数据增强通过机器自动设计数据增强策略,已引起了学界和业界的广泛关注.为了解决现有自动化数据增强算法尚无法在预测准确率和搜索效率之间取得良好平衡的问题,提出一种基于自引导进化策略的自动化数据增强算法SGES AA.首先,设计一种有效的数据增强策略连续化向量表示方法,并将自动化数据增强问题转换为连续化策略向量的搜索问题.其次,提出一种基于自引导进化策略的策略向量搜索方法,通过引入历史估计梯度信息指导探索点的采样与更新,在能够有效避免陷入局部最优解的同时,可提升搜索过程的收敛速度.在图像、文本以及语音数据集上的大量实验结果表明,所提算法在不显著增加搜索耗时的情况下,预测准确率优于或者匹配目前最优的自动化数据增强方法. 展开更多
关键词 深度学习 数据增强 自动化机器学习 自引导进化策略
在线阅读 下载PDF
基于知识图谱和自动机器学习的软件缺陷预测 被引量:3
2
作者 李鹏宇 江云松 +1 位作者 高猛 滕俊元 《空间控制技术与应用》 CSCD 北大核心 2021年第2期10-16,共7页
不稳定和召回率低效的软件缺陷预测模型难以在行业领域应用,为解决稳定和高效各项性能评价指标的软件缺陷预测模型在工程实践应用的问题,提出了一种基于知识图谱和自动化机器学习的软件缺陷预测方法AutoKGGAS,首先获取软件缺陷预测模型... 不稳定和召回率低效的软件缺陷预测模型难以在行业领域应用,为解决稳定和高效各项性能评价指标的软件缺陷预测模型在工程实践应用的问题,提出了一种基于知识图谱和自动化机器学习的软件缺陷预测方法AutoKGGAS,首先获取软件缺陷预测模型数据,对知识建模、知识获取、知识融合、知识储存与知识计算等知识图谱构建技术研究,实现知识图谱推荐优质软件缺陷预测模型作为自动化搜索的热启动输入条件,根据不同的软件缺陷预测评价指标,优化不同最佳的模型结构.其次实证研究采用NASA开源数据集实验对象和六种性能评价指标,实验结果表明,AutoKGGAS自动化软件缺陷预测模型在不同数据集不同评价指标方面,性能优于知识图谱推荐的传统经典软件缺陷预测模型.自动化软件缺陷预测模型为航天软件缺陷预测辅助代码审查测试提供了原型,在工程实践应用方面具有重要的意义. 展开更多
关键词 知识图谱 数据挖掘 自动化机器学习 软件缺陷预测
在线阅读 下载PDF
自主学习模型提升智能育种精度
3
《农业科技与信息》 2025年第3期55-55,共1页
近日,中国农业科学院作物科学研究所作物智能设计算法模型课题组研发出一套自动化机器学习框架,通过将气象环境大数据与基因组信息深度融合,实现了作物精准遗传分析与基因组预测,为作物智能设计育种提供有效工具。相关研究成果发表在《... 近日,中国农业科学院作物科学研究所作物智能设计算法模型课题组研发出一套自动化机器学习框架,通过将气象环境大数据与基因组信息深度融合,实现了作物精准遗传分析与基因组预测,为作物智能设计育种提供有效工具。相关研究成果发表在《先进科学(Advanced Science)》。 展开更多
关键词 自动化机器学习 基因组信息 智能育种
在线阅读 下载PDF
自动化张量分解加速卷积神经网络 被引量:7
4
作者 宋冰冰 张浩 +3 位作者 吴子锋 刘俊晖 梁宇 周维 《软件学报》 EI CSCD 北大核心 2021年第11期3468-3481,共14页
近年来,卷积神经网络(CNN)展现了强大的性能,被广泛应用到了众多领域.由于CNN参数数量庞大,且存储和计算能力需求高,其难以部署在资源受限设备上.因此,对CNN的压缩和加速成为一个迫切需要解决的问题.随着自动化机器学习(AutoML)的研究... 近年来,卷积神经网络(CNN)展现了强大的性能,被广泛应用到了众多领域.由于CNN参数数量庞大,且存储和计算能力需求高,其难以部署在资源受限设备上.因此,对CNN的压缩和加速成为一个迫切需要解决的问题.随着自动化机器学习(AutoML)的研究与发展,AutoML对神经网络发展产生了深远的影响.受此启发,提出了基于参数估计和基于遗传算法的两种自动化加速卷积神经网络算法.该算法能够在给定精度损失范围内自动计算出最优的CNN加速模型,有效地解决了张量分解中,人工选择秩带来的误差问题,能够有效地提升CNN的压缩和加速效果.通过在MNIST和CIFAR-10数据集上的严格测试,与原网络相比,在MNIST数据集上准确率稍微下降了0.35%,模型的运行时间获得了4.1倍的大幅提升;在CIFAR-10数据集上,准确率稍微下降了5.13%,模型的运行时间获得了0.8倍的大幅提升. 展开更多
关键词 张量分解 卷积神经网络 自动化机器学习 神经网络压缩 神经网络加速
在线阅读 下载PDF
机理-数据融合的造斜率智能预测方法
5
作者 白佳帅 钟尹明 +4 位作者 王立伟 李臻 宋先知 刘子豪 祝兆鹏 《石油机械》 北大核心 2025年第5期1-9,共9页
造斜率的准确预测是进行井眼轨迹调控的基础,直接影响定向井钻井效率,但由于井下力学行为的复杂性,传统预测方法存在一定限制,难以实现精确预测。为此,提出了一种力学-智能模型融合的造斜率预测方法。利用力学模型计算钻头侧向力、钻头... 造斜率的准确预测是进行井眼轨迹调控的基础,直接影响定向井钻井效率,但由于井下力学行为的复杂性,传统预测方法存在一定限制,难以实现精确预测。为此,提出了一种力学-智能模型融合的造斜率预测方法。利用力学模型计算钻头侧向力、钻头转角和极限造斜率并作为主控因素,通过自动化机器学习框架联合其他参数进行拟合预测,从而取代传统方法反演经验系数的过程,使其充分发挥力学模型宏观规律描述准确和智能模型非线性拟合能力强的优势。利用新疆玛湖区块14口井数据进行训练和测试。结果显示,融合力学参数后,模型造斜率最大误差、均方根误差和平均绝对误差分别下降了17%、12%和8%,其中均方根误差和平均绝对误差均小于每30 m 1.00°,表明该方法能够有效提升造斜率预测精度,尤其在造斜率急剧变化的井段表现出更优的预测性能。研究结果可为造斜率的准确预测提供新的思路,同时也可为井眼轨迹的精确调控提供一定的技术支撑。 展开更多
关键词 智能钻井 自动化机器学习 造斜率预测 机理-数据融合 力学参数
在线阅读 下载PDF
基于超级参数调整的网络表示学习算法性能公平比较框架 被引量:5
6
作者 郭梦影 孙振宇 +1 位作者 朱妤晴 包云岗 《计算机学报》 EI CAS CSCD 北大核心 2022年第5期897-917,共21页
网络结构数据在现今生活中广泛存在,但由于数据结构稀疏、规模较大等特性,难以直接利用现有的机器学习算法对数据进行分析.网络表示学习算法的出现,通过将高维数据映射到低维向量空间,解决了上述问题.但是网络表示学习算法中存在大量超... 网络结构数据在现今生活中广泛存在,但由于数据结构稀疏、规模较大等特性,难以直接利用现有的机器学习算法对数据进行分析.网络表示学习算法的出现,通过将高维数据映射到低维向量空间,解决了上述问题.但是网络表示学习算法中存在大量超级参数,参数的选择与数据分析任务密切相关且对算法性能有明显影响,如何针对数据分析任务,通用地对多种网络表示学习算法进行超级参数调整,以获取不同算法的最优性能,实现算法间性能的公平比较,从而选择出最优者对数据进行分析,是一个亟待解决的问题.此外,对算法进行超级参数调整通常需要花费较长时间,且由于网络结构数据规模通常较大,还会有内存占用过高问题的存在,因此如何能够在有资源限制(时间、内存占用)的条件下进行超级参数调整,是面临的另一个问题.基于上述两个问题,本文提出了基于超级参数调整的网络表示学习算法性能公平比较框架JITNREv,能够在有资源限制的条件下通用对多种网络表示学习算法进行超级参数调整,通过获取不同算法针对相同数据分析任务的性能最优值,实现算法之间的性能公平比较.该框架具有4个松耦合且可扩展的组件,组件间仅通过数据流进行交互,并在闭环结构中完成样本的测试优化,满足了框架的通用性.JITNREv基于拉丁超立方采样对超级参数进行采样;根据“当前最优值附近,有更大概率出现更优值”的假设对采样范围进行剪枝;针对超大规模数据集,提出了图粗化方式在保留数据结构的基础上压缩数据规模,满足了资源限制条件下对超级参数进行调整的要求.框架还融合了网络表示学习算法常用的评测数据集、评测指标和数据分析应用,实现了框架的易用性.实验证明JITNREv框架能够在资源限制条件下稳定提高算法性能,例如,针对GCN算法的节点分类任务相比默认参数设置,JITNREv框架能够将性能提升31%. 展开更多
关键词 网络表示学习 网络嵌入 图卷积网络 自动化机器学习 超级参数调整
在线阅读 下载PDF
Canny-Gauss通用域图像隐写算法 被引量:3
7
作者 李季瑀 付章杰 王帆 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期213-230,共18页
自适应图像隐写算法是一种以图像为载体,通过手工设计嵌入失真代价,指导隐写码在图像载体中嵌入秘密消息的信息隐藏算法.长期以来,这类算法将秘密消息尽可能隐藏在图像纹理更深更复杂的位置以对抗基于富特征的隐写分析检测.然而,伴随着... 自适应图像隐写算法是一种以图像为载体,通过手工设计嵌入失真代价,指导隐写码在图像载体中嵌入秘密消息的信息隐藏算法.长期以来,这类算法将秘密消息尽可能隐藏在图像纹理更深更复杂的位置以对抗基于富特征的隐写分析检测.然而,伴随着深度学习在隐写分析领域的快速发展,人工设计的自适应算法受到严重挑战.此外,基于加性失真的隐写编码在嵌入消息时,复杂纹理向边界聚集所产生的统计异常问题也亟待解决.因此,本文总结了各类人工失真代价的优势和不足,归纳出当前自适应算法在空域的设计范式,并结合UNIWARD在各嵌入域的转换规则,提出基于嵌入失真代价ρ的通用域隐写转换公式.然后,从隐写嵌入失真代价与图像纹理稀疏关系的角度出发,以Canny算子划分纹理、Gauss模糊缩放轮廓、AutoML搜索阈值的方式,提出了一种通用域隐写算法Canny Gauss.实验结果表明,本文所提通用域隐写转换公式能够有效应用于现有主流算法.同时,在UNIWARD所有可行嵌入域中,本文所提算法表达出更高嵌入失真代价稳定性和隐写隐蔽性,在第三方权重加持下的深度隐写分析表现与UNIWARD相比至少提升2.6%、最高提升14.6%.这为自适应隐写算法的通用域设计,以及抵抗基于纹理特征的深度隐写分析检测提供了新思路. 展开更多
关键词 自适应隐写术 隐写失真设计 通用域 CANNY算子 自动化机器学习
在线阅读 下载PDF
神经结构搜索的研究进展综述 被引量:8
8
作者 李航宇 王楠楠 +2 位作者 朱明瑞 杨曦 高新波 《软件学报》 EI CSCD 北大核心 2022年第1期129-149,共21页
近年来,深度神经网络(DNNs)在许多人工智能任务中取得卓越表现,例如计算机视觉(CV)、自然语言处理(NLP).然而,网络设计严重依赖专家知识,这是一个耗时且易出错的工作.于是,作为自动化机器学习(AutoML)的重要子领域之一,神经结构搜索(NAS... 近年来,深度神经网络(DNNs)在许多人工智能任务中取得卓越表现,例如计算机视觉(CV)、自然语言处理(NLP).然而,网络设计严重依赖专家知识,这是一个耗时且易出错的工作.于是,作为自动化机器学习(AutoML)的重要子领域之一,神经结构搜索(NAS)受到越来越多的关注,旨在以自动化的方式设计表现优异的深度神经网络模型.全面细致地回顾神经结构搜索的发展过程,进行了系统总结.首先,给出了神经结构搜索的研究框架,并分析每个研究内容的作用;接着,根据其发展阶段,将现有工作划分为4个方面,介绍各阶段发展的特点;然后,介绍现阶段验证结构搜索效果经常使用的数据库,创新性地总结该领域的规范化评估标准,保证实验对比的公平性,促进该领域的长久发展;最后,对神经结构搜索研究面临的挑战进行了展望与分析. 展开更多
关键词 神经结构搜索 自动化机器学习 深度学习 神经网络 规范化评估
在线阅读 下载PDF
InterDroid:面向概念漂移的可解释性Android恶意软件检测方法 被引量:10
9
作者 张炳 文峥 +1 位作者 魏筱瑜 任家东 《计算机研究与发展》 EI CSCD 北大核心 2021年第11期2456-2474,共19页
针对Android恶意软件检测存在特征引入过程主观性高、特征选择过程可解释性差、训练模型检测效果不具备时间稳定性的问题,提出了一种面向概念漂移的可解释性Android恶意软件检测方法InterDroid,该方法首先通过高质量的人工Android恶意... 针对Android恶意软件检测存在特征引入过程主观性高、特征选择过程可解释性差、训练模型检测效果不具备时间稳定性的问题,提出了一种面向概念漂移的可解释性Android恶意软件检测方法InterDroid,该方法首先通过高质量的人工Android恶意软件分析报告引入权限、API包名、意图、Dalvik字节码4种特征.并通过自动化机器学习算法TPOT(tree-based tipeline optimization tool)获得InterDroid训练及对比算法,从而摒弃传统方法中繁复的模型选择与参数调整过程.其后,融入模型解释算法SHAP(shapley additive explanations)改进传统的特征包装方法,从而获得对分类结果具有高贡献度的特征组合用于检测模型训练.最后,通过曼惠特尼U(Mann-Whitney U,MWU)与机器学习模型的双重检验证明概念漂移现象在Android恶意软件检测中的存在性.并基于联合分布适配(joint distribution adaptation,JDA)算法提高检测模型对新时期Android恶意软件的检测准确率.实验表明:InterDroid筛选出的特征组合具备稳定性与可解释性.同时,InterDroid中的特征迁移模块可将自身对2019年、2020年新兴Android恶意软件的检测准确率分别提高46%,44%. 展开更多
关键词 Android恶意软件检测 可解释性 概念漂移 特征迁移 自动化机器学习
在线阅读 下载PDF
基于Azure AutoML的泥沙预报模型构建与应用 被引量:3
10
作者 曹辉 陈柯兵 董炳江 《人民长江》 北大核心 2023年第4期94-100,共7页
泥沙预报是开展水库泥沙实时调度的前提,而水沙作用机理和演进规律的复杂性又导致开展高效、精准的泥沙预报较为困难。基于微软在2018年发布的Azure AutoML自动化机器学习技术,进行了泥沙预报模型构建与应用的探索。选取三峡水库泥沙重... 泥沙预报是开展水库泥沙实时调度的前提,而水沙作用机理和演进规律的复杂性又导致开展高效、精准的泥沙预报较为困难。基于微软在2018年发布的Azure AutoML自动化机器学习技术,进行了泥沙预报模型构建与应用的探索。选取三峡水库泥沙重要控制站——寸滩、清溪场、万县、黄陵庙站构建了含沙量预报模型,并从模型构建与评估、预报精度、输入因子重要性等角度开展了分析。研究结果表明:Azure AutoML技术可便捷地进行自动化机器学习模型的构建,基于该技术建立的预见期为1~3 d的模型针对沙峰消退阶段和含沙量较小阶段预报效果较好;预见期为1~2 d的模型可以对沙峰开展较为准确的预报;寸滩、清溪场站含沙量主要受到上游来沙的影响,而万县、黄陵庙站的含沙量自相关性较强。 展开更多
关键词 泥沙预报 沙峰传播 含沙量 Azure AutoML 自动化机器学习 三峡水库
在线阅读 下载PDF
基于数据集元特征的超参数优化方法 被引量:1
11
作者 焦博扬 王菁 +2 位作者 朱峰 郭浩浩 杨中国 《燕山大学学报》 CAS 北大核心 2023年第3期273-282,共10页
超参数优化问题一直是自动化机器学习研究的重点问题,针对特定的需求建立机器学习模型,需要调整大量的超参数。其中,超参数组合形成了大规模的超参数搜索空间,从而需要大量的运行时间。然而,有效探索大量超参数组合具有一定的挑战,现有... 超参数优化问题一直是自动化机器学习研究的重点问题,针对特定的需求建立机器学习模型,需要调整大量的超参数。其中,超参数组合形成了大规模的超参数搜索空间,从而需要大量的运行时间。然而,有效探索大量超参数组合具有一定的挑战,现有的自动化超参数优化方法时间复杂度很高。为此,利用相似数据集的最优超参数区间的历史知识,提出了一种基于数据集元特征的超参数优化方法。首先,使用自动化机器学习系统寻找最优超参数的区间范围,然后对历史数据集元特征采用递归特征消除法进行特征提取作为特征向量,将此特征向量与最优超参数区间的对应关系利用XGBoost算法建立预测模型,并使用该模型预测新数据集的最优超参数区间。对OpenML平台的数据集进行实验,结果表明该方法预测的最优超参数区间的精度达87%。同时,把此预测区间作为自动化机器学习系统的搜索空间范围,在很大程度上缩短了运行时间,且确保一定的性能。 展开更多
关键词 超参数优化 自动化机器学习 数据集元特征 递归特征消除 特征向量
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部