期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于RetinaNet和类别平衡采样方法的销钉缺陷检测 被引量:12
1
作者 王凯 王健 +2 位作者 刘刚 周文青 陈佳 《电力工程技术》 2019年第4期80-85,共6页
传统的无人机巡检航拍图中的电力连接金具销钉缺陷检测依赖人工进行标注,针对此问题,借助深度学习缺陷检测算法RetinaNet自动提取正常、缺陷样本的特征,完成低层特征和顶层特征的融合,实现销钉缺陷的自动标注。考虑到现实情况中缺陷类... 传统的无人机巡检航拍图中的电力连接金具销钉缺陷检测依赖人工进行标注,针对此问题,借助深度学习缺陷检测算法RetinaNet自动提取正常、缺陷样本的特征,完成低层特征和顶层特征的融合,实现销钉缺陷的自动标注。考虑到现实情况中缺陷类别样本数量远少于正常类别样本数量,首先分析了缺陷数据不足引起的类别失衡对识别结果的影响,结果表明该情况下训练好的模型将会使得大量缺陷样本被错误地识别为正常类。于是,在数据层面采用类别平衡采样方法,确保每个类别参与训练的机会均衡,实验结果表明,所提的方法能够在维持销钉正常类的高识别率前提下,明显提高缺陷类别的平均准确率。 展开更多
关键词 深度学习 类别失衡 类别平衡采样 平均准确率
在线阅读 下载PDF
基于随机平衡采样的不确定大数据流在线分类算法
2
作者 杨知玲 《现代电子技术》 2023年第19期125-128,共4页
不确定大数据流具有动态性和不平衡性特点,导致分类结果不精准,为此提出基于随机平衡采样的不确定大数据流在线分类算法。根据Spark框架大数据筛选结构,过滤筛选不确定大数据,释放不满足条件的大数据。应用Hoeffding算法计算实际值与观... 不确定大数据流具有动态性和不平衡性特点,导致分类结果不精准,为此提出基于随机平衡采样的不确定大数据流在线分类算法。根据Spark框架大数据筛选结构,过滤筛选不确定大数据,释放不满足条件的大数据。应用Hoeffding算法计算实际值与观测值之差,判断差值与属性差值之间的关系,确定最佳分类属性。随机设定最小类别与最大类别数目,对非平衡样本抽样,避免因样本规模过大而造成的样本损失。建立在线分类器,逐级筛选不确定大数据。通过计算不确定信息增益,获取归类最大可能性类别,实现大数据流的在线分类。由实验结果可知,该算法对数据集W1、W2、W3分类的准确率最低值分别达到90%、94%、83%,具有精准分类效果。 展开更多
关键词 随机平衡采样 不确定 大数据流 在线分类 属性差值 最佳分类属性
在线阅读 下载PDF
低温机械灌注参数与移植物功能延迟恢复的非线性关系分析及基于采样算法优化预测模型的构建
3
作者 董博清 王崇峰 +8 位作者 赵雨亭 毕焕京 王颖 王靖雯 陈祖涵 马睿阳 薛武军 李杨 丁小明 《器官移植》 北大核心 2025年第4期582-590,共9页
目的分析低温机械灌注(HMP)参数与移植物功能延迟恢复(DGF)的非线性关系,优化DGF预测模型的构建。方法回顾性分析923例接受公民逝世后器官捐献肾移植的受者资料,根据DGF的发生情况分为DGF组(823例)和非DGF组(100例)。分析两组供者资料、... 目的分析低温机械灌注(HMP)参数与移植物功能延迟恢复(DGF)的非线性关系,优化DGF预测模型的构建。方法回顾性分析923例接受公民逝世后器官捐献肾移植的受者资料,根据DGF的发生情况分为DGF组(823例)和非DGF组(100例)。分析两组供者资料、HMP参数及受者资料。基于限制性立方样条(RCS)探索HMP参数与DGF发生间的非线性关系。采用过采样、欠采样及平衡采样解决DGF比例不平衡问题,以构建逻辑回归预测模型。在验证集中比较各个模型的曲线下面积(AUC),并绘制列线图模型。结果DGF组供者BMI、供肾冷缺血时间及HMP参数(初始和终末压力、阻力,灌注时间)等变量与非DGF组差异均有统计学意义(均为P<0.05)。RCS分析显示HMP参数与DGF风险存在拐点式非线性关系。基于不同采样方式构建的模型中,平衡采样模型具有最高AUC。利用该模型构建列线图模型,将受者依据风险评分分组,高风险组受者肾移植术后1、6、12个月血清肌酐水平高于低风险组受者(均为P<0.05)。结论HMP参数与DGF风险存在非线性关系,其阈值有助于器官质量评估以及移植后的移植物功能监测。基于平衡采样算法构建的DGF预测模型有助于肾移植围手术期决策及术后移植物功能监测。 展开更多
关键词 肾移植 移植物功能延迟恢复 低温机械灌注 限制性立方样条 非线性关系 列线图 平衡采样 血清肌酐
在线阅读 下载PDF
基于低维度平衡态采样的线缆装配路径规划 被引量:4
4
作者 刘佳顺 刘检华 +1 位作者 林海立 马江涛 《计算机集成制造系统》 EI CSCD 北大核心 2017年第10期2192-2199,共8页
针对复杂产品中柔性线缆装配路径自动求解困难的问题,提出一种基于低维度平衡态采样的线缆装配路径自动求解方法。该方法首先建立了基于Cosserat弹性杆理论的线缆物理属性模型,通过引入"引导路径"对线缆类可变形体运动规划的... 针对复杂产品中柔性线缆装配路径自动求解困难的问题,提出一种基于低维度平衡态采样的线缆装配路径自动求解方法。该方法首先建立了基于Cosserat弹性杆理论的线缆物理属性模型,通过引入"引导路径"对线缆类可变形体运动规划的高维度问题进行降维,在沿"引导路径"的低维度空间中,以线缆两端约束参数进行随机采样并构建路径图,并通过路径图中满足限定条件构型的搜索获得可行的线缆装配路径。最后,设计并开发了线缆装配路径自动求解原型系统,通过算例测试和实例验证了所提方法的可行性及效果。 展开更多
关键词 线缆 装配路径规划 低维度平衡采样 Cosserat弹性杆
在线阅读 下载PDF
基于因果推断的两阶段长尾分类研究 被引量:1
5
作者 曹小敏 刘进锋 《郑州大学学报(理学版)》 CAS 北大核心 2024年第5期31-38,共8页
为了解决数据的长尾分布容易造成网络模型识别准确度下降的问题,提出了一种基于因果推断的两阶段长尾分类模型。首先采用重加权的方法去除特征和标签之间可能存在的虚假关联;其次通过平衡微调进一步提升模型在少样本尾部类别识别的准确... 为了解决数据的长尾分布容易造成网络模型识别准确度下降的问题,提出了一种基于因果推断的两阶段长尾分类模型。首先采用重加权的方法去除特征和标签之间可能存在的虚假关联;其次通过平衡微调进一步提升模型在少样本尾部类别识别的准确率。模型可分为两个阶段:第一阶段设计了具有迭代优化效果的去相关样本重加权算法以去除虚假相关,达到稳定预测的效果;第二阶段设计了基于CAM的类平衡采样算法进行平衡微调训练,使来自不平衡数据集的学习特征在所有类别之间转移和重新平衡,以提高模型在尾部类别的分类性能。实验结果证明了模型具有较优的性能,同时,无论从理论层面还是数据层面都具有较好的可解释性。 展开更多
关键词 长尾分布 因果推断 去相关 平衡采样 可解释性
在线阅读 下载PDF
顾及样本均衡性的松材线虫病疫木识别研究 被引量:1
6
作者 卢涛 《山东林业科技》 2024年第6期82-87,共6页
松材线虫病是一种快速传播的毁灭性森林病害,其防控关键在于及时开展疫木监测。针对在喀斯特山区林地中目标尺度小、干扰因素多导致候选框生成困难和样本不均衡的问题,提出一种基于IoU采样平衡的疫木检测算法SB-HEM(sampling-balance-ba... 松材线虫病是一种快速传播的毁灭性森林病害,其防控关键在于及时开展疫木监测。针对在喀斯特山区林地中目标尺度小、干扰因素多导致候选框生成困难和样本不均衡的问题,提出一种基于IoU采样平衡的疫木检测算法SB-HEM(sampling-balance-based hard example mining,SB-HEM),并从检测精度、检测速度两个方面分别对比分析评价SB-HEM各部分的检测性能。实验表明:SB-HEM疫木检测的F1值和mAP分别为78.96%、81.66%,SB-HEM有效提高了网络模型识别负样本的能力,从而实现了松材线虫病疫木精准识别,为松材线虫病防控提供了技术参考。 展开更多
关键词 松材线虫病 Faster R-CNN 正负样本 采样平衡
在线阅读 下载PDF
基于RB-XGBoost算法的智能电网调度控制系统健康度评价模型 被引量:41
7
作者 谈林涛 李军良 +4 位作者 任昺 何杨 高欣 徐建航 黄晴晴 《电力自动化设备》 EI CSCD 北大核心 2020年第2期189-195,共7页
针对智能电网调度控制系统(D5000系统)健康度评价,基于专家经验的传统评价方法存在主观性较大的问题,机器学习多分类方法是提高评价客观性的一种有效手段,但健康度各等级样本数目间存在的不平衡问题导致分类准确率较低,为此提出一种基... 针对智能电网调度控制系统(D5000系统)健康度评价,基于专家经验的传统评价方法存在主观性较大的问题,机器学习多分类方法是提高评价客观性的一种有效手段,但健康度各等级样本数目间存在的不平衡问题导致分类准确率较低,为此提出一种基于随机平衡和极端梯度提升(RB-XGBoost)算法的D5000系统健康度评价模型。首先,针对系统各评价等级样本数目严重不平衡的问题,提出一种自适应随机平衡(RB)的混合采样方法,分别以等级间样本数目的最大值、最小值作为采样区间的上、下限,生成多个随机数对各等级样本数据进行欠采样或过采样,增加训练数据的多样性并降低其不平衡程度;然后,训练平衡后的样本数据,建立极端梯度提升(XGBoost)算法子模型,考虑到各子模型重要度的一致性,提出采用硬投票方式集成所有子模型,得到与D5000系统各子模块对应的评价模型;最后,根据该系统指标层级关系,在评价过程中采用并、串行结合的计算方式,构建包含17个RB-XGBoost模型的D5000系统整体健康度评价模型。8组KEEL数据库中多类不平衡数据集的实验结果表明,与现有同类典型方法相比,所提方法的平均分类准确率最高提升了6.79%,平均提升了2.03%;某网省级D5000系统的实时采集数据验证了所提方法的有效性。 展开更多
关键词 智能电网 D5000系统 健康度评价 多分类 自适应随机平衡采样 XGBoost算法
在线阅读 下载PDF
基于BTS数据集的航班延误分类和预测算法 被引量:2
8
作者 郭海州 杨晶晶 +2 位作者 吴季达 张彬 黄铭 《科学技术与工程》 北大核心 2023年第12期5304-5311,共8页
针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(syn... 针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(synthetic minority over-sampling technique,SMOTE)对航班延误类别进行平衡处理,并用随机森林(random forest,RF)模型进行训练和贝叶斯调参。结果表明:与不经过平衡采样的方法比较,该方法在权重平均下的精确率、召回率和F 1评分分别提高了19%、8%和16%;分类预测准确率提升8.03%,模型拟合指数AUC(area under curve)提升5.4%。同时,采用多特征相融合的图神经网络模型Graph WaveNet对航班平均延误时间进行预测。实验结果表明:与单特征模型比较,该模型平均绝对误差和均方根误差分别降低了16%和12.45%。这些方法和结果对研究航班延误分类和预测算法研究具有参考价值。 展开更多
关键词 平衡分类数据 平衡采样算法 随机森林(RF)模型 图神经网络 特征融合
在线阅读 下载PDF
超宽带微功率冲激雷达接收机的优化及实现
9
作者 盛浩 付红卫 王欣 《电讯技术》 2008年第12期71-74,共4页
为实现一种真正平衡的采样接收机,并解决以往接收机存在的采样模板脉冲泄漏问题,设计了一种新的平衡采样头。通过分析模板信号宽度对检测效率的影响,结合实际微功率冲激雷达(MIR)采样接收机所需考虑的事项,优化了模板信号的波形和宽度,... 为实现一种真正平衡的采样接收机,并解决以往接收机存在的采样模板脉冲泄漏问题,设计了一种新的平衡采样头。通过分析模板信号宽度对检测效率的影响,结合实际微功率冲激雷达(MIR)采样接收机所需考虑的事项,优化了模板信号的波形和宽度,并实际生成了平衡模板信号,最终实现了所提出的采样接收机。测量结果显示,在M IR系统低于120 mW功耗的前提下,可将其作用距离扩展至30 m。 展开更多
关键词 超宽带微功率冲激雷达 平衡采样 超窄脉冲 模板信号 距离带
在线阅读 下载PDF
混合Boost算法实现的行人检测技术 被引量:3
10
作者 陈超 《计算机应用与软件》 北大核心 2019年第6期184-189,共6页
传统AdaBoost存在一定的局限,比如训练分类器时对训练样本自身所带的噪声过于敏感,产生的分类器泛化能力不强和导致分类器过拟化问题,在训练分类器时只能静态分配分类器权重而不能自适应地对每个训练样本动态调整权重等问题。提出一种基... 传统AdaBoost存在一定的局限,比如训练分类器时对训练样本自身所带的噪声过于敏感,产生的分类器泛化能力不强和导致分类器过拟化问题,在训练分类器时只能静态分配分类器权重而不能自适应地对每个训练样本动态调整权重等问题。提出一种基于SBoost算法和PBoost算法,引入样本权重调节器、非平衡的样本采样、误差纠偏方法来检测潜在的样本。模拟实验表明:改进后的技术有效的提高了分类器的精确度且防止过拟化问题。 展开更多
关键词 SBoost算法 PBoost算法 混合 Boost算法 动态权重调整 平衡的样本采样 误差纠偏方法
在线阅读 下载PDF
DNA样本强制采集与隐私权保护 被引量:2
11
作者 刘晓丹 《中国人民公安大学学报(社会科学版)》 北大核心 2012年第3期96-102,共7页
DNA包含决定人体生理、病理特征,甚至行为特征的全部遗传密码,DNA信息被视为人的"终极身份证"。随着世界许多国家相继建立和发展DNA数据库,DNA样本与隐私权保护问题备受关注。为取得打击犯罪和保护公民隐私权之间的平衡,西方... DNA包含决定人体生理、病理特征,甚至行为特征的全部遗传密码,DNA信息被视为人的"终极身份证"。随着世界许多国家相继建立和发展DNA数据库,DNA样本与隐私权保护问题备受关注。为取得打击犯罪和保护公民隐私权之间的平衡,西方国家均先立法后建库,对DNA强制采样的对象与程序、DNA样本的保留与销毁做出明确的规定,并通过不断修改立法以适应DNA数据库的发展。我国DNA数据库正在建立和发展的过程中,应尽快对DNA样本强制采集的对象、程序及样本保留、销毁等问题进行立法规制,以实现打击犯罪与保护公民权利之间的平衡。 展开更多
关键词 DNA样本 隐私权 强制采样 平衡检验 隐私样本
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部