期刊文献+
共找到248篇文章
< 1 2 13 >
每页显示 20 50 100
基于特征选择的食品掺杂物可视分析系统
1
作者 汤颖 盛祎琛 +1 位作者 潘晶 周伟华 《计算机辅助设计与图形学学报》 北大核心 2025年第2期229-242,共14页
食品安全抽检数据中蕴含的掺杂物信息在食品安全早期预警、风险预测等方面有着重要应用.为深入研究食品类别中的高权重掺杂物,首先根据对比学习思想设计了基于特征选择技术的食品掺杂物特征权重计算模型,并获取模型中的样本分类结果、... 食品安全抽检数据中蕴含的掺杂物信息在食品安全早期预警、风险预测等方面有着重要应用.为深入研究食品类别中的高权重掺杂物,首先根据对比学习思想设计了基于特征选择技术的食品掺杂物特征权重计算模型,并获取模型中的样本分类结果、特征信息以及分类模型中常见的评估指标,在上述特征模型计算的基础上,设计并实现了一个食品掺杂物可视分析系统.该系统不仅包含多个联动视图帮助用户更直观地理解食品掺杂物的特征,并支持用户通过迭代交互不断更新最优特征组合.最后,将该可视分析系统用于2010—2020年全国范围内24种食品类别的89202条不合格样本的掺杂物特征分析,实验结果证明该系统可以通过自动化的方式更加方便、直接地获取食品的掺杂物权重,增强掺杂物特征组合,为专业人员提供了对食品掺杂物更全面的见解. 展开更多
关键词 特征选择 食品抽检数据 掺杂物 可视分析 关联分析
在线阅读 下载PDF
基于特征融合的部分有序深度森林模型
2
作者 许行 温萧轲 王文剑 《计算机工程与应用》 北大核心 2025年第7期165-175,共11页
部分有序数据是同时包含有序特征与无序特征的一类数据,其广泛存在于现实生活中。传统的有序分类方法或者将所有特征都视为有序特征,或者对有序与无序特征分别进行处理,忽略了二者之间的关系,这些方法难以有效解决部分有序数据上的分类... 部分有序数据是同时包含有序特征与无序特征的一类数据,其广泛存在于现实生活中。传统的有序分类方法或者将所有特征都视为有序特征,或者对有序与无序特征分别进行处理,忽略了二者之间的关系,这些方法难以有效解决部分有序数据上的分类问题。针对该问题,提出一种基于特征融合的部分有序深度森林模型,称为FFDF(feature fusion-based deep forest)。利用典型相关分析的思想,设计特征融合的贡献度计算方法,将有序特征和无序特征融合到同一特征空间,统一度量二者之间的关系。对融合的特征空间进行数据粒化,降低模型处理连续变量时的复杂性。设计融合空间下的特征矩阵输入级联森林,构建部分有序的深度森林模型。在来自UCI和WEKA的13个公共数据集上与部分单调决策树、有序分类模型、深度森林模型等六种方法进行比较实验,结果表明所提方法在准确性和平均绝对误差方面均优于对比方法;与集成模型深度森林gcForest和DF21进行了时间性能上的对比实验,结果表明所提方法在时间性能上优于对比方法。 展开更多
关键词 有序分类 部分有序数据 特征融合 深度森林 典型相关分析
在线阅读 下载PDF
融合持续同调-CNN的灰度化光伏红外图像的识别和分类
3
作者 孙海蓉 唐振超 +1 位作者 张洪玮 周黎辉 《太阳能学报》 北大核心 2025年第6期321-328,共8页
针对卷积神经网络对光伏红外热斑图像进行识别和分类准确率低、计算量大、光伏红外图像上热斑特征难以识别的问题,提出一种基于持续同调的对灰度化光伏热斑图像提取拓扑特征的算法。首先,将光伏红外热斑图像灰度化;然后将灰度化之后的... 针对卷积神经网络对光伏红外热斑图像进行识别和分类准确率低、计算量大、光伏红外图像上热斑特征难以识别的问题,提出一种基于持续同调的对灰度化光伏热斑图像提取拓扑特征的算法。首先,将光伏红外热斑图像灰度化;然后将灰度化之后的图像进行持续同调计算,得到条形码,从条形码中提取其拓扑特征组成新的图像;最后,用卷积神经网络对新的图像进行识别和分类。实验结果表明,灰度化后的光伏红外图像是一个单通道图像,计算量更小;提取的光伏红外热斑图像拓扑特征更易识别和分类,准确率更高。 展开更多
关键词 特征提取 卷积神经网络 持续同调 拓扑数据分析 拓扑特征 识别和分类
在线阅读 下载PDF
基于持续同调算法的光伏热斑识别与分类方法
4
作者 孙海蓉 张洪玮 +1 位作者 唐振超 周黎辉 《太阳能学报》 北大核心 2025年第5期285-292,共8页
针对光伏组件中红外热斑的识别及分类需训练样本数量较大以及准确率还有待提高的问题,提出一种基于持续同调算法与卷积神经网络相结合的热斑识别方法。首先使用拓扑数据分析中的持续同调算法,将红外热图像中RGB三通道上的数值映射到三... 针对光伏组件中红外热斑的识别及分类需训练样本数量较大以及准确率还有待提高的问题,提出一种基于持续同调算法与卷积神经网络相结合的热斑识别方法。首先使用拓扑数据分析中的持续同调算法,将红外热图像中RGB三通道上的数值映射到三维坐标系形成三维点云,然后进行持续同调计算,预先提取出图片内部所包含的拓扑特征,再将提取出的特征向量化处理后以固定的顺序排列,映射到图像的像素中去,并与图片的亮度及对比度特征相结合,最后将处理后的图像数据输入到调整后的LeNet-5卷积神经网络模型中,实现对光伏红外热斑的分类识别,并通过混淆矩阵计算各项性能指标,以评估模型的性能。实验结果表明,该模型有效地提取出隐藏在图像内部的高维拓扑特征,并与其他特征进行有利地互补结合,解决图像数据无法直接输入到持续同调算法中以及高维度拓扑特征无法直接作为深度学习模型输入的问题,同时提高了光伏红外热斑的分类识别准确率,且显著减少了所需的计算资源。 展开更多
关键词 光伏组件 特征提取 卷积神经网络 拓扑数据分析 持续同调 光伏热斑
在线阅读 下载PDF
混合特征平衡图注意力网络日志异常检测模型 被引量:1
5
作者 陈旭 张硕 +1 位作者 景永俊 王叔洋 《计算机工程与应用》 北大核心 2025年第1期308-320,共13页
针对现有方法忽略了日志异常数据不平衡和日志特征间的关联性,导致异常检测准确率低的问题。提出一种基于混合特征平衡图注意力网络的日志异常检测模型(HBGATLog)。构建混合日志图构建模块,通过混合特征提取模块提取日志数据的语义信息... 针对现有方法忽略了日志异常数据不平衡和日志特征间的关联性,导致异常检测准确率低的问题。提出一种基于混合特征平衡图注意力网络的日志异常检测模型(HBGATLog)。构建混合日志图构建模块,通过混合特征提取模块提取日志数据的语义信息、日志序列和时间结构,增强日志特征间的关联性,并采用日志图构建模块构建日志图,有效保留空间结构特征。设计平衡日志图生成模块,解决不平衡的日志数据导致检测结果偏向多数类问题。采用图日志异常检测模块进行异常检测。使用BGL、Thunderbird和HDFS三个公共数据集对HBGATLog进行验证,实验结果表明,F1 score分别达到了99.0%、98.7%和98.1%。证明HBGATLog不但能够解决日志数据不平衡问题,充分考虑日志数据特征的关联性,而且有效降低了漏检率。 展开更多
关键词 日志异常检测 日志分析 图神经网络 混合特征提取 数据不平衡
在线阅读 下载PDF
基于大数据分析和波形匹配算法的配电网缺陷感知模型研究 被引量:1
6
作者 林恺丰 李一鸣 +3 位作者 张波 杨昶宇 朱泽厅 杨镇达 《电测与仪表》 北大核心 2025年第4期81-87,共7页
针对配网自动化覆盖后,I区系统中海量信号数据未有效利用和配网环网柜中开关设备在故障前存在频繁瞬时性闪络、接地等情况不能及时发现导致跳闸的问题,文中提出了基于大数据分析和波形匹配算法的配电网缺陷感知模型。利用配电线路的配... 针对配网自动化覆盖后,I区系统中海量信号数据未有效利用和配网环网柜中开关设备在故障前存在频繁瞬时性闪络、接地等情况不能及时发现导致跳闸的问题,文中提出了基于大数据分析和波形匹配算法的配电网缺陷感知模型。利用配电线路的配电终端(distribution terminal unit, DTU)数据采集能力,在不影响馈线自动化(feeder automation, FA)功能的前提下合理设置保护定值,收集故障闪络信息,并对信号波形特征分析以提取故障波形特征用于设备缺陷判别;建立基于波形匹配算法的配网缺陷感知模型,训练学习识别故障波形,采用层次分析算法量化风险品评估;通过配电网缺陷感知系统实例分析证明了设计系统的可行性,指导现场有针对性的局放检测,发现并解决存在演变过程的设备类隐患。 展开更多
关键词 数据分析 特征提取 局放检测 神经网络
在线阅读 下载PDF
基于脉搏波信号多维度特征的身份识别
7
作者 傅幼萍 张航 +1 位作者 厉梦菡 孟濬 《浙江大学学报(工学版)》 北大核心 2025年第3期566-576,共11页
现有光电容积脉搏波(PPG)身份识别方法特征表征不全面、鲁棒性不强,为此提出基于PPG信号多维度特征的身份识别方法.该方法将PPG信号的非线性维度作为重要特征引入身份识别.对PPG信号进行预处理;分别从时域、频域和非线性3个维度提取PPG... 现有光电容积脉搏波(PPG)身份识别方法特征表征不全面、鲁棒性不强,为此提出基于PPG信号多维度特征的身份识别方法.该方法将PPG信号的非线性维度作为重要特征引入身份识别.对PPG信号进行预处理;分别从时域、频域和非线性3个维度提取PPG信号的特征参数;通过优化和选择,构建有效的特征集;将该特征集用于身份识别,并对身份识别系统的性能进行分析和评估.通过对多维度的全面分析,该方法实现了较全面的特征提取,并且时域、频域和非线性维度分析提供的互补信息增强了识别系统的鲁棒性.在包含200个主体和1000条数据的身份识别任务中,该方法取得了98.4%的准确率.与KNN之类其他现有研究的对比分析表明,本研究方法取得了较高的准确率.结果表明,构建多维度特征对于提高PPG身份识别任务准确率至关重要. 展开更多
关键词 脉搏波 身份识别 特征提取 数据挖掘 信号分析
在线阅读 下载PDF
针对缺失实验室指标多约束表征学习的卵巢癌鉴别方法
8
作者 卢梓涵 黄方俊 +2 位作者 蔡光瑶 刘继红 甄鑫 《南方医科大学学报》 北大核心 2025年第1期170-178,共9页
目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重... 目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重要性得分一致性及缺失位置估算的表征学习分类模型对缺失的卵巢癌实验室指标特征进行投影到潜在空间得到分类模型。对提出的约束项进行消融实验,通过准确率、ROC曲线下面积(AUC)、敏感度、特异性说明约束项的可行性和有效项。采用交叉验证方法和准确率、AUC、敏感度、特异性评价该分类模型的鉴别性能。将本研究与其他用于缺失数据的插补方法进行对缺失数据处理后鉴别分类能力的对比。结果消融实验结果显示约束项之间有很好的相容性,每项约束项都有较好的鲁棒性。交叉验证结果显示,本研究提出的基于多约束表征学习分类模型在面对缺失实验室指标的情况下对卵巢癌的鉴别中的AUC、准确率、敏感度、特异性分别为0.915、0.888、0.774、0.910,其中AUC和敏感度优于其它缺失数据插补方法。结论基于多约束表征学习模型在缺失实验室指标鉴别卵巢癌的应用中具有优秀的鉴别能力和较高的应用价值。与其他缺失插补方法相比,本研究提出的多约束表征学习模型在针对卵巢癌缺失实验室指标的鉴别分类任务中具有较大的优势。 展开更多
关键词 缺失数据 多约束表征学习模型 判别分析 特征投影重要性得分一致性 缺失位置估算 互信息 卵巢癌
在线阅读 下载PDF
大数据背景下基于改进RNN的低压配电网线损智能分析方法 被引量:7
9
作者 李学军 张世元 《沈阳工业大学学报》 北大核心 2025年第1期130-136,共7页
【目的】在电力系统中,线损率是衡量电网系统设计、运维和管理水平的重要经济技术指标,对于保障电网的稳定经济运行、提高供电效率具有重要意义。然而,在用户数量激增、用能特征多样化的大数据背景下,线损率的计算评价工作面临较大挑战... 【目的】在电力系统中,线损率是衡量电网系统设计、运维和管理水平的重要经济技术指标,对于保障电网的稳定经济运行、提高供电效率具有重要意义。然而,在用户数量激增、用能特征多样化的大数据背景下,线损率的计算评价工作面临较大挑战。传统线损计算方法依赖于电网参数,精细化程度偏低,计算准确率不佳。【方法】针对该问题,提出了一种基于改进循环神经网络(RNN)的低压配电网线损智能分析方法,旨在通过智能化手段提高线损计算的准确性和效率。方法利用K-means算法对智能配电网的海量用户数据进行分类预处理,以降低数据冗余度。采用层次分析法(AHP)从分类数据中提取线损指标,这些指标随后被输入到深度学习模型中,其中,核心深度学习模型是由卷积神经网络(CNN)和改进长短时记忆网络(LSTM)模型融合而成,该模型能够挖掘配电网数据特征,实现线损的智能分析。通过IEEE33节点的仿真模型进行实验验证,充分展示所提方法的有效性。【结果】实验结果表明,所提方法的均方误差(MSE)和相对误差百分数(RE)分别为3.15 MW和2.43%,计算精度较高。与现有方法相比,所提方法在大数据背景下的配电网线损智能分析中具有明显优势,能够全面考虑各种配电网的影响因素,获得更精准的线损计算结果。此外,通过与两种经典文献方法进行对比实验,进一步验证所提方法的性能优势。【结论】基于改进RNN模型的低压配电网线损智能分析方法通过K-means算法和AHP预处理提取线损指标,再利用CNN-LSTM模型进行深入分析,有效提高了线损计算的准确性和效率。该方法主要针对低压配电网线路侧的线损进行分析,对于更高等级电压的线损分析尚未深入研究,但其在低压配电网线损智能分析中显示出优异的结果,具有实际应用价值。未来的研究将扩展到更广泛的校验分析,以提高方法的全面性和可靠性。此外,该方法的提出也为智能配电网的进一步研究和应用提供了新的思路和工具,有助于推动智能电网技术的发展和应用。通过这种方法,不仅可以提高线损计算的准确性,还能为电网的优化管理提供科学依据,对于提升电网运行效率、降低能源损耗具有重要的实际意义。随着技术的不断进步和数据量的日益增加,智能化的线损分析方法将成为电力系统运维中不可或缺的一部分。 展开更多
关键词 大数据 低压配电网 K-MEANS聚类 层次分析法 特征提取 CNN-LSTM模型 智能线损分析 循环神经网络
在线阅读 下载PDF
基于多元统计分析的故障检测技术
10
作者 胡浩 冯辅周 +3 位作者 陈财森 朱俊臻 宋超 王安 《火炮发射与控制学报》 北大核心 2025年第1期83-92,共10页
针对装备动力系统故障预警建模需要大量数据样本的问题,基于主成分分析(PCA)方法,仅需少量故障数据,构建了装备动力系统故障预警模型。实验结果表明:模型故障预警效果较好,能够有效提示故障。为了更好的监测非线性过程,将核(Kernel)变... 针对装备动力系统故障预警建模需要大量数据样本的问题,基于主成分分析(PCA)方法,仅需少量故障数据,构建了装备动力系统故障预警模型。实验结果表明:模型故障预警效果较好,能够有效提示故障。为了更好的监测非线性过程,将核(Kernel)变换与主成分分析方法相结合,构建适用于少量故障数据条件下的核主成分分析方法(KPCA),采用辛辛那提轴承实验台数据集和装备动力系统数据集验证了模型的有效性,实现对装备动力系统运行异常的有效预警。针对故障源难以辨识的问题,基于多元统计贡献图的故障识别方法,对装备动力系统异常情况下的故障源变量进行精确的识别,对故障源进行定位。研究结论和成果可为装备动力系统异常预警模型的设计提供思路和依据。 展开更多
关键词 多元统计分析 故障预警 主成分分析 数据 特征
在线阅读 下载PDF
基于近红外光谱和多变量数据处理的鸡蛋蛋黄颜色无损判别研究
11
作者 温裕宽 董桂梅 +2 位作者 李留安 于晓雪 于亚萍 《光谱学与光谱分析》 北大核心 2025年第4期1015-1021,共7页
蛋黄颜色是鸡蛋品质的重要指标,消费者更喜欢购买蛋黄颜色较深的鸡蛋。通常将鸡蛋打开,通过罗氏比色扇对蛋黄颜色进行判别,无损判别蛋黄颜色的研究具有重要意义。针对不同颜色蛋壳的鸡蛋,进行蛋黄颜色无损判别方法研究,通过近红外光谱... 蛋黄颜色是鸡蛋品质的重要指标,消费者更喜欢购买蛋黄颜色较深的鸡蛋。通常将鸡蛋打开,通过罗氏比色扇对蛋黄颜色进行判别,无损判别蛋黄颜色的研究具有重要意义。针对不同颜色蛋壳的鸡蛋,进行蛋黄颜色无损判别方法研究,通过近红外光谱数据采集,采用化学计量法建立定性分类预测模型,对影响蛋黄颜色成分进行分析,找到谱图吸收峰对应官能团。采集了90个粉壳蛋和89个白壳蛋的近红外光谱数据,罗氏比色扇记录的蛋黄颜色用于建立定性分类模型目标颜色,将样本按2∶1分为校正集和预测集,分别对单种颜色蛋壳样本和混合颜色蛋壳样本建立了预测模型。采用线性(偏最小二乘法判别PLS-DA、线性判别分析LDA)和非线性(卷积神经网络CNN、极限学习机ELM)的方法建立了分类模型,运用多种预处理方法,采用CARS特征波长筛选方法对光谱数据筛选了176个波长点。不同颜色蛋壳混合样本采用CARS波长筛选法、MSC和二阶导数的预处理方法,建立的偏最小二乘法分类模型准确率最高达91.67%,LDA达到98.11%。对粉壳蛋单独进行建模时,建立的偏最小二乘分类模型测试集准确率达到100%。对白壳蛋单独进行建模时,建立的偏最小二乘分类模型准确率达到了96.67%,而LDA模型准确率则达到了100%。结果表明,线性分析方法更加能表征鸡蛋光谱数据蛋黄颜色的特征,适合蛋黄颜色无损检测。该方法不仅能满足消费者的需求,而且蛋黄颜色判别结果对养殖场饲料喂养及调控起指导作用。 展开更多
关键词 近红外光谱 蛋黄颜色 偏最小二乘法 线性判别分析 特征波长筛选 数据预处理
在线阅读 下载PDF
基于多因素特征工程建模的电力负荷预测方法
12
作者 刘硕 丁宇昂 赵梓焱 《沈阳工业大学学报》 北大核心 2025年第3期309-316,共8页
【目的】准确的电力负荷预测是电力系统实现顺利运行和有效管理的关键,可使电力公司有效调度发电设备,从而提高电力系统的运行效率和经济效益。然而,电力负荷数据受多种外部因素影响,同时具有显著的时间依赖性,导致其难以精准预测。为此... 【目的】准确的电力负荷预测是电力系统实现顺利运行和有效管理的关键,可使电力公司有效调度发电设备,从而提高电力系统的运行效率和经济效益。然而,电力负荷数据受多种外部因素影响,同时具有显著的时间依赖性,导致其难以精准预测。为此,提出一种融合多因素建模与时间序列分析的电力负荷预测模型,通过兼顾多因素复杂影响分析与电力负荷时间依赖性特征,实现电力负荷的精准预测。【方法】为了突破多因素分析方法与时间序列预测建模方法各自的局限性,基于深度学习与多因素分析方法,提出了一种结合长短期记忆(long short-term memory,LSTM)网络与贝叶斯优化算法的改进电力负荷预测模型。首先,构建了一个全面的多因素特征池,包括电力负荷的历史时序特征和多种外部因素特征,以充分捕捉电力负荷数据与多种影响因素间的复杂关系。其次,采用LSTM网络作为核心模型,利用其独特的门控机制与记忆单元,捕捉电力负荷数据的时间依赖性和多因素之间的复杂关联。引入贝叶斯优化算法对LSTM模型的超参数进行调优,以高斯过程作为代理模型,充分利用先验信息,提升模型训练效率和预测性能。【结果】利用5个实际变压器数据集对模型进行了训练和测试,并通过多种评价指标验证了模型的有效性。基于多因素特征工程建模的电力负荷预测方法在5个不同变压器数据集上的预测性能均显著优于利用单一因素预测的模型,进一步突出了多因素特征池的有效性。LSTM模型的最大决定系数为0.9207,最小均方误差为0.042,最小平均绝对误差为0.024,表明其在复杂电力负荷预测任务中具有优越性能。【结论】融合多因素建模与时间序列分析的电力负荷预测模型充分考虑了外部因素的复杂性和电力负荷数据的时间依赖性特征,创新性地引入了一个全面的特征池参与LSTM模型的训练和测试。结合多因素特征池建模的LSTM网络具有较高的预测精度和鲁棒性,为电力负荷预测提供了新的技术思路,对智能电网的规划和调度具有重要的参考价值,并为进一步发展精准负荷预测技术奠定了基础。 展开更多
关键词 电力负荷预测 LSTM网络 贝叶斯优化 多因素分析 时间序列预测 特征工程 数据驱动建模 深度学习
在线阅读 下载PDF
基于大数据分析的可见光图像融合质量评价研究 被引量:2
13
作者 翟广辉 李娟 《激光杂志》 CAS 北大核心 2024年第5期121-126,共6页
在复杂可见光图像下图像融合质量受到遮挡和重叠等因素影响,需要进行图像融合质量评价优化设计,提出基于大数据分析的可见光图像融合质量评价模型,采用相应图像块之间的视觉特征提取方法建立可见光图像的深度立体匹配模型,将不同光照强... 在复杂可见光图像下图像融合质量受到遮挡和重叠等因素影响,需要进行图像融合质量评价优化设计,提出基于大数据分析的可见光图像融合质量评价模型,采用相应图像块之间的视觉特征提取方法建立可见光图像的深度立体匹配模型,将不同光照强下采集的图像像素值显示映射到嵌入特征空间中,完成预处理,构建可见光图像的动态像素大数据融合模型,通过端到端的视差融合估计实现对可见光图像的动态融合,采用超分辨重建方法获得真实配对图像,分析SR结果与LR图像中的相似内容,以特征级别的图像分布域反映可见光图像融合质量评价,实现可见光图像融合质量评价。仿真结果表明,采用该方法进行可见图像融合的匹配性能较好,图像的对比度、饱和度高,提高了可见光的成像质量,耗时为0.012 s,平均迭代次数为1.569,并且均方误差仅为1.071,总误差仅为4.646,该方法有效提高了图像融合质量的同时,提高了评估效果。 展开更多
关键词 大数据分析 可见光图像 图像融合 质量评价 视觉特征
在线阅读 下载PDF
基于近邻元分析的风电机组状态监测特征选择方法 被引量:3
14
作者 罗志宏 刘长良 刘帅 《华北电力大学学报(自然科学版)》 CAS 北大核心 2024年第3期134-142,共9页
针对现有特征选择方法难以从大量的SCADA参量中挑选出重要变量的问题,基于近邻元分析算法提出一种专门适用于风电机组状态监测的特征变量选择方法。所提方法根据每个待选变量对回归精度的贡献率为各变量赋予相应的重要度权值,从而挑选... 针对现有特征选择方法难以从大量的SCADA参量中挑选出重要变量的问题,基于近邻元分析算法提出一种专门适用于风电机组状态监测的特征变量选择方法。所提方法根据每个待选变量对回归精度的贡献率为各变量赋予相应的重要度权值,从而挑选出最重要的特征变量。通过分析SCADA数据中冗余变量的特点,针对性地提出了基于相关系数矩阵的去除冗余方法。采用Pearson相关系数、互信息和随机森林三种方法作为对比,以门控循环神经网络作为模型预测齿轮箱油池温度,用预测精度指标和残差控制图对各特征选择方法的选择结果进行评价和对比,结果表明所提方法的特征选择结果更加直观、冗余变量更少、预测精度更高。 展开更多
关键词 特征选择 变量选择 近邻元分析 风电机组 SCADA数据 状态监测
在线阅读 下载PDF
Φ-OTDR系统振动信号的聚类识别方法 被引量:1
15
作者 刘念超 李勤 +1 位作者 赵小艇 梁生 《红外与激光工程》 EI CSCD 北大核心 2024年第11期186-200,共15页
分布式光纤声学传感(DAS)利用单模通信光纤即可实现大规模、低成本的传感阵列,针对基于相位敏感光时域反射(Φ-OTDR)技术的DAS系统产生的大量数据中有效信息稀缺的问题,提出了一种基于时域振幅特征提取和无监督聚类的方法,旨在探索无监... 分布式光纤声学传感(DAS)利用单模通信光纤即可实现大规模、低成本的传感阵列,针对基于相位敏感光时域反射(Φ-OTDR)技术的DAS系统产生的大量数据中有效信息稀缺的问题,提出了一种基于时域振幅特征提取和无监督聚类的方法,旨在探索无监督学习在DAS入侵事件识别中的应用。该方法通过计算相邻数据点差值、提取关键特征,并使用层次聚类对振动事件进行分类,相较于主流神经网络算法,需更少样本且无需手动标记。实验模拟了风噪声、人工敲击和挖掘三种振动事件,结果表明,该方法的V度量为0.721、剪影系数为0.778、聚类准确率可达88.68%,有效区分了入侵信号与噪声,并基本分辨出人工敲击与挖掘信号,证明聚类识别可应用于Φ-OTDR事件识别。 展开更多
关键词 Φ-OTDR 时域特征提取 聚类分析 数据裁剪
在线阅读 下载PDF
基于PCA特征优选和AdaBoost集成学习的齿轮箱油品状态识别方法 被引量:1
16
作者 陈晓犇 黄采伦 +3 位作者 赵延明 李智靖 南茂元 田勇军 《电子测量与仪器学报》 CSCD 北大核心 2024年第10期58-68,共11页
针对传统齿轮箱油液分析方法存在的精度低和泛化能力有限的问题,提出一种基于PCA特征优选和AdaBoost集成学习的齿轮箱油品状态识别方法。首先,通过箱型图和smote插值对油液多参量数据进行清洗以提高油液数据的质量;其次,采用PCA进行油... 针对传统齿轮箱油液分析方法存在的精度低和泛化能力有限的问题,提出一种基于PCA特征优选和AdaBoost集成学习的齿轮箱油品状态识别方法。首先,通过箱型图和smote插值对油液多参量数据进行清洗以提高油液数据的质量;其次,采用PCA进行油品特征优选,获取有助于识别的油品特征优选子集,在有效融合油液多参量信息的同时,可显著降低模型运行的时间复杂度;然后,利用BP神经网络建立油品状态识别基本模型,引入GWO灰狼优化算法对模型进行优化,构建具有最优初始权值与阈值的弱分类器GWO-BP,同时采取自适应提升AdaBoost算法组合多个弱分类器GWO-BP,集成为较强鲁棒性的强分类器。最后利用实验进行验证和分析,实验结果表明,所提方法效果最优,平均识别率99.30±0.16%,平均用时32.77±1.27 s,能够快速高效、准确识别出齿轮箱润滑油油品状态,为实现在线齿轮箱的油品状态识别奠定了良好基础,具有重要的工程应用价值。 展开更多
关键词 油液分析 数据清洗 特征优选 集成学习 油品状态识别
在线阅读 下载PDF
基于特征构建及CAE-LSTM的短期电量预测方法 被引量:4
17
作者 罗俊然 温蜜 何蔚 《计算机应用与软件》 北大核心 2024年第2期41-48,137,共9页
线损率能够反映企业的管理水平和经济效益,而供售电不同期会导致线损统计存在误差,因此需要进行短期电量预测。针对现有方法未能充分挖掘电量影响因素的问题,提出基于特征构建及CAE-LSTM的短期电量预测方法。通过数据分析构建特征,并使... 线损率能够反映企业的管理水平和经济效益,而供售电不同期会导致线损统计存在误差,因此需要进行短期电量预测。针对现有方法未能充分挖掘电量影响因素的问题,提出基于特征构建及CAE-LSTM的短期电量预测方法。通过数据分析构建特征,并使用MIC进行筛选;使用ARIMA预测电量值,并与特征进行数据重构;通过CAE-LSTM对数据进行特征提取,得到预测结果。实验结果表明,提出的方法能够更有效地提取数据特征,实现更高的预测精度。 展开更多
关键词 数据分析 特征构建 CAE LSTM ARIMA 电量预测 最大信息系数
在线阅读 下载PDF
基于相关性分析和生成对抗网络的电网缺失数据填补方法 被引量:7
18
作者 蔡榕 杨雪 +2 位作者 田江 赵奇 王毅 《电力工程技术》 北大核心 2024年第1期229-237,共9页
城市电网新型电力系统中多元资源增多,数据采集难度加大,导致数据随机缺失率升高,难以满足精细化分析决策需求。为解决新型电力系统中配网量测数据在采集与传输过程中频发的缺失问题,文中提出一种基于波动互相关分析(fluctuation cross-... 城市电网新型电力系统中多元资源增多,数据采集难度加大,导致数据随机缺失率升高,难以满足精细化分析决策需求。为解决新型电力系统中配网量测数据在采集与传输过程中频发的缺失问题,文中提出一种基于波动互相关分析(fluctuation cross-correlation analysis,FCCA)算法和生成对抗网络(generative adversarial network,GAN)的电网缺失数据填补方法。首先,融合FCCA算法提出强相关性电网数据多维特征提取方法;其次,基于核主成分分析(kernel principal component analysis,KPCA)对多维特征数据集进行降维处理;最后,设计改进型GAN结构,融合电网数据多维特征对低维向量进行重构,实现缺失数据填补。算例采用真实电网数据进行算法验证,并在某城市电网试运行。结果表明,所提方法比传统数据填补方法具有更高填补精度。因此,在新型电力系统中量测数据连续缺失和缺失量较大的情况下,融合强相关性特征进行数据填补,对提升量测数据的完整性和可用性有明显优势。 展开更多
关键词 新型电力系统 波动互相关分析(FCCA) 多维特征 生成对抗网络(GAN) 缺失数据 核主成分分析(KPCA) 智能填补
在线阅读 下载PDF
美国情报界数据战略的文本特征与建构思路——以话语分析为视角 被引量:1
19
作者 赵娟 张金平 《情报杂志》 CSSCI 北大核心 2024年第7期88-96,共9页
[研究目的]研究分析美国情报界数据战略的特点与建构思路,对中国特色数据情报战略建设提供借鉴。[研究方法]基于话语分析,对特朗普政府《情报界信息环境数据战略2017—2021》和拜登政府《情报界数据战略2023—2025》的词汇、语法及语篇... [研究目的]研究分析美国情报界数据战略的特点与建构思路,对中国特色数据情报战略建设提供借鉴。[研究方法]基于话语分析,对特朗普政府《情报界信息环境数据战略2017—2021》和拜登政府《情报界数据战略2023—2025》的词汇、语法及语篇进行定量比较研究,总结两份情报界数据战略的异同与特点。[研究结论]美国通过两部情报界数据战略建立并不断完善数据标准,充分应用数据科学技术保障数据安全,鼓励多元主体协同数据情报创新,并打造数据驱动型情报团队。我国应尽快制定战略统一数据认知,明确标准筑牢制度基础,以多边监管共筑数据安全,通过多元共享体系活力,建构具有中国特色的数据情报战略体系。 展开更多
关键词 情报界 数据战略 话语分析 文本特征 美国
在线阅读 下载PDF
基于点云整体拓扑结构的图像分类算法 被引量:1
20
作者 王杰 孟华 《计算机应用》 CSCD 北大核心 2024年第4期1107-1113,共7页
卷积神经网络(CNN)参数众多、分类边界复杂,对数据的局部特征较敏感,导致当CNN模型受到对抗攻击时,精度明显下降;而拓扑数据分析(TDA)方法更关注数据的宏观特征,天然具有对抗噪声和梯度攻击的能力。为此,提出一种耦合拓扑数据分析和CNN... 卷积神经网络(CNN)参数众多、分类边界复杂,对数据的局部特征较敏感,导致当CNN模型受到对抗攻击时,精度明显下降;而拓扑数据分析(TDA)方法更关注数据的宏观特征,天然具有对抗噪声和梯度攻击的能力。为此,提出一种耦合拓扑数据分析和CNN的图像分类算法MCN(Mapper-Combined neural Network)。首先,利用Mapper算法得到刻画数据集宏观特征的Mapper图,通过多视图的Mapper图对每一个样本点进行新的特征表示,并将新特征表示成二值向量;其次,结合新特征和CNN提取的隐藏层特征,增强隐藏层特征;最后,使用特征增强后的样本数据训练全连接的分类网络,完成图像分类任务。在MNIST和FashionMNIST数据集上,将MCN与纯卷积网络、单一Mapper特征分类算法进行对比,采用主成分分析(PCA)降维的MCN的初始分类精度提升了4.65%和8.05%;采用线性判别分析(LDA)降维的MCN的初始分类精度提高了8.21%和5.70%。实验结果表明,MCN分类精度更高,并且对抗攻击能力更强。 展开更多
关键词 卷积神经网络 对抗攻击 拓扑数据分析 特征增强 多视图
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部