期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于自适应稀疏宽度学习系统的软测量建模 被引量:1
1
作者 杜康萍 隋璘 熊伟丽 《系统仿真学报》 北大核心 2025年第6期1449-1461,共13页
针对复杂工业过程具有非线性、变量多特征耦合的特性,导致模型复杂度增加及性能降低等问题,提出一种基于自适应稀疏宽度学习系统的软测量建模方法。在特征横向增强传递的基础上,采用迹LASSO(least absolute shrinkage and selection ope... 针对复杂工业过程具有非线性、变量多特征耦合的特性,导致模型复杂度增加及性能降低等问题,提出一种基于自适应稀疏宽度学习系统的软测量建模方法。在特征横向增强传递的基础上,采用迹LASSO(least absolute shrinkage and selection operator)对网络特征权重进行优化,根据不同变量间的相关性自适应调整惩罚强度,提高模型特征提取能力;在增强节点部分引入Dropout机制,利用LASSO求解输出权重,对模型整体进行稀疏优化,剔除过量节点,减少计算过程中的冗余数据。实验结果表明:该方法能有效简化模型结构,提高其预测性能。 展开更多
关键词 软测量 宽度学习系统 迹LASSO(least absolute shrinkage and selection operator) 正则化 稀疏模型
在线阅读 下载PDF
基于LASSO-OLS方法的初始地应力场反演优化
2
作者 李建新 张继勋 +3 位作者 马佳 任旭华 张玉贤 邓子昂 《隧道建设(中英文)》 北大核心 2025年第9期1698-1710,共13页
为解决传统初始地应力场反演方法存在边界条件筛选能力弱、易受数据过拟合干扰以及难以解析多重边界相互作用的问题,提出一种基于LASSO-OLS(least absolute shrinkage and selection operator-ordinary least squares)的两阶段初始地应... 为解决传统初始地应力场反演方法存在边界条件筛选能力弱、易受数据过拟合干扰以及难以解析多重边界相互作用的问题,提出一种基于LASSO-OLS(least absolute shrinkage and selection operator-ordinary least squares)的两阶段初始地应力场反演方法。该方法首先通过对候选边界条件应力矩阵和实测应力矩阵进行Frobenius范数标准化处理,消除不同边界条件数据量级差异的影响;然后,利用LASSO回归的L1正则化约束,从候选边界条件的回归系数路径图中筛选关键影响因素,剔除冗余与弱相关项;最后,针对筛选出的核心变量,采用普通最小二乘回归进行无偏估计,构建兼具稀疏性与准确性的地应力场反演模型。研究结果表明:1)在工程应用实例中,借助LASSO回归从11个候选边界条件中筛选出5个关键因素,显著降低模型复杂度;2)模型正则化参数在标准误差内取值,拟合结果能够保持较高的复相关系数(R=0.995 2),表明筛选后的边界条件有效捕捉了初始地应力场特征;3)初始地应力场反演模型通过LASSO回归筛选,在解析多重边界相互作用时表现出较高的稳定性和物理合理性;4)与传统方法相比,该方法能有效避免初始地应力场反演出现过拟合问题,提高反演结果的鲁棒性。 展开更多
关键词 抽水蓄能电站 初始地应力场 LASSO回归 最小角回归算法 最小二乘法(OLS) 交叉验证
在线阅读 下载PDF
基于LASSO-logistic回归建立系统性红斑狼疮的鉴别诊断模型
3
作者 张琳琳 王加强 +3 位作者 张炯 邱婧璐 梁敏 梁艳 《海军军医大学学报》 北大核心 2025年第10期1322-1328,共7页
目的基于临床实验室常规检验指标构建系统性红斑狼疮(SLE)与其他自身免疫性疾病的鉴别诊断模型,以提高现有检验指标的诊断效能。方法回顾性分析2022年4月至2023年3月在四川省人民医院确诊的178例SLE患者(SLE组)及同期196例其他自身免疫... 目的基于临床实验室常规检验指标构建系统性红斑狼疮(SLE)与其他自身免疫性疾病的鉴别诊断模型,以提高现有检验指标的诊断效能。方法回顾性分析2022年4月至2023年3月在四川省人民医院确诊的178例SLE患者(SLE组)及同期196例其他自身免疫性疾病患者(对照组)的资料,分析两组之间19项临床常规检验指标的差异,并通过最小绝对收缩和选择算子(LASSO)回归筛选出具有非零系数的检验指标,通过logistic回归分析建立鉴别诊断SLE的列线图模型,以ROC曲线和决策曲线分析评估模型性能。结果SLE组抗心磷脂抗体IgG、抗心磷脂抗体IgA、超敏CRP、D-二聚体水平及凝血酶时间高于对照组(均P<0.05),IgM、补体3(C3)、补体4(C4)水平及凝血酶原时间、活化部分凝血活酶时间低于对照组(均P<0.05)。通过LASSO回归筛选出3个最可能的具有非零系数的指标为IgM、C3、C4。多因素logistic回归分析结果显示,鉴别诊断模型为Logit P=4.18-1.34×IgM-1.70×C3-6.61×C4。该模型AUC为0.80(95%CI 0.76~0.85),灵敏度为0.77,特异度为0.74。决策曲线分析显示模型在阈值概率0.2~0.9范围内具有良好临床适用性。结论利用临床常规检验指标IgM、C3、C4构建的模型有助于SLE与其他自身免疫性疾病的鉴别诊断,具有较好的临床应用价值。 展开更多
关键词 系统性红斑狼疮 最小绝对收缩和选择算子回归 鉴别诊断 列线图
在线阅读 下载PDF
食管鳞状细胞癌早期进展风险的代谢物预警模型
4
作者 张雅祺 王芹芹 +5 位作者 沈夏 李旭苗 高敏 李军 李辰 王慧 《生物技术通报》 北大核心 2025年第9期335-344,共10页
【目的】基于代谢组学构建食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)早期风险预警模型,精准识别高风险人群。【方法】纳入84例低级别上皮内瘤变患者,采集基线期血清,根据随访期间是否进展为高级别上皮内瘤变或ESCC分为... 【目的】基于代谢组学构建食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)早期风险预警模型,精准识别高风险人群。【方法】纳入84例低级别上皮内瘤变患者,采集基线期血清,根据随访期间是否进展为高级别上皮内瘤变或ESCC分为进展组(N=28)和无进展组(N=56)。采用反相液相色谱和亲水相互作用液相色谱联合高分辨质谱开展非靶向代谢组学分析。结合单变量与多变量分析评估组间代谢特征差异,对差异代谢物进行通路富集分析。将样本按7∶3比例分为训练集与测试集,在训练集中采用单变量逻辑回归联合最小绝对收缩与选择算子回归筛选与病程进展相关的关键代谢物,基于回归系数构建风险预警模型。通过受试者工作特征曲线和曲线下面积(area under the curve,AUC)评估模型性能。【结果】共鉴定10类1431种代谢物,差异代谢物在类固醇激素生物合成、初级胆汁酸合成及亚油酸代谢通路显著富集。最终筛选出18个与病程进展密切相关的关键代谢物,包括甘油-3-磷脂胆碱、棕榈酸、黄尿酸及N-脒基天冬氨酸等。风险预警模型在测试集中表现出良好的预测能力(AUC=0.812)。【结论】基于前瞻性随访队列,识别出多个关键代谢物及代谢通路,构建ESCC早期进展风险的代谢物预警模型。模型具有良好的预测鲁棒性和泛化能力,可为ESCC高风险人群的早期风险评估与干预策略优化提供理论支持。 展开更多
关键词 食管鳞状细胞癌 代谢组学 精准医学 最小绝对收缩与选择算子 风险预警模型 早期筛查
在线阅读 下载PDF
套索回归在配电网谐波源定位的应用 被引量:1
5
作者 程宏波 万紫彤 +2 位作者 李宗伟 蔡木良 辛建波 《电力系统及其自动化学报》 北大核心 2025年第3期59-65,共7页
为实现配电网谐波源定位欠定方程组的准确求解,提出用套索回归实现配电网谐波源定位。套索回归通过引入惩罚项,对无谐波源的节点电流进行压缩,以降低方程组的欠定程度。以残差平方和最小为目标对节点的谐波电流进行估计,得到配电网谐波... 为实现配电网谐波源定位欠定方程组的准确求解,提出用套索回归实现配电网谐波源定位。套索回归通过引入惩罚项,对无谐波源的节点电流进行压缩,以降低方程组的欠定程度。以残差平方和最小为目标对节点的谐波电流进行估计,得到配电网谐波源定位稀疏方程的最优解,根据求解的谐波电流判断谐波源的位置,并利用IEEE33节点系统进行仿真验证。结果表明,本文方法可准确确定谐波源位置,与最小二乘法和岭回归及正交匹配相比,本文方法求解结果的误差更小、精度更高,当量测点数量越少时,本文方法的优势越明显。因此,本文方法估计结果准确,抗干扰能力强。 展开更多
关键词 谐波源 欠定方程 套索回归 谐波状态估计 惩罚系数
在线阅读 下载PDF
惩罚逻辑回归预测航班延误问题
6
作者 陈伟 霍群 《计算机应用》 北大核心 2025年第S1期194-197,共4页
针对传统统计方法和机器学习技术在处理多重共线性数据时的局限性,探究惩罚逻辑回归(PLR)在航班延误预测中的有效性。首先,回顾航班延误的背景及现状,并分析现有的相关研究所面临的挑战;其次,介绍逻辑回归及其3种惩罚形式(LASSO、L2和... 针对传统统计方法和机器学习技术在处理多重共线性数据时的局限性,探究惩罚逻辑回归(PLR)在航班延误预测中的有效性。首先,回顾航班延误的背景及现状,并分析现有的相关研究所面临的挑战;其次,介绍逻辑回归及其3种惩罚形式(LASSO、L2和弹性网(EN))的理论基础,并探讨它们在航班延误分析中的应用潜力;最后,为了验证PLR方法的有效性,利用真实航班数据进行实验分析。实验结果表明,PLR有效地解决了航班数据中的多重共线性问题,且预测准确度有显著提升。其中,L2-PLR模型的运行最快,LASSO-PLR模型在预测精度上表现最佳,弹性网惩罚逻辑回归(EN-PLR)模型则在运行速度和预测精度之间达到平衡。 展开更多
关键词 航班延误 惩罚逻辑回归 LASSO惩罚 L2惩罚 弹性网惩罚
在线阅读 下载PDF
强噪声下基于加窗LASSO的声源定位方法
7
作者 滕繁 蒋三新 《计算机应用与软件》 北大核心 2025年第3期119-126,共8页
传统声源定位方法往往容易受到低信噪比等不利声学条件的影响,难以同时实现定位的准确性与实时性,为此提出一种基于加窗最小绝对收缩选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)的定位方法。采用加窗LASSO对音频... 传统声源定位方法往往容易受到低信噪比等不利声学条件的影响,难以同时实现定位的准确性与实时性,为此提出一种基于加窗最小绝对收缩选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)的定位方法。采用加窗LASSO对音频信号进行稀疏分解来提取所包含的高能暂态与稳态成分,利用两者进行SRP-PHAT计算,实现目标声源的空间定位。实验结果表明,该方法可以有效抑制环境噪声,将定位误差保持在±10°左右;减小计算复杂度,将每帧的定位时间降低到1 s以下。 展开更多
关键词 结构稀疏分解 相位变换加权的可控功率响应 最小绝对收缩选择算子 强噪声
在线阅读 下载PDF
Discrimination of Acori Tatarinowii Rhizoma from two habitats based on GC-MS fingerprinting and LASSO-PLS-DA 被引量:4
8
作者 马莎莎 张冰洋 +3 位作者 陈练 章晓娟 任达兵 易伦朝 《Journal of Central South University》 SCIE EI CAS CSCD 2018年第5期1063-1075,共13页
This study is intended to explore the chemical differences of Acori Tatarinowii Rhizoma (ATR) samples collected from two habitats, Sichuan and Anhui provinces, China. Gas chromatography-mass spectrometry (GC-MS) w... This study is intended to explore the chemical differences of Acori Tatarinowii Rhizoma (ATR) samples collected from two habitats, Sichuan and Anhui provinces, China. Gas chromatography-mass spectrometry (GC-MS) was applied to establishing the quantitative chemical fingerprints of ATRs. A total of 104 volatile compounds were identified and quantified with the information of mass spectra and retention index (RI). Furthermore, least absolute shrinkage and selection operator (LASSO), a sparse regularization method, combined with subsampling was employed to improve the classification ability of partial least squares-discriminant analysis (PLS-DA). After variable selection by LASSO, three chemical markers,β-elemene, α-selinene and α-asarone, were identified for the discrimination of ATRs from two habitats, and the total classification correct rate was increased from 82.76% to 96.55%. The proposed LASSO-PLS-DA method can serve as an efficient strategy for screening marked chemical components and geo-herbalism research of traditional Chinese medicines. 展开更多
关键词 Acori Tatarinowii Rhizoma gas chromatography-mass spectrometry least absolute shrinkage and selection operator (LASSO) partial least squares-discriminant analysis
在线阅读 下载PDF
基于LASSO回归的宁夏回族自治区不同学段儿童青少年近视影响因素分析 被引量:6
9
作者 谢小莲 陈启 +4 位作者 李静 马娟 王飞 赵海萍 曹娟 《眼科新进展》 CAS 北大核心 2024年第7期549-553,共5页
目的分析宁夏回族自治区儿童青少年近视流行现状、影响因素及不同学段间的差异。方法采用分层整群随机抽样的方法,于2019年9月至12月,在宁夏回族自治区银川市、吴忠市、石嘴山市、固原市和中卫市,随机抽取8所小学、6所初中、6所高中、4... 目的分析宁夏回族自治区儿童青少年近视流行现状、影响因素及不同学段间的差异。方法采用分层整群随机抽样的方法,于2019年9月至12月,在宁夏回族自治区银川市、吴忠市、石嘴山市、固原市和中卫市,随机抽取8所小学、6所初中、6所高中、4所大学的学生为研究对象,小学每个年级抽取5个班级,初中至大学每个年级抽取4个班级,以抽取班级的全体学生作为研究对象,共抽取学生14211人,对其进行问卷调查、体格检查和视力测量。不同学段儿童近视的影响因素采用最小绝对收缩和选择算子(LASSO)联合Logistic回归进行分析,选择贝叶斯信息准则(Bayesian information criterion,BIC)最小的模型为最优模型。结果宁夏回族自治区儿童青少年近视检出率为70.3%,女生高于男生,城市高于乡镇,差异均有统计学意义(均为P<0.001);按学段分层后,随着年级的增加,近视检出率随之升高,小学最低,大学最高,不同学段近视检出率差异有统计学意义(P<0.001)。近视影响因素的LASSO-Logistic回归分析表明,城乡、性别、年龄、目前是否配戴眼镜、每日课间操节数、是否积极参加体力活动和过去6个月是否保持规律活动是小学生近视的影响因素(均为P<0.05);性别、目前是否配戴眼镜是初中生和高中生近视的影响因素(均为P<0.05);目前是否配戴眼镜是大学生近视的影响因素(P<0.05)。结论宁夏回族自治区儿童青少年近视检出率高,不同学段儿童青少年近视影响因素差异明显。配戴眼镜是控制近视的保护因素。应根据儿童青少年所处学段开展有针对性的视力相关知识的健康教育,增强其健康保健意识,提高儿童青少年视力。 展开更多
关键词 近视 学段 儿童青少年 LASSO回归
在线阅读 下载PDF
多传感器信息融合的轴承故障迁移诊断方法 被引量:4
10
作者 包从望 江伟 +1 位作者 张彩红 周大帅 《机电工程》 CAS 北大核心 2024年第5期878-885,共8页
在重型装备低速、重载、强噪声环境下,采用单一传感器难以全面获取轴承的故障诊断信息,导致故障识别率低、识别不稳定,致使变工况下轴承故障迁移诊断失效。针对以上问题,提出了一种多传感器信息融合的轴承故障迁移诊断方法。首先,结合... 在重型装备低速、重载、强噪声环境下,采用单一传感器难以全面获取轴承的故障诊断信息,导致故障识别率低、识别不稳定,致使变工况下轴承故障迁移诊断失效。针对以上问题,提出了一种多传感器信息融合的轴承故障迁移诊断方法。首先,结合传感器的通道数,构建了堆叠卷积神经网络(MCNNs)提取各个通道的故障特征;然后,在MCNNs中引入最小绝对收缩与选择算子(Lasso),并通过网络反向传播完成了特征权值的更新,从而获得了多通道特征的融合;最后,利用源域数据对模型进行了训练,提取了故障特征,并完成了特征融合,采用损失函数完成了模型参数的优化,将源域训练得到的模型结果作为目标域的初始模型,利用目标域样本对初始模型的参数进行了微调,从而完成了模型迁移;并进行了信息融合效果、方法对比以及传感器信息采集属性的性能实验。研究结果表明:传感器的安装位置对信息融合影响较大,MCNNs+Lasso方法具有较好的特征融合效果,平均迁移诊断精度为99.03%,部分精度可达99.97%,在多个变工况的迁移任务中表现出较高迁移精度和良好的泛化性能。 展开更多
关键词 滚动轴承 故障诊断 多传感器信息融合 堆叠卷积神经网络 最小绝对收缩与选择算子 迁移学习
在线阅读 下载PDF
基于DGA与TPE-LightGBM的变压器故障诊断 被引量:6
11
作者 杨金鑫 廖才波 +3 位作者 胡雄 朱文清 张旭 刘邦 《电力科学与技术学报》 CAS CSCD 北大核心 2024年第4期70-77,共8页
油中溶解气体分析(dissolved gas analysis,DGA)对变压器故障的早期预警及诊断具有重要意义。为了提升变压器故障诊断的准确性及可靠性,提出一种基于树结构概率密度估计(tree-structured parzen estimator,TPE)算法优化轻量级梯度提升机... 油中溶解气体分析(dissolved gas analysis,DGA)对变压器故障的早期预警及诊断具有重要意义。为了提升变压器故障诊断的准确性及可靠性,提出一种基于树结构概率密度估计(tree-structured parzen estimator,TPE)算法优化轻量级梯度提升机(light gradient boosting machine,LightGBM)的变压器故障诊断方法。首先,建立包含油中气体比值、编码等16维DGA特征集合,采用最小绝对收缩和选择(least absolute shrinkage and selection opera-tor,LASSO)算法选择用于变压器故障诊断的有效特征量;其次,构建基于LightGBM的变压器故障诊断方法,并引入TPE算法对LightGBM诊断模型参数进行优化,形成最优故障诊断模型;最后,选用精确度、召回率和F1分数等评价指标对所提诊断模型性能进行评估。研究结果表明,TPE-LightGBM的平均准确率为90.23%,其诊断精度及鲁棒性均优于RF和XGBoost等算法。同时,与现场常用的三比值法进行对比,所提方法的准确性和可靠性均有显著提升。该方法可有效提升电力变压器的智能运维水平。 展开更多
关键词 变压器 油中溶解气体 故障诊断 树结构概率密度估计 LASSO算法 轻量级梯度提升机
在线阅读 下载PDF
高尿酸血症与慢性肺源性心脏病的相关性研究:基于LASSO回归与倾向性评分匹配法
12
作者 祁海燕 王捷 +1 位作者 罗玉玺 武云 《中国全科医学》 CAS 北大核心 2024年第24期2954-2960,2968,共8页
背景近年来众多研究表明高尿酸血症(HUA)是某些疾病的影响因素,然而HUA是否为慢性肺源性心脏病(CPHD)的影响因素仍需进一步研究。目的探讨HUA与CPHD的相关性,旨在为CPHD患者血尿酸(SUA)水平的管理提供理论依据。方法纳入2019—2023年新... 背景近年来众多研究表明高尿酸血症(HUA)是某些疾病的影响因素,然而HUA是否为慢性肺源性心脏病(CPHD)的影响因素仍需进一步研究。目的探讨HUA与CPHD的相关性,旨在为CPHD患者血尿酸(SUA)水平的管理提供理论依据。方法纳入2019—2023年新疆医科大学第一附属医院收治的1171例慢性阻塞性肺疾病(COPD)患者为研究对象,根据其是否患有CPHD分为CPHD组(470例)和COPD组(701例)。收集患者一般资料和实验室检查及超声心动图检查结果。采用LASSO回归法对变量进行筛选,采用倾向性评分匹配法(PSM)排除混杂因素影响。采用多因素Logistic回归分析探究COPD患者合并CPHD的影响因素。结果CPHD组女性、汉族、吸烟、饮酒、特发性肺纤维化、慢性支气管炎、支气管哮喘比例、淋巴细胞百分比、左心室舒张末期内径、左心室收缩末期内径、心输出量、左心室射血分数低于COPD组,心功能3~4级、HUA、肺栓塞、先天性心脏病比例、红细胞计数、中性粒细胞百分比、SUA、血尿素氮、D-二聚体、N末端-B型利钠肽前体、右心房内径、右心室内径、左心房内径、右心室流出道内径、肺动脉内径高于COPD组,差异有统计学意义(P<0.05)。LASSO回归筛选出变量后进行PSM,最终得到COPD组469例、CPHD组469例。匹配后CPHD组心功能3~4级、HUA占比、右心房内径、右心室内径、右心室流出道内径、肺动脉内径大于COPD组,支气管哮喘、淋巴细胞百分比低于COPD组,差异有统计学意义(P<0.05)。多因素Logistic回归分析结果显示,HUA升高、心功能3~4级、右心房内径、右心室内径、肺动脉内径增加是COPD患者合并CPHD的危险因素(P<0.05),患有支气管哮喘、左心室舒张末期内径增加为COPD患者合并CPHD的保护因素(P<0.05)。将SUA水平按四分位数分层,多因素Logistic回归分析结果显示,与Q1(SUA<237.31μmol/L)比较,Q4(SUA>381.29μmol/L)患者患有CPHD的风险增加1.421倍。结论HUA是CPHD疾病发生、发展的影响因素,积极控制SUA水平有助于预防CPHD的发生、发展。 展开更多
关键词 肺心病 高尿酸血症 肺疾病 慢性阻塞性 病例对照研究 最小绝对收缩和选择算法 倾向性评分
在线阅读 下载PDF
针对Lasso问题的多维权重求解算法 被引量:8
13
作者 陈善雄 刘小娟 +1 位作者 陈春蓉 郑方园 《计算机应用》 CSCD 北大核心 2017年第6期1674-1679,共6页
最小绝对收缩和选择算子(Lasso)在数据维度约减、异常检测方面有着较强的计算优势。针对Lasso用于异常检测中检测精度不高的问题,提出了一种基于多维度权重的最小角回归(LARS)算法解决Lasso问题。首先考虑每个回归变量在回归模型中所占... 最小绝对收缩和选择算子(Lasso)在数据维度约减、异常检测方面有着较强的计算优势。针对Lasso用于异常检测中检测精度不高的问题,提出了一种基于多维度权重的最小角回归(LARS)算法解决Lasso问题。首先考虑每个回归变量在回归模型中所占权重不同,即此属性变量在整体评价中的相对重要程度不同,故在LARS算法计算角分线时,将各回归变量与剩余变量的联合相关度纳入考虑,用来区分不同属性变量对检测结果的影响;然后在LARS算法中加入主成分分析(PCA)、独立权数法、基于Intercriteria相关性的指标的重要度评价(CRITIC)法这三种权重估计方法,并进一步对LARS求解的前进方向和前进变量选择进行优化。最后使用Pima Indians Diabetes数据集验证算法的优良性。实验结果表明,在更小阈值的约束条件下,加入多维权重后的LARS算法对Lasso问题的解具有更高的准确度,能更好地用于异常检测。 展开更多
关键词 最小绝对收缩和选择算子 变量选择 最小角回归 多元线性回归 加权
在线阅读 下载PDF
基于LASSO-SVM的软件缺陷预测模型研究 被引量:16
14
作者 吴晓萍 赵学靖 +2 位作者 乔辉 刘东梅 王志 《计算机应用研究》 CSCD 北大核心 2013年第9期2748-2751,2754,共5页
针对当前大多数软件缺陷预测模型预测准确率较差的问题,提出了结合最小绝对值压缩和选择方法与支持向量机算法的软件缺陷预测模型。首先利用最小绝对值压缩与选择方法的特征选择能力降低了原始数据集的维度,去除了与软件缺陷预测不相关... 针对当前大多数软件缺陷预测模型预测准确率较差的问题,提出了结合最小绝对值压缩和选择方法与支持向量机算法的软件缺陷预测模型。首先利用最小绝对值压缩与选择方法的特征选择能力降低了原始数据集的维度,去除了与软件缺陷预测不相关的数据集;然后利用交叉验证算法的参数寻优能力找到支持向量机的最优相关参数;最后运用支持向量机的非线性运算能力完成了软件缺陷预测。仿真实验结果表明,所提出的缺陷预测模型与传统的缺陷预测模型相比具有较高的预测准确率,且预测速度更快。 展开更多
关键词 软件缺陷预测 最小绝对值压缩与选择方法 特征选择 支持向量机 交叉验证
在线阅读 下载PDF
基于变量选择-神经网络模型的复杂路网短时交通流预测 被引量:13
15
作者 蒋士正 许榕 陈启美 《上海交通大学学报》 EI CAS CSCD 北大核心 2015年第2期281-286,共6页
针对传统交通流预测模型正在由单断面历史数据处理向多断面、多时刻历史数据处理转变,但在考虑各断面间的影响时,多变的交通状况往往会使预测模型复杂化的问题,引入一种多元线性回归最小绝对收缩和选择算子方法(Lasso),并利用其优秀的... 针对传统交通流预测模型正在由单断面历史数据处理向多断面、多时刻历史数据处理转变,但在考虑各断面间的影响时,多变的交通状况往往会使预测模型复杂化的问题,引入一种多元线性回归最小绝对收缩和选择算子方法(Lasso),并利用其优秀的变量选择能力,在复杂路网多断面中选出相关性较高的断面;结合神经网络(NN)的非线性特性,提出了Lasso-NN组合模型.结果表明:Lasso-NN模型在路网交叉口对未来15min交通流数据预测的误差率低于9.2%;在非交叉口的误差率低于6.7%,总体优于各自单独使用得出的结果. 展开更多
关键词 短时交通流预测 最小绝对收缩和选择算子 变量选择 神经网络
在线阅读 下载PDF
基于集合经验模态分解和套索算法的短期风速组合变权预测模型研究 被引量:13
16
作者 杨磊 黄元生 +2 位作者 张向荣 董玉琳 高冲 《电力系统保护与控制》 EI CSCD 北大核心 2020年第10期81-90,共10页
准确的风速预测对风电场实现平稳出力具有重要意义。为提高短期风速预测精度,提出一种基于集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)、套索算法(Least Absolute Shrinkage and Selection Operator, LASSO)、遗传算... 准确的风速预测对风电场实现平稳出力具有重要意义。为提高短期风速预测精度,提出一种基于集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)、套索算法(Least Absolute Shrinkage and Selection Operator, LASSO)、遗传算法(Genetic Algorithm, GA)、广义回归神经网络(General Regression Neural Network, GRNN)和长短期记忆模型(Long Short-Term Memory,LSTM)的短期风速变权组合预测模型(Variable Weighted Hybrid Model, VWHM)。首先运用集合经验模态分解技术,将原始风速时间序列分解成多个不同的子序列。然后运用套索算法对各个子序列的数据变量进行筛选,提取代表性变量作为预测输入。最后利用GA的全局优化能力,对由GRNN和LSTM构成的组合预测模型的权重系数进行移动样本自适应变权求解,并加权得到最终预测结果。仿真结果表明,所提的变权组合模型比单一模型以及传统组合模型具有更高的预测精度,且在风速预测中具有优越性。 展开更多
关键词 短期风速预测 集合经验模态分解 套索算法 广义回归神经网络 长短期记忆 遗传算法
在线阅读 下载PDF
高维数据挖掘中特征选择的稳健方法 被引量:3
17
作者 李泽安 陈建平 +1 位作者 章雅娟 赵为华 《计算机应用》 CSCD 北大核心 2013年第8期2194-2197,2235,共5页
针对高维数据的特点,即数据中变量个数往往大于样本观测数目,并且数据往往具有异质性特点,基于众数回归分析和变量选择降维技术,提出了一种稳健有效的特征选择方法,利用局部二次逼近算法(LQA)和最大期望(EM)算法,给出估计算法和最优调... 针对高维数据的特点,即数据中变量个数往往大于样本观测数目,并且数据往往具有异质性特点,基于众数回归分析和变量选择降维技术,提出了一种稳健有效的特征选择方法,利用局部二次逼近算法(LQA)和最大期望(EM)算法,给出估计算法和最优调节参数的选取方法。通过实验的模拟数据分析表明,所提出的特征提取选择方法整体优于基于最小二乘和中位数的正则化估计方法,特别当误差是非正态分布时,与已有方法相比具有较高的预测能力和稳健性。 展开更多
关键词 高维数据 特征选择 众数回归 自适应LASSO 最大期望算法
在线阅读 下载PDF
微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究 被引量:3
18
作者 陈江鹏 彭斌 +3 位作者 文雯 唐小静 文小焱 胡珊 《中国卫生统计》 CSCD 北大核心 2015年第3期407-409,413,共4页
目的探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和ov... 目的探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和overlap group LASSO(简称为og LASSO)变量选择的影响。结果经典的LASSO、og LASSO变量选择方法在处理模拟微阵列数据时具有较好的预测精度(AUCLASSO=0.8915≈AUCog LASSO=0.8923>AUCnog LASSO=0.8396,MSEnog LASSO=0.1358>MSEog LASSO=0.0975≈MSELASSO=0.0928),LASSO可解释性最强(平均入选模型基因数分别为21.52、111.95、101.01)。nog LASSO在处理基因通路信息时,当[X295]被错分至第19个通路后,尽管未改变其效应值,但入选模型次数大为减少,预测精度下降较为明显,而og LASSO表现更稳健。结论融合微阵列数据中的先验信息并未提高基于LASSO变量选择方法的预测性能及效率,经典的LASSO变量选择方法仍为处理微阵列数据的有效方法。 展开更多
关键词 变量选择 LASSO算法 模拟
在线阅读 下载PDF
双参数纹理分析结合机器学习在高级别前列腺癌中的诊断价值 被引量:7
19
作者 肖建明 牛翔科 +3 位作者 王娜 陈志凡 王宗勇 彭涛 《中国医学影像学杂志》 CSCD 北大核心 2021年第2期177-180,共4页
目的对比MR双参数与多参数成像纹理及定量分析结合机器学习对高级别前列腺癌的诊断价值。资料与方法回顾性分析疑似前列腺癌并行前列腺多参数MRI和经直肠超声引导穿刺活检取得病理结果的194例患者,采用Omni-Kinetics软件分别在T2WI、表... 目的对比MR双参数与多参数成像纹理及定量分析结合机器学习对高级别前列腺癌的诊断价值。资料与方法回顾性分析疑似前列腺癌并行前列腺多参数MRI和经直肠超声引导穿刺活检取得病理结果的194例患者,采用Omni-Kinetics软件分别在T2WI、表观扩散系数(ADC)、T1加权动态磁敏感增强(T1WI_DSC)序列勾画病灶所在全部层面兴趣区,提取病变区纹理及定量特征数据后采用多因素Logistic回归分析。应用受试者工作特征(ROC)曲线评价双参数(T2WI+ADC)与多参数(T2WI+ADC+T1WI_DSC)诊断高级别前列腺癌的差异。结果双参数诊断高级别前列腺癌的敏感度为82.61%,特异度为86.11%,准确度为84.75%;多参数诊断高级别前列腺癌的敏感度为86.97%,特异度为86.11%,准确度为86.44%。两验证组ROC曲线下面积差异无统计学意义(0.918比0.946,P=0.077)。结论MR双参数纹理分析结合机器学习诊断高级别前列腺癌有较高的准确性。 展开更多
关键词 前列腺肿瘤 磁共振成像 扩散加权成像 表观扩散系数 纹理分析 最少绝对收缩和选择算子
在线阅读 下载PDF
基于弹性网降维及花授粉算法优化BP神经网络的短期电力负荷预测 被引量:46
20
作者 张淑清 杨振宁 +2 位作者 张立国 苑世钰 王志义 《仪器仪表学报》 EI CAS CSCD 北大核心 2019年第7期47-54,共8页
电力负荷预测为电力系统规划和运行提供可靠的决策依据。随着智能电网的全面发展,数据采集与监视控制系统(SCADA)获取数据量增加,数据的结构也更加复杂,负荷的频繁变化以及地区性的气象因素等都将影响负荷的预测的准确性。提出一种弹性... 电力负荷预测为电力系统规划和运行提供可靠的决策依据。随着智能电网的全面发展,数据采集与监视控制系统(SCADA)获取数据量增加,数据的结构也更加复杂,负荷的频繁变化以及地区性的气象因素等都将影响负荷的预测的准确性。提出一种弹性网(EN)进行大数据降维以及花授粉算法(FPA)优化BP神经网络的短期电力负荷预测方法。首先采用弹性网对负荷和气象等高维大数据进行选择和降维。弹性网通过在惩罚项中添加L1范数和L2范数,兼具了最小绝对值收缩及变量选择(LASSO)和岭回归的优点,克服了LASSO降维时因为数据内部存在共线性和群组效应而影响降维效果的问题;然后,考虑到BP神经网络权值和阈值容易受到初值的影响、收敛速度慢以及容易陷入局部最优,引入花授粉算法(FPA)优化BP神经网络,通过与粒子群算法(PSO)对比得出花授粉算法寻优速度更快,效果更好。本文方法应用于实际电力负荷预测,结果表明能有效提高预测精度。 展开更多
关键词 短期电力负荷预测 大数据变量选择及降维 最小绝对值收缩及变量选择 弹性网 花授粉算法优化BP神经网络
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部