期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
基于最大信息系数的软件缺陷预测模型 被引量:4
1
作者 崔军 刘亚娜 +2 位作者 郭新峰 王瑞波 李济洪 《应用概率统计》 CSCD 北大核心 2019年第1期86-108,共23页
在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差... 在软件缺陷预测的回归建模中,由静态代码提取的类层面度量元(特征)以及由方法聚合(sum、avg、max、min)到类的特征往往较多,使用传统的特征选择方法(如AIC、BIC)通常先要确定了模型,不同的模型选出的特征集差异较大,且模型的可解释性差.最大信息系数MIC (maximal information coefficient)是Reshef等^([4])提出的度量两个连续变量之间相互依赖程度的一个指标,且有基于观测数据的计算办法.本文基于软件缺陷个数与各特征的MIC度量先选择特征,再对所选特征进行了适当的幂次变换,最后使用主成分泊松和负二项回归建模.本文实验基于NASA的KC1的类层面数据集,采用了m×2交叉验证的序贯t-检验来对两模型的性能差异的显著性进行检验,模型性能评价指标采用FPA、AAE、ARE.实验结果表明:1)基于MIC选出的特征主要是sum、avg、max三种聚合模式特征,与AIC、BIC方法有明显的差异;2)对特征做适当的幂次变换在多数模型下可以改善其性能;3)对特征做幂次变换后,做主成分分析与因子分析可以得到两个明显的因子,其一个因子正好对应avg与max聚合模式的特征集,另一个因子正好对应sum的聚合模式特征集,使得模型具有较好的可解释性.综合实验的各项指标可以得出,sum、avg、max三种聚合模式对软件缺陷预测有显著作用,且基于MIC所选特征而构造的模型是有优势的. 展开更多
关键词 MIC度量 软件缺陷预测 泊松回归模型 负二项回归模型 m×2交叉验证序贯t-检验
在线阅读 下载PDF
利用隐语义生成对抗网络的恶意软件检测
2
作者 王玉洁 赵丽 《控制工程》 CSCD 北大核心 2020年第4期746-750,共5页
随着恶意软件数量的增多,传统人工分析方法已无法胜任。针对这一问题,本文提出一种支持向量机分类器与隐语义生成对抗网络(Latent Factor Generative Adversarial Networks, LF-GAN)相结合的恶意软件检测新方法,其通过提取具有i个服从... 随着恶意软件数量的增多,传统人工分析方法已无法胜任。针对这一问题,本文提出一种支持向量机分类器与隐语义生成对抗网络(Latent Factor Generative Adversarial Networks, LF-GAN)相结合的恶意软件检测新方法,其通过提取具有i个服从特定高斯分布的特征量用以自动区分恶意软件和正常软件。具体方法为利用变分自动编码器(Variational Autoencoder,VAE)将数据投影至隐空间以便于特征提取,并作为训练集传递至所设计的LF-GAN,以进一步优化网络中关键特征参数。算例结果表明,本文所提LF-GAN对恶意软件检测精度达到96.97%,且高于其他传统检测方法,即本文所提方法具备良好的对恶意软件的检测和识别能力。 展开更多
关键词 恶意软件检测 隐语义生成对抗网络 变分自动编码器 深度学习 支持向量机
在线阅读 下载PDF
Weibull分布引进故障的软件可靠性增长模型 被引量:13
3
作者 王金勇 张策 +2 位作者 米晓萍 郭新峰 李济洪 《软件学报》 EI CSCD 北大核心 2019年第6期1759-1777,共19页
软件调试是复杂过程,可能会受到很多种因素的影响,例如调试资源分配、调试工具的使用情况、调试技巧等.在软件调试过程中,当检测到的故障被去除时,新的故障可能会被引进.因此,研究故障引进的现象对建立高质量的软件可靠性增长模型具有... 软件调试是复杂过程,可能会受到很多种因素的影响,例如调试资源分配、调试工具的使用情况、调试技巧等.在软件调试过程中,当检测到的故障被去除时,新的故障可能会被引进.因此,研究故障引进的现象对建立高质量的软件可靠性增长模型具有重要意义.但是到目前为止,模拟故障引进过程仍是一个复杂和困难的问题.虽然有许多研究者开发了一些不完美调试的软件可靠性增长模型,但是一般都是假设故障内容(总数)函数为线性、指数分布或者是与故障去除的数量成正比.这个假设与实际的软件调试过程中故障引进情况并不完全一致.提出一种基于Weibull分布引进故障的软件可靠性增长模型,考虑故障内容(总数)函数服从 Weibull分布,并用相关的实验验证了提出的模型的拟合和预测性能.在用两个故障数据集进行的模拟实验中,实验结果指出:提出的模型和其他模型相比,有更好的拟合和预测性能以及更好的鲁棒性. 展开更多
关键词 软件可靠性 软件可靠性增长模型 非齐次泊松过程 不完美调试 Weibull 分布的故障内容函数
在线阅读 下载PDF
基于混合软件定义网络的路由保护算法 被引量:2
4
作者 耿海军 张伟 尹霞 《计算机工程》 CAS CSCD 北大核心 2020年第6期209-215,共7页
为使混合软件定义网络(SDN)体系架构能够应对网络中的单链路故障情形,提出一种基于混合软件定义网络的路由保护算法。在混合SDN网络中部署应对单链路故障的路由保护算法,将其归结为一个0-1整数规划问题,并利用启发式算法计算该问题对应... 为使混合软件定义网络(SDN)体系架构能够应对网络中的单链路故障情形,提出一种基于混合软件定义网络的路由保护算法。在混合SDN网络中部署应对单链路故障的路由保护算法,将其归结为一个0-1整数规划问题,并利用启发式算法计算该问题对应的近似最优解。通过实例介绍算法的执行过程,分析算法对应的时间复杂度。实验结果表明,该算法仅需将传统网络中的少部分节点升级为SDN节点,即可应对网络中可能出现的单链路故障情形,且对应的路径拉伸度在1.4以内。 展开更多
关键词 混合软件定义网络 单链路故障 启发式算法 整数规划模型 故障保护率
在线阅读 下载PDF
基于遗传算法的混合软件定义网络路由节能算法 被引量:9
5
作者 张举 王浩 +2 位作者 罗舒婷 耿海军 尹霞 《计算机科学》 CSCD 北大核心 2020年第6期236-241,共6页
随着软件定义网络(Software Defined Network,SDN)技术的快速发展,互联网必将长期处于传统网络设备和SDN设备共存的混合SDN网络状态。混合SDN网络中的路由节能研究是一项关键的工作。文中提出了一种基于遗传算法的混合软件定义网络路由... 随着软件定义网络(Software Defined Network,SDN)技术的快速发展,互联网必将长期处于传统网络设备和SDN设备共存的混合SDN网络状态。混合SDN网络中的路由节能研究是一项关键的工作。文中提出了一种基于遗传算法的混合软件定义网络路由节能算法(Hybrid Software Defined Network Energy Efficient Routing Algorithm Based on Genetic Algorithm,EEHSDNGA)。文中致力于解决两方面的问题:1)如何在网络中有选择性地将传统网络设备升级为SDN设备;2)如何选择性地关闭链路。对于第一个问题,利用遗传算法进行解决。针对第二个问题,文中提出了链路关键度模型,即根据链路的重要性逐个关闭网络中的链路。实验结果表明,在Abilene网络中,EEHSDNGA的节能比率可达36%;在Geant网络中,EEHSDNGA的节能比率高达42.5%。EEHSDNGA的节能效果远远优于LF,HEATE和EEGAH的节能效果。 展开更多
关键词 混合软件定义网络 遗传算法 链路关键度模型 部署开销比率
在线阅读 下载PDF
考虑排错过程引进故障的开源软件可靠性模型研究 被引量:4
6
作者 米晓萍 王金勇 《计算机应用研究》 CSCD 北大核心 2019年第7期2070-2074,2080,共6页
如何评估开源软件的可靠性是一个重要的问题,与传统的闭源软件相比,在建立开源软件可靠性模型时必须考虑故障引入和故障检测与排错之间的延迟时间这两个因素。考虑了排错过程和不完美调试现象,提出了相应的开源软件可靠性模型,并且用两... 如何评估开源软件的可靠性是一个重要的问题,与传统的闭源软件相比,在建立开源软件可靠性模型时必须考虑故障引入和故障检测与排错之间的延迟时间这两个因素。考虑了排错过程和不完美调试现象,提出了相应的开源软件可靠性模型,并且用两个开源软件故障数据集实验来验证提出模型的拟合性能与预测性能。实验结果表明,提出的模型在开源软件可靠性评估中具有良好的拟合和预测性能,以用于开源软件在实际的开发过程中的可靠性评估。 展开更多
关键词 软件可靠性 软件可靠性模型 排错过程 不完美调试 开源软件
在线阅读 下载PDF
基于软件定义网络的域内路由保护方案研究 被引量:2
7
作者 张举 耿海军 《计算机应用研究》 CSCD 北大核心 2019年第3期921-924,共4页
软件定义网络(SDN)是一种将控制平面和转发平面分离的新型网络体系结构。由于其灵活性和可控性得到了业界的青睐。目前SDN采用最优路径转发报文,很难应对网络中频繁出现的节点或者链路故障。因此,为了提高SDN的可用性,提出了一种基于软... 软件定义网络(SDN)是一种将控制平面和转发平面分离的新型网络体系结构。由于其灵活性和可控性得到了业界的青睐。目前SDN采用最优路径转发报文,很难应对网络中频繁出现的节点或者链路故障。因此,为了提高SDN的可用性,提出了一种基于软件定义网络的域内路由保护方案(intra-domain routing protectionscheme based on software defined network,RPBSDN)。该方案可以为网络中的每个源—目的对计算出多个备份下一跳,利用节点加入到最短路径树的偏序关系来保证转发路径没有路由环路。实验结果表明,该方案不仅具有较小的计算复杂度,而且大大提高了网络的可用性。 展开更多
关键词 软件定义网络 开放最短路径优先 备份下一跳 偏序关系
在线阅读 下载PDF
基于Dropout正则化的汉语框架语义角色识别 被引量:17
8
作者 王瑞波 李济洪 +1 位作者 李国臣 杨耀文 《中文信息学报》 CSCD 北大核心 2017年第1期147-154,共8页
汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来... 汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来改进神经网络的训练过程。实验结果表明,Dropout正则化的加入有效地缓解了模型的过拟合现象,使得模型的F值有了近7%的提高。该文进一步优化了学习率以及分布式表示的初始值,最终的汉语框架语义角色识别的F值达到70.54%,较原有的最优结果提升2%左右。 展开更多
关键词 汉语框架网络 语义角色识别 Dropout正则化
在线阅读 下载PDF
可靠性模型中故障检测率研究述评 被引量:11
9
作者 张策 刘宏伟 +4 位作者 白睿 王瞰宇 王金勇 吕为工 孟凡超 《软件学报》 EI CSCD 北大核心 2020年第9期2802-2825,共24页
故障检测率FDR(fault detection rate)是可靠性研究的关键要素,对于测试环境构建、故障检测效率提升、可靠性建模和可靠性增长具有重要作用,对于提高系统可靠性与确定发布时间具有重要现实意义.首先,对基于NHPP(non-homogeneous poisson... 故障检测率FDR(fault detection rate)是可靠性研究的关键要素,对于测试环境构建、故障检测效率提升、可靠性建模和可靠性增长具有重要作用,对于提高系统可靠性与确定发布时间具有重要现实意义.首先,对基于NHPP(non-homogeneous poisson process,非齐次泊松过程)类的软件可靠性增长模型SRGM(software reliability growth mode)进行概述,给出了建模本质、功用与流程.基于此,引出可靠性建模与研究中的关键参数——FDR,给出定义,对测试环境描述能力进行分析,展示不同模型的差异.着重剖析了FDR与失效强度、冒险率(风险率)的区别,得出三者之间的关联性表述.全面梳理了FDR的大类模型,分别从测试覆盖函数视角、直接设定角度、测试工作量函数参与构成方式这3个方面进行剖析,继而提出统一的FDR相关的可靠性模型.考虑到对真实测试环境描述能力的需要,建立不完美排错框架模型,衍生出不完美排错下多个不同FDR参与的可靠性增长模型.进一步,在12个真实描述应用场景与公开发表的失效数据集上进行实验,验证不同FDR模型相关的可靠性模型效用,对差异性进行分析与讨论.结果表明,FDR模型自身的性能可以支撑可靠性模型性能的提升.最后,指出了未来研究趋势和需要解决的问题. 展开更多
关键词 可靠性 故障检测率 测试覆盖率 不完美排错 效用分析
在线阅读 下载PDF
基于FCM聚类的WSN加权概率簇头选择算法 被引量:11
10
作者 赵立新 董朝贤 赵丽 《控制工程》 CSCD 北大核心 2019年第6期1211-1215,共5页
针对传统LEACH算法能量消耗快、网络寿命低的问题,提出一种无线传感器网络(Wireless Sensor Network,WSN)路由协议中基于FCM聚类的加权概率簇头选择算法,该算法主要优化了簇头的选择。首先根据FCM聚类算法,以节点位置坐标为参考将WSN分... 针对传统LEACH算法能量消耗快、网络寿命低的问题,提出一种无线传感器网络(Wireless Sensor Network,WSN)路由协议中基于FCM聚类的加权概率簇头选择算法,该算法主要优化了簇头的选择。首先根据FCM聚类算法,以节点位置坐标为参考将WSN分为若干个区域。假设WSN是由具有不同节点能量的异构节点组成,根据不同的节点类型,利用加权概率的概念选择网络簇的簇头,同时使簇头节点的分布更加均匀。仿真结果表明,改进算法明显提升了路由效果并延长了网络的寿命。 展开更多
关键词 无线传感器网络 LEACH FCM聚类 路由 加权概率
在线阅读 下载PDF
股票收益反转效应及与买卖价差关系研究 被引量:6
11
作者 董晨昱 刘维奇 +1 位作者 LIU Wei-min 王钰 《管理科学学报》 CSSCI 北大核心 2016年第6期171-182,共12页
研究了买卖价差与股票短期收益反转的关系.拓展了"真实"价格保持不变或遵循随机游走的假设,在三种情形下对比连续时间上观测价格和"真实"价格的路径图及其价格变化的联合分布来分析买卖价差对股票短期收益反转的影... 研究了买卖价差与股票短期收益反转的关系.拓展了"真实"价格保持不变或遵循随机游走的假设,在三种情形下对比连续时间上观测价格和"真实"价格的路径图及其价格变化的联合分布来分析买卖价差对股票短期收益反转的影响,结果表明,当"真实"收益的一阶自相关系数接近于0时,买卖价差是造成观测收益反转的唯一原因;当"真实"收益有较强的一阶负自相关性时,买卖价差对观测收益反转的作用不再明显,甚至可能减弱此效应;买卖价差加剧了观测收益的波动.通过买卖价差与股票观测收益间的恒等关系,建立了收益分解模型,将"真实"收益从观测收益中分离,随后使用NASDAQ市场的个股日、周和月数据进行横截面回归和方差比检验,实证结果也支持上述结论. 展开更多
关键词 收益反转 买卖价差 方差比检验
在线阅读 下载PDF
基于RNN的中文二分结构句法分析 被引量:16
12
作者 谷波 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2019年第1期35-45,共11页
为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换... 为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构。该文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序列标注模型(RNN-Interval,RNN-INT),与常用的循环神经网络模型(RNN,LSTM)和条件随机场模型(CRF)进行对比实验,使用mx2交叉验证序贯t-检验来比较模型。实验结果表明,RNN-INT模型在窗口为1的词特征就可达到最好的性能,并好于其他窗口大小和其他序列标注模型(RNN,LSTM,CRF)。最后,在测试集上,在人工分词下,RNN-INT在短语级别的F1值(块F1)达到71.25%,在句子级别的准确率达到约43%。 展开更多
关键词 层次句法分析 循环神经网络(RNN) m×2CV序贯t-检验
在线阅读 下载PDF
基于词分布式表征的汉语框架排歧模型 被引量:7
13
作者 张力文 王瑞波 +1 位作者 李茹 张晟 《中文信息学报》 CSCD 北大核心 2017年第6期50-57,共8页
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统... 框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统方法相比,该模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%。并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性。 展开更多
关键词 汉语框架 框架排歧 分布式表征
在线阅读 下载PDF
扩展断言知识检验一致的需求建模方法 被引量:2
14
作者 郭新峰 马世龙 +1 位作者 吕江花 李睿 《智能系统学报》 CSCD 北大核心 2015年第1期81-89,共9页
保证需求完整一致是需求建模的关键,文中提出一种基于知识库推理检验一致性的需求建模方法,该方法在建模中引入本体以增强表达能力,并结合语义建立约束规则构建需求模型知识库,基于描述逻辑描述需求和检验需求一致性,将需求建模过程作... 保证需求完整一致是需求建模的关键,文中提出一种基于知识库推理检验一致性的需求建模方法,该方法在建模中引入本体以增强表达能力,并结合语义建立约束规则构建需求模型知识库,基于描述逻辑描述需求和检验需求一致性,将需求建模过程作为断言知识库的扩展过程,把需求完整性问题转化为需求一致性问题,并归结其为规则约束下的可满足问题。利用Tableau算法等实现需求一致性的检验,在整个建模活动中保证需求一致。应用实践中使用自行编制的ROB半自动建模软件进行需求建模与分析,验证了建模方法的需求一致性,并通过案例说明了扩展断言知识库检验一致的需求建模过程。 展开更多
关键词 需求模型 一致性 完整性 多视点 描述逻辑 知识库 可满足性 TABLEAU 需求工程
在线阅读 下载PDF
一种均衡的RHS交叉验证 被引量:2
15
作者 杨静 王瑞波 李济洪 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期842-849,共8页
在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系.也就是说,不同的切分方式会导致训练集中所含共同样本的... 在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系.也就是说,不同的切分方式会导致训练集中所含共同样本的个数不同,当共同样本较多时,交叉验证估计具有较大的方差.为此构造了一种均衡的RHS(Repeated Half-sampling)交叉验证,使得训练集所含共同样本的个数的总和最小,并且任意两个切分之间的共同样本个数保持均衡,进而降低泛化误差估计的方差,进而有效地提高泛化误差估计的稳定性.从理论上证明了6次均衡的RHS交叉验证估计的方差小于组块3×2交叉验证,并且进一步通过模拟实验验证这一结论.同时,从实验结果可以说明6次均衡的RHS交叉验证估计的方差小于随机RHS交叉验证估计的方差.进一步,在真实数据集上大量的实验验证了这些结论. 展开更多
关键词 交叉验证 泛化误差 组块3×2交叉验证 RHS交叉验证
在线阅读 下载PDF
我国煤炭价格影响因素的VAR模型分析 被引量:28
16
作者 张建英 《经济问题》 CSSCI 北大核心 2016年第1期108-112,共5页
煤炭是我国重要的基础能源与化工材料,在国民经济的发展中占据着重要的战略地位。煤炭价格是反映煤炭行业发展变化中直观可测的变量,煤炭价格的波动不仅会影响到煤炭行业自身,还涉及到国民经济的发展和社会稳定。通过对影响煤炭价格的... 煤炭是我国重要的基础能源与化工材料,在国民经济的发展中占据着重要的战略地位。煤炭价格是反映煤炭行业发展变化中直观可测的变量,煤炭价格的波动不仅会影响到煤炭行业自身,还涉及到国民经济的发展和社会稳定。通过对影响煤炭价格的因素进行分析,可以发现煤炭价格变化的原因及煤炭价格与国民经济的交互作用。利用2009-2012年煤炭价格和对其产生影响的相关月度数据,运用单位根检验、协整检验、Granger因果检验及VAR模型对影响我国煤炭价格的因素进行了研究。研究结果表明,煤炭价格主要受自身波动的影响,其次受大宗商品价格、宏观经济景气指数和煤炭产量影响。 展开更多
关键词 煤炭价格 协整检验 GRANGER因果检验 VAR模型
在线阅读 下载PDF
基于逐跳方式的单链路故障保护算法 被引量:1
17
作者 耿海军 施新刚 +2 位作者 王之梁 尹霞 尹少平 《计算机科学》 CSCD 北大核心 2017年第7期68-73,共6页
当网络中的某条链路出现故障时,互联网部署的域内路由协议需要重新收敛,在收敛过程中经过该链路的报文将会被丢弃。针对该问题,IETF(the Internet Engineering Task Force)提出了快速重路由保护框架,利用该框架可以有效地解决网络中单... 当网络中的某条链路出现故障时,互联网部署的域内路由协议需要重新收敛,在收敛过程中经过该链路的报文将会被丢弃。针对该问题,IETF(the Internet Engineering Task Force)提出了快速重路由保护框架,利用该框架可以有效地解决网络中单链路故障造成的报文丢失问题,然而该方案并不能完全保护网络中所有可能的单链路故障。基于该框架研究者提出了一种基于隧道的解决方案,该方案虽然可以提供100%的单链路故障保护,但是需要辅助机制的协助,开销较大,难以实际部署。因此,提出了一种基于逐跳方式的针对单链路故障的全保护方案,该方案可以解决网络中任意的单链路故障造成的报文丢失问题。 展开更多
关键词 路由保护 链路故障 域内路由
在线阅读 下载PDF
组块3×2交叉验证的F1度量的方差分析 被引量:2
18
作者 杨柳 王钰 《计算机科学与探索》 CSCD 北大核心 2016年第8期1176-1183,共8页
在统计机器学习的研究中,研究者常常通过定量实验来对照基于交叉验证的分类算法的F1度量,为了得到统计可信的结论,估计它的不确定性是非常重要的。特别地,组块3×2交叉验证方法被大量理论和实验验证了它的性能优于诸如标准K折交叉... 在统计机器学习的研究中,研究者常常通过定量实验来对照基于交叉验证的分类算法的F1度量,为了得到统计可信的结论,估计它的不确定性是非常重要的。特别地,组块3×2交叉验证方法被大量理论和实验验证了它的性能优于诸如标准K折交叉验证的其他常用交叉验证方法。为此,理论上研究了基于组块3×2交叉验证的F1度量的方差。方差的结构表明它由块方差、块内协方差和块间协方差三部分组成,从而说明了广泛使用的样本方差估计可能严重地低估或高估真实的方差。通过条形图方法在模拟和真实数据上进行实验,验证了上述理论结果,实验结果表明块内、块间协方差和块方差是同阶的,块内和块间相关性是不可忽略的。 展开更多
关键词 F1度量 交叉验证 方差 分类算法 模拟实验
在线阅读 下载PDF
基于中智模糊关联规则生成的大数据挖掘分析算法 被引量:8
19
作者 梁凡 赵丽 《计算机应用与软件》 北大核心 2019年第10期285-292,298,共9页
关联规则挖掘作为一种大数据挖掘方法,被用于确定不同项目间存在的内在联系,并以大于某一阈值作为评判不同项间存在关联的依据。传统关联规则挖掘方法仅能建立不同项间的布尔型关联规则,存在硬化数据“尖锐边界”问题导致关联规则挖掘... 关联规则挖掘作为一种大数据挖掘方法,被用于确定不同项目间存在的内在联系,并以大于某一阈值作为评判不同项间存在关联的依据。传统关联规则挖掘方法仅能建立不同项间的布尔型关联规则,存在硬化数据“尖锐边界”问题导致关联规则挖掘性能下降的缺点。为克服经典数据挖掘算法的这一缺陷,提出一种新型中智关联规则挖掘算法。基于专家知识对语言学术语进行量化预处理,得到不同指标的量化数据资料库;基于关联规则支持度定义计算不同指标项集合的支持度;通过考虑不同项间的隶属度、不确定度和非隶属度函数生成关联规则。将该中智挖掘算法与模糊挖掘算法进行对比,结果表明,该算法能够增加生成关联规则数量,有助于提高数据挖掘的准确性。 展开更多
关键词 大数据 数据挖掘 中智关联规则生成 模糊化理论 隶属度函数
在线阅读 下载PDF
农业机械远程电子监测技术研究——基于分簇无线传感器网络路由算法 被引量:6
20
作者 朱壮普 吴勇 《农机化研究》 北大核心 2020年第1期199-203,共5页
在进行农机的远程电子监测时,为了实现监测的实时性需要引入时间同步技术。为此,针对无线传感器网络中时间同步技术应具有高效率且节省资源的要求,给出了一种基于分簇的改进路由算法,使用时间同步有效性检查阶段的时间戳,在只发送一个... 在进行农机的远程电子监测时,为了实现监测的实时性需要引入时间同步技术。为此,针对无线传感器网络中时间同步技术应具有高效率且节省资源的要求,给出了一种基于分簇的改进路由算法,使用时间同步有效性检查阶段的时间戳,在只发送一个小数据包的基础上实现同步功能,从而有效降低了能源消耗,提高了同步通信的效率。为了验证方案的可行性,采用NS2仿真软件和实验的方式对同步通信能力进行了验证,结果表明:采用改进后的路由算法可以有效提高同步通信的效率,且实验结果和仿真结果基本吻合,从而验证了方案的可行性和可靠性。 展开更多
关键词 无线传感网络 分簇算法 农机监控 同步通信 NS2仿真
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部