检索结果-维普期刊中文期刊服务平台

基于GBDT的个人信用评估方法被引量：15: 1; 作者王黎廖闻剑《电子设计工程》 2017年第15期68-72,共5页; 近年来,个人信用评估问题成为信贷行业的研究热点,针对当前应用于信用评估的分类算法大多存在只对某种类型的信用数据集具有较好的分类效果的问题,提出了基于Gradient Boosted Decision Tree(GBDT)的个人信用评估方法。GBDT天然可处理... 展开更多; 关键词信用评估分类算法 GBDT; 在线阅读下载PDF 职称材料

模糊时间序列模型在论域定义上的研究被引量：4: 2; 作者汪洋陈海燕彭艳兵《电子设计工程》 2017年第2期9-13,共5页; 文中基于模糊时间序列模型,提出了如何定义论域的方法。预测人员在不断地应用模糊时间序列模型进行预测的同时,也对此模型进行了不同方面的改进,但是大部分主要包括两个方面:一是论域划分,而是模糊关系表示。在论域划分上面,现有的研究... 展开更多; 关键词模糊时间序列论域区间定义数据分布论域划分; 在线阅读下载PDF 职称材料

基于地理位置时间序列的相似性研究被引量：1: 3; 作者彭艳兵姚伟烈刘卫江《电子设计工程》 2017年第8期37-40,共4页; 位置时间序列常被应用到不同的研究领域,具有很高的商业价值。本文通过计算位置时间序列的余弦相似度找到确定与其近似的位置时间序列。同时针对余弦相似度在计算位置时间序列相似性出现的偏差,提出了一种余弦相似度的改进方法(单侧相似... 展开更多; 关键词上网习惯位置时间序列位置权重余弦相似度单侧相似度; 在线阅读下载PDF 职称材料

基于Solr的混合介质存储在淘宝系统中的研究与应用被引量：1: 4; 作者汪洋崔炜《电子设计工程》 2017年第15期22-25,共4页; DT时代已经来临,开源搜索引擎已经成为各大公司检索海量数据的主流,其中Solr以其支持多种格式索引,高效性,高灵活性,高可扩展性,深受广大爱好者以及各大公司青睐,本文基于提高Solr检索速度和对数据管理便捷性,提出了混合介质存储分盘管... 展开更多; 关键词 LUCENE SOLR 混合介质存储存储数据的冷热淘宝用户评论检索系统; 在线阅读下载PDF 职称材料

一种基于apiori算法改进的knn文本分类方法被引量：5: 5; 作者骆凡彭艳兵《电子设计工程》 2016年第7期1-3,共3页; 针对现在机器学习的文本分类算法普遍使用的knn,支持向量机,神经网络等算法进行分类中存在的两个问题,没有考虑到语义关联对其文本的影响和受文章长短对其词频向量大小的影响,通过结合apiori算法进行改进knn算法的方法对文本分类样本进... 展开更多; 关键词文本分类 KNN 关联规则 apiori; 在线阅读下载PDF 职称材料

基于多叉树和Spark的改进Apriori算法被引量：3: 6; 作者曹佳豪刘宇《信息技术》 2018年第6期128-132,共5页; 文中基于Spark和多叉树对传统Apriori算法进行改进,将原始事物数据库转换为布尔矩阵,切割成多个分区数据库后交由Spark的各个Worker节点处理,以多叉树的形式存储中间结果,最后交由主节点进行合并,得到全局频繁项集。将基于Spark实现的Ap... 展开更多; 关键词数据挖掘关联规则 APRIORI 多叉树 SPARK; 在线阅读下载PDF 职称材料

题名基于GBDT的个人信用评估方法被引量：15: 1; 作者王黎廖闻剑; 机构武汉邮电科学研究院烽火通信科技股份有限公司南京研发部; 出处《电子设计工程》 2017年第15期68-72,共5页; 文摘近年来,个人信用评估问题成为信贷行业的研究热点,针对当前应用于信用评估的分类算法大多存在只对某种类型的信用数据集具有较好的分类效果的问题,提出了基于Gradient Boosted Decision Tree(GBDT)的个人信用评估方法。GBDT天然可处理混合数据类型的数据集,可以发现多种有区分性的特征以及特征组合,不需要做复杂的特征变换,对于特征类型复杂的信用数据集有明显的优势,且其通过其损失函数可以很好地处理异常点。在基于两个UCI公开信用审核数据集上的对比实验表明,GBDT明显优于传统常用的支持向量机(Support Vector Machine,SVM)以及逻辑回归(Logistic Regression,LR)的信用评估效果,具有较好的稳定性和普适性。; 关键词信用评估分类算法 GBDT; Keywords GBDT credit scoring classification algorithms GBDT; 分类号 TN02 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名模糊时间序列模型在论域定义上的研究被引量：4: 2; 作者汪洋陈海燕彭艳兵; 机构武汉邮电科学研究院通信与信息系统烽火通信科技股份有限公司南京研发部; 出处《电子设计工程》 2017年第2期9-13,共5页; 基金江苏省科技支撑计划项目(2015BAK20B05); 文摘文中基于模糊时间序列模型,提出了如何定义论域的方法。预测人员在不断地应用模糊时间序列模型进行预测的同时,也对此模型进行了不同方面的改进,但是大部分主要包括两个方面:一是论域划分,而是模糊关系表示。在论域划分上面,现有的研究都是简单的向上和向下取整的方法,没有意识到论域区间的定义也会影响到预测的结果的原因,所以本文研究了新的定义论域区间的方法,本文新的方法中提出论域区间的定义和当前类别的数据分布有关,这样充分考虑了样本数据的分布情况,提高了论域间隔的准确度和可解释性。最后,本文应用阿拉巴马州大学的预测结果和最新的论域划分方法进行了比较,结果表明了此方法的有效性。; 关键词模糊时间序列论域区间定义数据分布论域划分; Keywords fuzzy time series model definition of discourse data distribution partition of discourse; 分类号 TN911.1 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于地理位置时间序列的相似性研究被引量：1: 3; 作者彭艳兵姚伟烈刘卫江; 机构烽火通信科技股份有限公司南京研发部大连海事大学; 出处《电子设计工程》 2017年第8期37-40,共4页; 文摘位置时间序列常被应用到不同的研究领域,具有很高的商业价值。本文通过计算位置时间序列的余弦相似度找到确定与其近似的位置时间序列。同时针对余弦相似度在计算位置时间序列相似性出现的偏差,提出了一种余弦相似度的改进方法(单侧相似度)。单侧相似度给出了不同位置时间序列的包含关系,这种关系是余弦相似度的进一步解释,可以用来衡量不同研究对象之间的包含程度。通过实验,证明了单侧相似度更适合描述位置时间序列的相似性。; 关键词上网习惯位置时间序列位置权重余弦相似度单侧相似度; Keywords surfing habits position time series position weight cosine similarity unilateral similarity; 分类号 TN0 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名基于Solr的混合介质存储在淘宝系统中的研究与应用被引量：1: 4; 作者汪洋崔炜; 机构烽火通信科技股份有限公司南京研发部武汉邮电科学研究院; 出处《电子设计工程》 2017年第15期22-25,共4页; 基金江苏省科技支撑计划(2015BAK20B01); 文摘 DT时代已经来临,开源搜索引擎已经成为各大公司检索海量数据的主流,其中Solr以其支持多种格式索引,高效性,高灵活性,高可扩展性,深受广大爱好者以及各大公司青睐,本文基于提高Solr检索速度和对数据管理便捷性,提出了混合介质存储分盘管理查询并且设置优先级异步并发的改进方案,通过在淘宝用户评论检索中的研究与应用,证实了方案能够极大优化了性能并且提高检索速度。; 关键词 LUCENE SOLR 混合介质存储存储数据的冷热淘宝用户评论检索系统; Keywords Lucene Solr Lucene Solr mixed media storage hot and cold data Taobao user review system; 分类号 TN02 [电子电信—物理电子学]; 在线阅读下载PDF 职称材料

题名一种基于apiori算法改进的knn文本分类方法被引量：5: 5; 作者骆凡彭艳兵; 机构武汉邮电科学研究院烽火通信科技股份有限公司南京研发部; 出处《电子设计工程》 2016年第7期1-3,共3页; 基金国家863计划资助项目(2012AA013002) 江苏省科技支撑计划(2015BAK20B01); 文摘针对现在机器学习的文本分类算法普遍使用的knn,支持向量机,神经网络等算法进行分类中存在的两个问题,没有考虑到语义关联对其文本的影响和受文章长短对其词频向量大小的影响,通过结合apiori算法进行改进knn算法的方法对文本分类样本进行了分类实验,结果表明,该改进算法相对于为改进前平均查准率有10%左右的提升,平均召回率有5%左右的提升,得出该方法能有效提高文本分类准确率的结论。; 关键词文本分类 KNN 关联规则 apiori; Keywords text classification knn association rules apiori; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于多叉树和Spark的改进Apriori算法被引量：3: 6; 作者曹佳豪刘宇; 机构武汉邮电科学研究院烽火通信科技股份有限公司南京研发部; 出处《信息技术》 2018年第6期128-132,共5页; 文摘文中基于Spark和多叉树对传统Apriori算法进行改进,将原始事物数据库转换为布尔矩阵,切割成多个分区数据库后交由Spark的各个Worker节点处理,以多叉树的形式存储中间结果,最后交由主节点进行合并,得到全局频繁项集。将基于Spark实现的Apriori算法同Hadoop环境下的Apriori算法进行性能对比,发现在数据量相同的情况下基于Spark的Apriori算法较基于Hadoop的Apriori算法执行时间减少了67%以上,采用多叉树存储中间结果后,算法执行时间在原来的基础上减少了44%以上。文中实验证明了Spark比Hadoop更适用于Apriori这种以迭代搜索方式执行的算法,且采用多叉树存储中间结果可有效地提高算法执行效率。; 关键词数据挖掘关联规则 APRIORI 多叉树 SPARK; Keywords data mining association rules Apriori multi- tree Spark; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于GBDT的个人信用评估方法	王黎廖闻剑	《电子设计工程》	2017	15	在线阅读下载PDF 职称材料
2	模糊时间序列模型在论域定义上的研究	汪洋陈海燕彭艳兵	《电子设计工程》	2017	4	在线阅读下载PDF 职称材料
3	基于地理位置时间序列的相似性研究	彭艳兵姚伟烈刘卫江	《电子设计工程》	2017	1	在线阅读下载PDF 职称材料
4	基于Solr的混合介质存储在淘宝系统中的研究与应用	汪洋崔炜	《电子设计工程》	2017	1	在线阅读下载PDF 职称材料
5	一种基于apiori算法改进的knn文本分类方法	骆凡彭艳兵	《电子设计工程》	2016	5	在线阅读下载PDF 职称材料
6	基于多叉树和Spark的改进Apriori算法	曹佳豪刘宇	《信息技术》	2018	3	在线阅读下载PDF 职称材料