期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
流形判别分析 被引量:13
1
作者 刘忠宝 潘广贞 赵文娟 《电子与信息学报》 EI CSCD 北大核心 2013年第9期2047-2053,共7页
传统降维方法主要有两种思路:一是利用样本的全局特征,保证降维前后样本的全局特征不变;二是尽量保证相邻样本在降维前后的相对关系不变。传统方法由于未能充分利用样本的已有信息,因此降维效率有限。鉴于此,在Fisher准则和局部流形保... 传统降维方法主要有两种思路:一是利用样本的全局特征,保证降维前后样本的全局特征不变;二是尽量保证相邻样本在降维前后的相对关系不变。传统方法由于未能充分利用样本的已有信息,因此降维效率有限。鉴于此,在Fisher准则和局部流形保持的基础上,该文提出流形判别分析。该方法首先定义了基于流形的类内离散度MWCS和类间离散度MBCS,然后利用Fisher准则找到最佳投影方向,该方向满足MBCS与MWCS之比最大。该方法不仅继承了传统降维方法的优势,而且进一步提高了降维效率。标准数据集上的实验结果表明该文所提方法的有效性。 展开更多
关键词 模式识别 流形学习 降维 FISHER准则 全局特征
在线阅读 下载PDF
基于模糊大间隔最小球分类模型的恒星光谱离群数据挖掘方法 被引量:8
2
作者 刘忠宝 赵文娟 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第4期1245-1248,共4页
由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏... 由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。鉴于此,提出基于模糊大间隔最小球分类模型的离群数据挖掘方法,该方法利用部分一般样本和离群样本建立最小球模型,并在此基础上引入模糊技术,通过降低噪声的权重,尽量减少噪声的影响。与C-SVM,SVDD,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明所提方法的有效性。 展开更多
关键词 恒星光谱 分类 模糊大间隔最小球 离群数据
在线阅读 下载PDF
改进的线性判别分析算法 被引量:11
3
作者 刘忠宝 王士同 《计算机应用》 CSCD 北大核心 2011年第1期250-253,共4页
线性判别分析是一种有效的特征提取方法,但其存在两个缺陷:小样本问题和秩限制问题。为了解决上述问题,提出一种改进的线性判别分析算法ILDA。该方法引进类间离散度标量和类内离散度标量,通过求解样本各维的权值达到特征提取的目的。若... 线性判别分析是一种有效的特征提取方法,但其存在两个缺陷:小样本问题和秩限制问题。为了解决上述问题,提出一种改进的线性判别分析算法ILDA。该方法引进类间离散度标量和类内离散度标量,通过求解样本各维的权值达到特征提取的目的。若干标准人脸数据集和人工数据集上的实验表明ILDA在特征提取方面的有效性。 展开更多
关键词 特征提取 线性判别分析 类间离散度标量 类内离散度标量
在线阅读 下载PDF
具有三维聚焦功能的微流控芯片 被引量:9
4
作者 杨潞霞 郝晓剑 +2 位作者 王春水 张斌珍 王万军 《光学精密工程》 EI CAS CSCD 北大核心 2013年第9期2309-2316,共8页
为了使用微流体细胞仪对细胞精确计数,采用紫外光刻工艺制作了能够真正实现三维聚焦功能的微流体检测芯片(微流控芯片)。使用聚二甲基硅氧烷(PDMS)进行二次倒模复制其结构以缩短微流控芯片制作周期、降低制作成本,并进行了芯片的封装与... 为了使用微流体细胞仪对细胞精确计数,采用紫外光刻工艺制作了能够真正实现三维聚焦功能的微流体检测芯片(微流控芯片)。使用聚二甲基硅氧烷(PDMS)进行二次倒模复制其结构以缩短微流控芯片制作周期、降低制作成本,并进行了芯片的封装与测试。首先,利用沉浸式光刻技术和斜曝光工艺制作了具有三维聚焦功能的SU-8微流沟道;然后,利用PDMS对所制作的SU-8微流沟道进行一次倒模,得到其负模结构;对负模结构进行表面处理后,再进行二次倒模,得到PDMS微流沟道;最后,封装PDMS微流沟道与盖片,制得微流控芯片,并对微流控芯片的沟道聚焦效果进行了测试。实验测试发现随着鞘流与样本流流速比不同,得到样本流的聚焦宽度也不同。当鞘流与样本流流速比为20∶1时,可以得到约10.4μm的聚焦宽度。结果表明,该芯片结构可靠,可以满足进一步的流体聚焦检测要求。采用该方法制作的微流控芯片具有生产周期短、成本低、效率高和结构可靠的特点。 展开更多
关键词 微流控芯片 三维聚焦 SU-8胶 聚二甲基硅氧烷(PDMS) 倒模
在线阅读 下载PDF
虚拟力导向群聚智能优化的无线传感器网络覆盖策略 被引量:10
5
作者 关志艳 耿岩 《传感器与微系统》 CSCD 2015年第1期40-42,46,共4页
针对在由固定骨干节点和移动传感器节点组成的无线传感器网络(WSNs)中,固定节点作用在移动节点的虚拟力,造成对移动节点位置移动的阻碍,在群聚智能优化思想的基础上,提出一种解决异构移动传感器网络的覆盖策略。该策略通过调整虚拟力距... 针对在由固定骨干节点和移动传感器节点组成的无线传感器网络(WSNs)中,固定节点作用在移动节点的虚拟力,造成对移动节点位置移动的阻碍,在群聚智能优化思想的基础上,提出一种解决异构移动传感器网络的覆盖策略。该策略通过调整虚拟力距离阈值参数来改善固定节点作用在移动节点上的虚拟力;用虚拟力影响群聚智能算法中粒子速度和距离的进化,以节点有效覆盖率为适应值,指导微粒进化。仿真实验表明:虚拟力导向群聚智能策略能有效实现异构无线传感器网络节点布局优化,提高网络覆盖率,且收敛速度快。 展开更多
关键词 虚拟力 群聚智能 覆盖 无线传感器网络
在线阅读 下载PDF
基于流形模糊双支持向量机的恒星光谱分类方法 被引量:4
6
作者 刘忠宝 高艳云 王建珍 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2015年第1期263-266,共4页
支持向量机(support vector machine,SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(... 支持向量机(support vector machine,SVM)具有良好的学习性能和泛化能力,因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大,SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题,Jayadeva等提出双支持向量机(twin support vector machine,TWSVM),将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征,对每类数据的局部特征并未关注。鉴于此,提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine,MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征,模糊隶属度函数的引入将各类数据区别对待,尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。 展开更多
关键词 自动分类 恒星光谱 流形判别分析 模糊隶属度 双支持向量机
在线阅读 下载PDF
流形判别分析和支持向量机的恒星光谱数据自动分类方法 被引量:3
7
作者 刘忠宝 王召巴 赵文娟 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2014年第1期263-266,共4页
尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流... 尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度MW和基于流形的类间离散度MB。所提方法找到的分类面同时保证MW最小且MB最大。可建立相应最优化问题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性。 展开更多
关键词 自动分类 恒星光谱数据 流形判别分析 支持向量机
在线阅读 下载PDF
WSN中基于多径距离和神经网络的节点定位 被引量:3
8
作者 闫俊伢 钱宇华 +1 位作者 李华锋 马尚才 《计算机科学》 CSCD 北大核心 2017年第8期71-75,共5页
为了实现802.15.4a无线传感器网络中的目标定位,提出了一种新的基于多径距离和神经网络的目标定位检测算法。首先通过目标出现时对多径效应的影响估计出到达时间差,从而计算出通信传感器节点之间的多径距离;然后把多径距离作为神经网络... 为了实现802.15.4a无线传感器网络中的目标定位,提出了一种新的基于多径距离和神经网络的目标定位检测算法。首先通过目标出现时对多径效应的影响估计出到达时间差,从而计算出通信传感器节点之间的多径距离;然后把多径距离作为神经网络的输入,并将目标位置用于神经网络的训练;最后通过选择多径距离估计值和测量值的差的最小成本组函数来定位目标位置。对单目标和多目标的定位检测仿真结果表明,即使当网络中传感器数量和目标增加时,所提出的定位算法的误差累积分布函数也不会增大,而且其定位误差比其他定位算法的误差小,从而增强了网络的鲁棒性,提高了网络中传感器承受故障的能力。 展开更多
关键词 无线传感器网络 多径效应 神经网络 目标定位 定位误差
在线阅读 下载PDF
共晶和共混对CL-20/DNB感度和热解机理影响的MD模拟 被引量:2
9
作者 付一政 康志鹏 +4 位作者 郭志婧 苗瑞珍 孟瑞鸿 杨潞霞 刘亚青 《含能材料》 EI CAS CSCD 北大核心 2017年第2期94-99,共6页
为了从分子水平进一步揭示共晶和共混对六硝基六氮杂异伍兹烷(CL-20)/1,3-二硝基苯(DNB)含能材料的感度、力学性能和热解机理的影响,采用分子动力学(MD)模拟方法在COMPASS力场条件下对CL-20、DNB、两者的共混物及共晶的感度、结合能和... 为了从分子水平进一步揭示共晶和共混对六硝基六氮杂异伍兹烷(CL-20)/1,3-二硝基苯(DNB)含能材料的感度、力学性能和热解机理的影响,采用分子动力学(MD)模拟方法在COMPASS力场条件下对CL-20、DNB、两者的共混物及共晶的感度、结合能和力学性能进行了模拟计算。在Reax FF/lg力场条件下对其热解机理进行了研究。结果表明,共晶和共混均会降低体系的感度,但共晶效果更加明显;与共混物结构相比,共晶结构更加稳定,共晶和共混均可以改变复合体系的力学性能,降低体系的刚度,增加体系的柔性和安全性,但共混会使体系的力学性能劣化。共晶分子间强的作用会促进体系中各组分的热解反应,NO_2、N_2、NO、H_2O、HONO、HON以及CO_2等是共晶和共混体系的主要热解产物。与共混相比,共晶是一种更加有效的含能材料改性方法,可为含能材料的配方设计提供理论指导。 展开更多
关键词 共晶 共混 分子动力学 六硝基六氮杂异伍兹烷(CL-20) 1 3-二硝基苯(DNB)
在线阅读 下载PDF
折中规划分类性能的少数类误分代价优化设计 被引量:5
10
作者 靳燕 彭新光 《计算机工程与应用》 CSCD 北大核心 2016年第16期51-55,72,共6页
针对代价敏感思想在类不平衡问题中的传统代价给定方式,提出了分类性能需求引导代价优化的因子量化方法。分类性能需求表示为相关于代价因子c的正负类分类性能指标函数式,为代价择优标准。应用遗传算法基于该标准在指定值域内寻优,得到... 针对代价敏感思想在类不平衡问题中的传统代价给定方式,提出了分类性能需求引导代价优化的因子量化方法。分类性能需求表示为相关于代价因子c的正负类分类性能指标函数式,为代价择优标准。应用遗传算法基于该标准在指定值域内寻优,得到最优代价因子,并将其代入代价敏感Boosting学习方法,产生基于给定分类性能的分类模型。折中分类性能的算法实现以正负类召回率的几何平均作为择优标准,选用了四类算法(基算法C4.5和Zero R)依次在三组样本集上进行分类建模。与传统代价给定方式代入算法相比,寻优过程确定的代价因子代入Ada Cost算法后,基于C4.5和Zero R的分类器在TP与TN上的变化幅度依次为33.3%~200%、-49%^-15.6%和-44.4%^-16.7%、25%~400%。前者改善了正类误判情形,且未造成负类误判严重化;后者改善了负类严重误判情形,且正类召回率保持在0.5以上,分类性能达到较为均衡的状态。 展开更多
关键词 少数类分类 代价敏感学习 遗传算法 代价因子优化 分类性能均衡
在线阅读 下载PDF
2004-2015年国家社会科学基金重大项目立项项目的计量研究 被引量:5
11
作者 李华锋 袁勤俭 《现代情报》 CSSCI 北大核心 2016年第11期132-139,共8页
通过对2004-2015年国家社会科学基金重大项目立项项目的地区分布、立项单位分布、主题分布等进行计量分析,可以发现国家社会科学基金重大项目的立项项目呈现出"立项数量稳步增长,覆盖31个省市区,立项机构以高校为主"、"... 通过对2004-2015年国家社会科学基金重大项目立项项目的地区分布、立项单位分布、主题分布等进行计量分析,可以发现国家社会科学基金重大项目的立项项目呈现出"立项数量稳步增长,覆盖31个省市区,立项机构以高校为主"、"地区间差异显著,但西部地区有所突破"、"立项单位以教育部直属的综合性大学为主,985高校所占比例高"、"项目负责人多为知名学者、学科带头人,科研成果丰富"、"研究内容丰富且具有全局性和战略性"等特征。 展开更多
关键词 国家社会科学基金 重大项目 统计分析
在线阅读 下载PDF
基于熵理论和核密度估计的最大间隔学习机 被引量:3
12
作者 刘忠宝 王士同 《电子与信息学报》 EI CSCD 北大核心 2011年第9期2187-2191,共5页
该文针对支持向量机(SVM)及其变种的不足,提出一种基于熵理论和核密度估计的最大间隔学习机MLMEK。MLMEK引入了核密度估计和熵的概念,用核密度估计表征样本数据的分布特征,用熵表征分类的不确定性。MLMEK真实反映样本数据的分布特征;同... 该文针对支持向量机(SVM)及其变种的不足,提出一种基于熵理论和核密度估计的最大间隔学习机MLMEK。MLMEK引入了核密度估计和熵的概念,用核密度估计表征样本数据的分布特征,用熵表征分类的不确定性。MLMEK真实反映样本数据的分布特征;同时解决两类分类问题和单类分类问题;比传统SVM具有更好的分类性能。UCI数据集上的实验验证了MLMEK的有效性。 展开更多
关键词 模式识别 熵理论 核密度估计 支持向量机
在线阅读 下载PDF
基于分类超平面的非线性集成学习机 被引量:2
13
作者 刘忠宝 赵文娟 师智斌 《计算机应用研究》 CSCD 北大核心 2013年第5期1361-1364,共4页
针对支持向量机面临的大规模数据分类问题,提出基于分类超平面的非线性集成学习机NALM。该方法借鉴管理学中协同管理的思想,将大规模数据分成规模较小的子集,然后分别在子集上运行分类超平面算法,最后将各子集上的分类结果进行非线性集... 针对支持向量机面临的大规模数据分类问题,提出基于分类超平面的非线性集成学习机NALM。该方法借鉴管理学中协同管理的思想,将大规模数据分成规模较小的子集,然后分别在子集上运行分类超平面算法,最后将各子集上的分类结果进行非线性集成得到最终的分类结果。该方法不仅继承了分类超平面的优点,而且还将分类超平面的适用范围从小规模数据扩展到中大规模数据,从线性空间推广到Hilbert核空间。若干数据集上的实验表明:NALM能以较少的支持向量来解决大规模样本分类问题。 展开更多
关键词 支持向量机 分类超平面 非线性集成 大规模数据
在线阅读 下载PDF
基于边界的最大间隔模糊分类器 被引量:2
14
作者 刘忠宝 王士同 《光学精密工程》 EI CAS CSCD 北大核心 2012年第1期140-147,共8页
对利用超平面、超(椭)球等几何形状实现数据分类的基于边界的主流分类方法进行了研究,在此基础上,提出了一种将空间点作为分类依据的最大间隔模糊分类器(MFC)。该方法首先在模式空间中找到一个模糊分类点c,c点距离两类样本要尽可能近且... 对利用超平面、超(椭)球等几何形状实现数据分类的基于边界的主流分类方法进行了研究,在此基础上,提出了一种将空间点作为分类依据的最大间隔模糊分类器(MFC)。该方法首先在模式空间中找到一个模糊分类点c,c点距离两类样本要尽可能近且类间夹角间隔尽可能大。然后,测试样本通过c与训练样本间的最大化夹角间隔实现分类。最后,利用MFC的核化对偶式与最小包含球(MEB)的等价性,将MFC的应用范围从二类推广到单类。与主流分类方法的比较实验表明,MFC具有优良的分类性能和抗噪能力,其分类最高精度可达98.8%。 展开更多
关键词 模式分类 模糊分类器 模糊分类点 抗噪能力 单类问题
在线阅读 下载PDF
差分进化融合混合虚拟力的有向传感器网络覆盖算法 被引量:2
15
作者 关志艳 冯秀芳 《计算机应用》 CSCD 北大核心 2016年第12期3244-3250,共7页
针对感知方向可调的有向传感器网络(DSN),为最大限度减少覆盖空洞和重叠区,从而提高有效覆盖率,提出了差分进化融合混合虚拟力的DSN覆盖算法。首先,建立有向感知模型,分析节点之间、节点与障碍物之间及节点与边界之间的混合虚拟作用力,... 针对感知方向可调的有向传感器网络(DSN),为最大限度减少覆盖空洞和重叠区,从而提高有效覆盖率,提出了差分进化融合混合虚拟力的DSN覆盖算法。首先,建立有向感知模型,分析节点之间、节点与障碍物之间及节点与边界之间的混合虚拟作用力,在此基础上建立节点旋转角度与作用力之间的调整公式;然后,为弱化混合虚拟力造成的局部次优解缺陷,引入差分进化模型,将虚拟力作为进化更新的一个影响因子,节点间经过变异、交叉及选择操作来寻找最佳适度值,提高有效覆盖率。覆盖仿真实验表明,在100 m×100 m监测区域下,求得100次随机部署后经过差分进化融合混合虚拟力算法网络有效覆盖率提高了19.68%,而经过混合虚拟力算法和差分进化算法的覆盖率分别提高了10.32%和11.35%;差分进化融合混合虚拟力算法在迭代80次左右网络趋于稳定,而混合虚拟力算法和差分进化算法分别需要130次和140次左右迭代。相对于混合虚拟力算法和差分进化算法,将两者相结合的差分进化融合混合虚拟力算法的收敛速度更快,有效覆盖率提高更明显。 展开更多
关键词 有向传感器网络 混合虚拟力 差分进化 覆盖率 收敛速度
在线阅读 下载PDF
多子域隔离学习组合决策用于不均衡样本 被引量:2
16
作者 靳燕 彭新光 《计算机应用》 CSCD 北大核心 2016年第9期2475-2480,共6页
为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存... 为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存在相似样本的类重叠概念,对边界样本进行搜索,组合构成重叠域。子域清理阶段,基于邻近算法(KNN)的邻近性假设,结合不同域的密疏程度,设置样本有效性参数,对域内样本逐个检测以清理噪声。各子域隔离参与分类建模,按序组合产生出用于不均衡数据集的复合分类器CCRD。在相似算法对比以及代价敏感Meta Cost对比中,CCRD对正类的正确分类改善明显,且未加重负类误判;在SMOTE抽样比较中,CCRD改善了负类的误判情形,且未影响正类的正确分类;在五类数据集的逐个比较中,CCRD分类性能均有提升,在Haberman_sur的正类分类性能提升上尤为明显。结果表明,基于子域学习的复合分类模型的分类性能较好,是一种研究不均衡数据集的较有效的方法。 展开更多
关键词 不均衡数据集区域分布 支持向量数据描述 稀疏域与重叠域 子域隔离学习 复合分类器
在线阅读 下载PDF
京沪苏鄂陕高校哲学社会科学国际化程度研究 被引量:2
17
作者 李华锋 袁勤俭 《现代情报》 CSSCI 北大核心 2016年第6期133-139,共7页
从参加国际学术组织、国际论文发表、主办或承办国际会议、参加国际会议、主办有国际影响力的期刊、承担国际项目等多维视角,分析京沪苏鄂陕高校哲学社会科学的国际化程度,可以发现其呈现出"五省市高校国际化发展水平具有显著差异&... 从参加国际学术组织、国际论文发表、主办或承办国际会议、参加国际会议、主办有国际影响力的期刊、承担国际项目等多维视角,分析京沪苏鄂陕高校哲学社会科学的国际化程度,可以发现其呈现出"五省市高校国际化发展水平具有显著差异"、"学科间国际化程度差距较为明显"、"高校主办具有国际影响力的期刊和数据库数量较少"等特征,因此国内高校应积极与国际学术机构开展多渠道、多层次交流合作,采取"引进来"和"走出去"等多种方式提升国际化程度。 展开更多
关键词 哲学社会科学 高校 国际化 发展水平 北京 上海 江苏 湖北 陕西
在线阅读 下载PDF
面向大规模数据的模糊支持向量数据描述 被引量:2
18
作者 刘忠宝 赵文娟 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第6期1254-1260,共7页
针对支持向量数据描述面临的噪声数据敏感问题和大规模数据分类问题,提出面向大规模数据的模糊支持向量数据描述。该方法引入模糊理论和核心向量机,不仅在构造最小超球体时忽略对分类结果影响较小的数据,而且将支持向量数据描述的适用... 针对支持向量数据描述面临的噪声数据敏感问题和大规模数据分类问题,提出面向大规模数据的模糊支持向量数据描述。该方法引入模糊理论和核心向量机,不仅在构造最小超球体时忽略对分类结果影响较小的数据,而且将支持向量数据描述的适用范围从中小规模数据扩展到大规模数据。人工数据集和标准数据集上的实验表明新算法的有效性。 展开更多
关键词 支持向量数据描述 模糊理论 核心向量机 大规模数据
在线阅读 下载PDF
基于差分孪生卷积神经网络的大规模不平衡数据分类算法 被引量:7
19
作者 任佳丽 王文晶 《计算机应用与软件》 北大核心 2019年第11期267-274,共8页
传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集.针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法.设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器... 传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集.针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法.设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器数量的情况下提高模型的判别能力.通过差分孪生卷积神经网络分别优化每个类的特征图,每个类关联多个超平面,根据输入样本与超平面的距离决定输出样本的类标签.基于多组不平衡数据集的实验结果表明,该算法实现了较好的分类性能. 展开更多
关键词 深度学习 数据分类 不平衡数据集 卷积神经网络 深度神经网络 孪生神经网络
在线阅读 下载PDF
基于MapReduce的两表数据倾斜连接的优化算法 被引量:3
20
作者 赵宇兰 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2016年第6期1383-1387,共5页
针对Range partition算法不能优化数据集严重倾斜情形下的两表连接效率问题,提出一种改进的数据倾斜连接算法.该算法将倾斜数据和非倾斜数据区别处理,利用复制、广播方法将数据发送到每个Reduce节点,通过一轮Map/Reduce任务完成所有的... 针对Range partition算法不能优化数据集严重倾斜情形下的两表连接效率问题,提出一种改进的数据倾斜连接算法.该算法将倾斜数据和非倾斜数据区别处理,利用复制、广播方法将数据发送到每个Reduce节点,通过一轮Map/Reduce任务完成所有的连接操作,可有效均衡每个Reduce处理量,解决了数据严重倾斜对两表连接性能的影响.与传统的分区连接算法比较结果表明,该算法有效. 展开更多
关键词 MAPREDUCE RANGE partition算法 数据倾斜 连接算法优化
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部