针对传统垃圾邮件过滤问题中采用单一特征选择方法不能够有效提取训练集中全部重要特征或提取结果存在特征冗余的问题,提出一种基于多种特征选择方法融合的垃圾邮件过滤模型SF_FSF(Spam filtering based on feature selection fusion)。...针对传统垃圾邮件过滤问题中采用单一特征选择方法不能够有效提取训练集中全部重要特征或提取结果存在特征冗余的问题,提出一种基于多种特征选择方法融合的垃圾邮件过滤模型SF_FSF(Spam filtering based on feature selection fusion)。SF_FSF方法通过引入信息融合的概念,将特征选择看成一个决策问题,采用基于平均投票法的信息融合模型进行特征选择结果的融合,以提取垃圾邮件数据集中的重要特征,获得优秀的过滤能力。实验结果表明,SF_FSF方法比基于单一特征选择的垃圾邮件过滤方法得到了更好的过滤结果。展开更多
针对一类分类马氏椭球学习机(Mahalanobis ellipsoidal learning machine for one class classification,MELM)方法中选取参数C比较困难的问题,提出一种改进的方法-MELM。这种方法通过引入一个具有明确物理意义的参数,即是超椭球外部的...针对一类分类马氏椭球学习机(Mahalanobis ellipsoidal learning machine for one class classification,MELM)方法中选取参数C比较困难的问题,提出一种改进的方法-MELM。这种方法通过引入一个具有明确物理意义的参数,即是超椭球外部的样本点数(野点数)占总样本点数的份额的上界,是支持向量的个数所占总样本点数的份额的下界,使参数可以灵活地根据实际问题的精度要求来选取,从而可以快速选取最有效的参数。展开更多
文摘针对传统垃圾邮件过滤问题中采用单一特征选择方法不能够有效提取训练集中全部重要特征或提取结果存在特征冗余的问题,提出一种基于多种特征选择方法融合的垃圾邮件过滤模型SF_FSF(Spam filtering based on feature selection fusion)。SF_FSF方法通过引入信息融合的概念,将特征选择看成一个决策问题,采用基于平均投票法的信息融合模型进行特征选择结果的融合,以提取垃圾邮件数据集中的重要特征,获得优秀的过滤能力。实验结果表明,SF_FSF方法比基于单一特征选择的垃圾邮件过滤方法得到了更好的过滤结果。
文摘针对一类分类马氏椭球学习机(Mahalanobis ellipsoidal learning machine for one class classification,MELM)方法中选取参数C比较困难的问题,提出一种改进的方法-MELM。这种方法通过引入一个具有明确物理意义的参数,即是超椭球外部的样本点数(野点数)占总样本点数的份额的上界,是支持向量的个数所占总样本点数的份额的下界,使参数可以灵活地根据实际问题的精度要求来选取,从而可以快速选取最有效的参数。