-
题名一种基于嵌入式特征选择的垃圾邮件过滤模型
被引量:13
- 1
-
-
作者
闫鹏
郑雪峰
朱建勇
肖赟泓
-
机构
北京科技大学信息工程学院
国家信息中心
北京市公安局
-
出处
《小型微型计算机系统》
CSCD
北大核心
2009年第8期1616-1620,共5页
-
基金
国家"八六三"高技术研究发展计划基金项目(2006AA01Z455)资助
-
文摘
垃圾邮件自身的特点决定了消极学习型的文本分类算法更加适合于垃圾邮件过滤问题.但是,以k-NN为代表的消极型文本分类算法却存在着运行效率偏低等诸多缺点,不便于实际使用.为此,该文在向量余弦相似性公式的基础上,提出了一种新的"嵌入式特征选择垃圾邮件过滤模型"和基于此模型的消极学习型垃圾邮件过滤算法.与一些经典算法相比,新算法在显著降低运算开销的同时,巧妙地避免了由此而引起的信息丢失问题,因而在性能与效率两个方面都有明显提高,具有非常高的实际价值.
-
关键词
垃圾邮件过滤
机器学习
余弦相似性
嵌入式特征选择
-
Keywords
spare filtering
machine learning
cosine similarity
embedded feature selection
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名降维技术与方法综述
被引量:29
- 2
-
-
作者
张煜东
霍元铠
吴乐南
董正超
-
机构
哥仑比亚大学精神病学系脑成像实验室
东南大学信息科学与工程学院
-
出处
《四川兵工学报》
CAS
2010年第10期1-7,共7页
-
基金
国家自然科学基金(60872075)
国家高技术发展计划(2008AA01Z227)
-
文摘
为了更好地对数据实现降维,讨论了特征选择与特征变换两种技术。对于特征选择,按照特征子集的形成方法可分为穷举法、启发式方法、随机方法、智能优化方法等;按照评价函数的类别可分为筛选式、封装式、嵌入式。对于特征变换,传统的方法采用线性降维方法,主要有非负矩阵分解、因子分析、主成份分析、奇异值分解、独立成分分析等;目前的方法是非线性降维方法,以流形学习为代表。对各种不同方法详细探讨其原理与流程,并进行了性能比较。
-
关键词
特征选择
特征变换
嵌入式特征选择
流形学习
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-