-
题名基于有效距离的迭代特征选择
- 1
-
-
作者
张丹
刘明霞
张道强
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第5期1054-1058,共5页
-
基金
国家自然科学基金项目(61422204
61473149
+3 种基金
61501230)资助
江苏省自然科学基金杰出青年基金项目(BK20130034)资助
江苏自然科学基金项目(BK20150751)资助
南京航空航天大学研究生创新实验室开放基金项目(kfjj20151605)资助
-
文摘
作为一项重要的降维技术,特征选择在模式识别和机器学习领域已经成为一个研究热点.现有的特征选择方法中,人们通常利用欧氏距离计算样本之间的相似性,而欧氏距离仅能反映样本之间的静态特性.最近,研究人员提出一种有效距离的概念,并证明有效距离可以反映出样本之间潜在的动态结构.因此提出一系列基于有效距离的迭代特征选择方法.具体地,本文首先根据稀疏表示算法计算有效距离.然后,根据得到的有效距离提出了三种新的迭代的特征选择方法,包括基于有效距离的迭代Laplacian Score算法(Iterative EDLS)和两种基于有效距离的迭代Sparsity Score算法(Iterative EDSS-1和Iterative EDSS-2).为验证本文提出方法的有效性,在十个UCI数据集上进行了分类的实验.实验结果表明,本文提出的基于有效距离的迭代特征选择方法比传统的基于欧氏距离的方法能取得更好的分类结果.
-
关键词
迭代的特征选择
有效距离
稀疏表示
分类
-
Keywords
Iterative feature selection
effective distance
sparse representation
classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名迭代式特征选择的单细胞分化轨迹推断算法
- 2
-
-
作者
何鸿坚
殷依婷
谢江
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第7期1609-1621,共13页
-
基金
国家自然科学基金(61873156)。
-
文摘
通过单细胞轨迹推断方法从单细胞转录组学数据或蛋白质组学数据构建细胞的分化轨迹,有助于理解正常组织的发育过程或者提供病理学相关的信息。然而当前的单细胞轨迹推断算法在精确度和鲁棒性的提升上仍然是一个难题,原因之一是在单细胞测序中检测到大量不相关的基因而产生噪声。针对这一问题,迭代式特征选择的轨迹推断方法iterTIPD被提出。其创新点体现在,将广泛用于筛选差异表达基因的特征选择方法迭代式地用于线性或分支结构的单细胞RNA测序数据上,通过筛选出对构建的分化轨迹贡献最大的基因子集来提高细胞伪时间排序的精确度和鲁棒性。在四种scRNA-seq数据集上的实验结果表明,iterTIPD可以有效地提高单细胞轨迹推断算法的精确度和鲁棒性。同样,iterTIPD也使其他的轨迹推断算法的性能得到提升,以此证明iterTIPD具有泛化性。iterTIPD算法成功重构了神经干细胞的分化轨迹,通过对比发现,该分化轨迹与已知的神经干细胞分化轨迹高度一致。同时发现Top2a和Gja1可能是定义活化的神经干细胞亚群的新的标志物。
-
关键词
单细胞RNA测序技术
基因差异性表达
单细胞分化轨迹推断
迭代式特征选择
生物信息学
-
Keywords
single-cell RNA sequencing
differential gene expression
single-cell differentiation trajectory inference
iterative feature selection
bioinformatics
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于有效载荷的多级实时入侵检测系统框架
被引量:3
- 3
-
-
作者
刘解放
赵斌
周宁
-
机构
盐城工学院信息工程学院
北京工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2014年第4期126-133,共8页
-
基金
国家自然科学基金(61272500)资助
-
文摘
网络入侵检测系统使用大量特征集来识别入侵,需要处理庞大的网络流量,目前大多数现有的系统缺乏实时异常检测能力。提出了一种基于有效载荷的多级实时入侵检测系统,它首先采用n-gram分析网络数据包有效载荷来构建特征模型,进行数据准备;其次采用3级迭代特征选择引擎进行特征子集选择,其中主成分分析用于数据的预处理,并结合累积能量、平行分析和碎石检验进行主成分选择;最后采用马氏距离图发现特征间及数据包间隐藏的相关性。马氏距离的差异性准则用来区分正常或攻击数据包。通过DARPA 99和GATECH数据集验证了该系统的有效性,用Web应用程序流量验证了其模型,用F值评估了其检测性能。与目前同类主流的两款入侵检测系统进行了对比试验,结果表明:该系统提高了检测精度,降低了误报率和计算复杂度。与中型企业网的真实场景相比,它具有1.3倍的高吞吐量。
-
关键词
入侵检测
数据预处理
N-GRAM
主成分分析
马氏距离图
迭代特征选择
-
Keywords
Intrusion detection
Data pre-processing
N-gram
Principal component analysis
Mahalanobis distance map
Iterative feature selection
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-