检索结果-维普期刊中文期刊服务平台

文本分类中特征选择方法的比较与改进被引量：25: 1; 作者单丽莉刘秉权孙承杰《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第S1期319-324,共6页; 为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数... 展开更多; 关键词文本分类特征选择期望交叉熵; 在线阅读下载PDF 职称材料

基于特征选择的实体关系抽取被引量：9: 2; 作者毛小丽何中市 +1 位作者邢欣来刘莉《计算机应用研究》 CSCD 北大核心 2012年第2期530-532,共3页; 提出了一种实体关系抽取方案,该方案针对实体关系抽取中特征空间维数过高问题,引入了文本分类中的特征选择算法,如信息增益、期望交叉熵和x2统计,实现了特征空间降维。实验结果表明,各特征选择算法均能在尽量保证抽取性能的同时有效地... 展开更多; 关键词关系抽取特征选择信息增益期望交叉熵 x2统计; 在线阅读下载PDF 职称材料

文本分类中一种基于选择的二次特征降维方法被引量：8: 3; 作者刘海峰王元元 +1 位作者姚泽清陈琦《情报学报》 CSSCI 北大核心 2009年第1期23-27,共5页; 特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性，却很少考虑特征之间的冗余性问题，从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法，既考虑一些类... 展开更多; 关键词文本分类特征选择互信息期望交叉熵; 在线阅读下载PDF 职称材料

基于改进Nave Bayes的垃圾邮件过滤模型研究被引量：10: 4; 作者王涛裘国永何聚厚《计算机工程与应用》 CSCD 北大核心 2007年第13期186-190,共5页; 分析了目前在垃圾邮件过滤中广泛应用的NaveBayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足。提出了改进的NaveBayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词... 展开更多; 关键词垃圾邮件过滤朴素贝叶斯期望交叉熵特征选取; 在线阅读下载PDF 职称材料

用于中文文本分类的基于类别区分词的特征选择方法被引量：8: 5; 作者周奇年张振浩徐登彩《计算机应用与软件》 CSCD 北大核心 2013年第3期193-195,共3页; 特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验... 展开更多; 关键词文本分类特征选择类别区分词信息增益互信息期望交叉熵; 在线阅读下载PDF 职称材料

基于索引项权重的文本特征选择方法被引量：4: 6; 作者王海鹃韩立新甄志龙《计算机工程与设计》 CSCD 北大核心 2010年第5期1149-1151,共3页; 为改善文本分类的效率和效果,降低计算复杂度,在分析了经典的特征选择方法后,提出加权的文本特征选择方法。该方法不仅利用数据集中文本的个数,还充分考虑到索引项的权重信息,并构造新的评估函数,改进了信息增益、期望交叉熵以及文本证... 展开更多; 关键词文本分类特征选择索引项权重信息增益期望交叉熵文本证据权; 在线阅读下载PDF 职称材料

基于改进CHI和带权ECE结合的特征选择方法被引量：4: 7; 作者蔡镇高健秦晓军《计算机应用研究》 CSCD 北大核心 2019年第10期2962-2964,共3页; 针对文本分类特征选择方法中的卡方统计(CHI)和期望交叉熵(ECE),分析了其特点和不足。为了避免传统CHI和ECE方法在不平衡数据集上分类效果差的问题,通过引入调节因子和除去负相关影响因素,给出了改进的CHI方法(pCHI),并以加权的方式弥补... 展开更多; 关键词卡方统计期望交叉熵特征选择文本分类; 在线阅读下载PDF 职称材料

融合词语共现距离和类别信息的短文本特征提取方法被引量：3: 8; 作者马慧芳邢玉莹 +1 位作者王双张旭鹏《计算机工程与科学》 CSCD 北大核心 2018年第9期1689-1695,共7页; 针对传统特征加权方法未充分考虑词语之间的语义信息和类别分布信息的不足,提出了一种融合词语共现距离和类别信息的短文本特征提取方法。一方面,将同一短文本中两个词语之间的间隔词数作为共现距离,计算它们之间的相关度。通过计算这... 展开更多; 关键词短文本共现距离期望交叉熵特征提取; 在线阅读下载PDF 职称材料

题名文本分类中特征选择方法的比较与改进被引量：25: 1; 作者单丽莉刘秉权孙承杰; 机构哈尔滨工业大学计算机科学与技术学院; 出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第S1期319-324,共6页; 基金国家自然科学基金资助项目(61073127); 文摘为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法.实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能.; 关键词文本分类特征选择期望交叉熵; Keywords Text categorization Feature selection Expected cross entropy; 分类号 T-55 [一般工业技术]; 在线阅读下载PDF 职称材料

题名基于特征选择的实体关系抽取被引量：9: 2; 作者毛小丽何中市邢欣来刘莉; 机构重庆大学计算机学院; 出处《计算机应用研究》 CSCD 北大核心 2012年第2期530-532,共3页; 基金中央高校基本科研业务费科研专项资助项目(CDJXS11180020) 国家科技重大专项项目(2008ZX07315-001); 文摘提出了一种实体关系抽取方案,该方案针对实体关系抽取中特征空间维数过高问题,引入了文本分类中的特征选择算法,如信息增益、期望交叉熵和x2统计,实现了特征空间降维。实验结果表明,各特征选择算法均能在尽量保证抽取性能的同时有效地降低向量空间维数,提高分类效率,其中x2统计取得的效果最好。; 关键词关系抽取特征选择信息增益期望交叉熵 x2统计; Keywords relation extraction feature selection information gain expected cross entropy x2 statistic; 分类号 TP309 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名文本分类中一种基于选择的二次特征降维方法被引量：8: 3; 作者刘海峰王元元姚泽清陈琦; 机构解放军理工大学; 出处《情报学报》 CSSCI 北大核心 2009年第1期23-27,共5页; 基金国家自然科学基金资助项目（编号：70571087）.; 文摘特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性，却很少考虑特征之间的冗余性问题，从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法，既考虑一些类别信息较强的特征的选取，又减少一些类别判定方面的冗余特征，在尽量减少信息损失的前提下达到有效缩减特征维数的目的。对中文文本的分类实验结果表明，本文提出的特征降维方法在文本分类的准确率方面效果较好。; 关键词文本分类特征选择互信息期望交叉熵; Keywords text classification, feature selection, mutual information, expected cross entropy; 分类号 TP391 [自动化与计算机技术—计算机应用技术] TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于改进Nave Bayes的垃圾邮件过滤模型研究被引量：10: 4; 作者王涛裘国永何聚厚; 机构陕西师范大学计算机科学学院; 出处《计算机工程与应用》 CSCD 北大核心 2007年第13期186-190,共5页; 基金国家自然科学基金(the National Natural Science Foundation of China under Grant No.60503008)。; 文摘分析了目前在垃圾邮件过滤中广泛应用的NaveBayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足。提出了改进的NaveBayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词进行加权,从而提高对垃圾邮件过滤的精度。实验结果可以看出A-NBF比NBF在过滤精度方面有明显的提高。; 关键词垃圾邮件过滤朴素贝叶斯期望交叉熵特征选取; Keywords spam filtering Naive Bayes Expected Cross Entropy feature selection; 分类号 TP393.098 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名用于中文文本分类的基于类别区分词的特征选择方法被引量：8: 5; 作者周奇年张振浩徐登彩; 机构浙江理工大学信息学院; 出处《计算机应用与软件》 CSCD 北大核心 2013年第3期193-195,共3页; 文摘特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验证了该方法的有效性。; 关键词文本分类特征选择类别区分词信息增益互信息期望交叉熵; Keywords Text categorisation Feature selection Class discriminating word Information gain Mutual information Excepted cross entropy; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于索引项权重的文本特征选择方法被引量：4: 6; 作者王海鹃韩立新甄志龙; 机构通化师范学院数学系河海大学计算机及信息工程学院通化师范学院计算机科学系; 出处《计算机工程与设计》 CSCD 北大核心 2010年第5期1149-1151,共3页; 基金国家自然科学基金项目(60673186); 文摘为改善文本分类的效率和效果,降低计算复杂度,在分析了经典的特征选择方法后,提出加权的文本特征选择方法。该方法不仅利用数据集中文本的个数,还充分考虑到索引项的权重信息,并构造新的评估函数,改进了信息增益、期望交叉熵以及文本证据权。利用KNN分类器在Reuters-21578标准数据集上进行训练和测试。实验结果表明,该方法能够选出有效特征,提高文本分类的性能。; 关键词文本分类特征选择索引项权重信息增益期望交叉熵文本证据权; Keywords text categorization feature selection term weight information gain expected cross entropy weight of evidence for text; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于改进CHI和带权ECE结合的特征选择方法被引量：4: 7; 作者蔡镇高健秦晓军; 机构江南计算技术研究所; 出处《计算机应用研究》 CSCD 北大核心 2019年第10期2962-2964,共3页; 基金国家自然科学基金资助项目(61732018); 文摘针对文本分类特征选择方法中的卡方统计(CHI)和期望交叉熵(ECE),分析了其特点和不足。为了避免传统CHI和ECE方法在不平衡数据集上分类效果差的问题,通过引入调节因子和除去负相关影响因素,给出了改进的CHI方法(pCHI),并以加权的方式弥补ECE方法倾向于选择弱区分能力高频特征的缺陷(ωECE)。在综合两种改进后方法的基础上,进一步提出基于改进CHI和带权ECE结合(pCHIωECE)的特征选择方法。经对比实验验证,pCHIωECE方法的查准率、F1值均优于CHI、ECE及pCHI、ωECE方法,且该方法的降维稳定性更好。; 关键词卡方统计期望交叉熵特征选择文本分类; Keywords chi-square statistics expected cross-entropy feature selection text classification; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名融合词语共现距离和类别信息的短文本特征提取方法被引量：3: 8; 作者马慧芳邢玉莹王双张旭鹏; 机构西北师范大学计算机科学与工程学院桂林电子科技大学广西可信软件重点实验室; 出处《计算机工程与科学》 CSCD 北大核心 2018年第9期1689-1695,共7页; 基金国家自然科学基金(61762078 61363058) +2 种基金 201610736041); 文摘针对传统特征加权方法未充分考虑词语之间的语义信息和类别分布信息的不足,提出了一种融合词语共现距离和类别信息的短文本特征提取方法。一方面,将同一短文本中两个词语之间的间隔词数作为共现距离,计算它们之间的相关度。通过计算这两个词语共同出现的频率,得到每个词的关联权重;另一方面,利用改进的期望交叉熵计算某个词在某个类别中的权重值,将两者整合,得到某个类别中所有词的权重值。对所有类别中的词按权重值的大小进行降序排序,选取前K个词作为新的特征词项集合。实验表明,该方法能够有效提高短文本特征提取的效果。; 关键词短文本共现距离期望交叉熵特征提取; Keywords short text co-occurrence distance expected cross entropy feature extraction; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	文本分类中特征选择方法的比较与改进	单丽莉刘秉权孙承杰	《哈尔滨工业大学学报》 EI CAS CSCD 北大核心	2011	25	在线阅读下载PDF 职称材料
2	基于特征选择的实体关系抽取	毛小丽何中市邢欣来刘莉	《计算机应用研究》 CSCD 北大核心	2012	9	在线阅读下载PDF 职称材料
3	文本分类中一种基于选择的二次特征降维方法	刘海峰王元元姚泽清陈琦	《情报学报》 CSSCI 北大核心	2009	8	在线阅读下载PDF 职称材料
4	基于改进Nave Bayes的垃圾邮件过滤模型研究	王涛裘国永何聚厚	《计算机工程与应用》 CSCD 北大核心	2007	10	在线阅读下载PDF 职称材料
5	用于中文文本分类的基于类别区分词的特征选择方法	周奇年张振浩徐登彩	《计算机应用与软件》 CSCD 北大核心	2013	8	在线阅读下载PDF 职称材料
6	基于索引项权重的文本特征选择方法	王海鹃韩立新甄志龙	《计算机工程与设计》 CSCD 北大核心	2010	4	在线阅读下载PDF 职称材料
7	基于改进CHI和带权ECE结合的特征选择方法	蔡镇高健秦晓军	《计算机应用研究》 CSCD 北大核心	2019	4	在线阅读下载PDF 职称材料
8	融合词语共现距离和类别信息的短文本特征提取方法	马慧芳邢玉莹王双张旭鹏	《计算机工程与科学》 CSCD 北大核心	2018	3	在线阅读下载PDF 职称材料