期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
统计模式识别中的维数削减与低损降维 被引量:44
1
作者 宋枫溪 高秀梅 +1 位作者 刘树海 杨静宇 《计算机学报》 EI CSCD 北大核心 2005年第11期1915-1922,共8页
较为全面地回顾了统计模式识别中常用的一些特征选择、特征提取等主流特征降维方法,介绍了它们各自的特点及其适用范围,在此基础上,提出了一种新的基于最优分类器———贝叶斯分类器的可用于自动文本分类及其它大样本模式分类的特征选... 较为全面地回顾了统计模式识别中常用的一些特征选择、特征提取等主流特征降维方法,介绍了它们各自的特点及其适用范围,在此基础上,提出了一种新的基于最优分类器———贝叶斯分类器的可用于自动文本分类及其它大样本模式分类的特征选择方法———低损降维.在标准数据集Reuters-21578上进行的仿真实验结果表明,与互信息、χ2统计量以及文档频率这三种主流文本特征选择方法相比,低损降维的降维效果与互信息、χ2统计量相当,而优于文档频率. 展开更多
关键词 维数削减 特征选择 特征抽取 低损降维 文本分类
在线阅读 下载PDF
文本分类中的特征降维方法综述 被引量:79
2
作者 陈涛 谢阳群 《情报学报》 CSSCI 北大核心 2005年第6期690-695,共6页
文本分类的关键是对高维的特征集进行降维.降维的主要方法是特征选择和特征提取.本文综述了已有的特征选择和特征抽取方法,评价了它们的优缺点和适用范围.
关键词 文本分类 特征降维 特征选择 特征提取
在线阅读 下载PDF
特征词提取中同义处理的新方法 被引量:10
3
作者 邹娟 周经野 +1 位作者 邓成 高南莎 《中文信息学报》 CSCD 北大核心 2005年第6期44-49,共6页
本文利用文本分类中文本的特点提出了一种基于模糊集的同义词处理的新方法。本方法充分考虑不同文本类型中同义(近义)词之间的差别,在训练中自动计算不同类型文本中特征词对其对应的同义概念的隶属度,从而实现了用模糊集来定义同义概念... 本文利用文本分类中文本的特点提出了一种基于模糊集的同义词处理的新方法。本方法充分考虑不同文本类型中同义(近义)词之间的差别,在训练中自动计算不同类型文本中特征词对其对应的同义概念的隶属度,从而实现了用模糊集来定义同义概念;然后应用同义概念来提取文本中的特征值。另外,本系统还利用模糊集来处理多义词的问题。文中给出了系统的处理算法。比较试验的结果表明该方法提高了分类的正确率,效果是令人满意的。整个系统达到了较高的自动化水平和较强的可移植性。 展开更多
关键词 人工智图 自然语言处理 文本分类 特征值提取 同义词 特征词 提取 自动化水平 模糊集 自动计算
在线阅读 下载PDF
智能Web浏览器及其关键技术 被引量:4
4
作者 应晓敏 窦文华 《计算机科学》 CSCD 北大核心 2001年第9期29-33,共5页
With the exponential growth of the Wold Wide Web ,there is also a growing demand in intelligent Web browser(IWB),which can provide users with personal services like guiding users while searching the Web,filtering the ... With the exponential growth of the Wold Wide Web ,there is also a growing demand in intelligent Web browser(IWB),which can provide users with personal services like guiding users while searching the Web,filtering the information that users aren't interested in,notifying users when there are valuable changes in the Web sites or pages that users care,and so on. In this paper,we introduce some former researches ,present the architecture of the IWB,describe its main functions ,and discuss key techniques in the resarch of IWB. 展开更多
关键词 WWW WEB 智能浏览器 电子邮件
在线阅读 下载PDF
术语定义抽取的特征选择框架 被引量:1
5
作者 潘湑 顾宏斌 赵芷晴 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2012年第3期399-404,共6页
为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析... 为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析该框架和传统过滤器特征选择方法对特征分布的影响的基础上,在航空领域术语定义语料库中对实验结果进行了对比。结果表明,本文提出的方法在使用平衡随机森林方法时,取得的最好成绩为F1-measure=0.652,F2-measure=0.761,所需特征比例从30%~40%降低到20%~30%;在使用直接分类方法时,F1-measure成绩提高了2.57倍,F2-measure成绩提高了3.11倍,均优于过滤器方法和Fisher Score方法。 展开更多
关键词 特征选择 不平衡语料 定义抽取 文本分类 小析取项
在线阅读 下载PDF
军事情报文本分类中的维数约减技术
6
作者 高影繁 刘玉树 《火力与指挥控制》 CSCD 北大核心 2008年第5期5-8,13,共5页
为保证军事指挥决策的质量和速度、提高军事情报文本的分析能力,高效率的自动文本分类成为其中的重要技术。描述了文本分类所面临的高维稀疏文本空间和维数灾难等问题,综述了各种寻找最优和次优子集的特征选择技术和以主成分分析、Fishe... 为保证军事指挥决策的质量和速度、提高军事情报文本的分析能力,高效率的自动文本分类成为其中的重要技术。描述了文本分类所面临的高维稀疏文本空间和维数灾难等问题,综述了各种寻找最优和次优子集的特征选择技术和以主成分分析、Fisher判别分析、潜在语义索引等为代表的特征抽取技术,并指出了目前存在的技术问题和未来的工作方向。 展开更多
关键词 情报文本分类 特征选择 特征抽取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部