检索结果-维普期刊中文期刊服务平台

中文文本挖掘的特征导航机制被引量：12: 1; 作者林鸿飞战学刚姚天顺《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心 2000年第3期240-243,共4页; 文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交... 展开更多; 关键词文本挖掘文本特征抽取概念导航信息处理; 在线阅读下载PDF 职称材料

基于协同演化的文本特征获取算法被引量：3: 2; 作者刘明吉《计算机工程》 EI CAS CSCD 北大核心 2005年第4期85-87,共3页; 作为证券监管机构,如何从海量的网络信息中有效地对文本信息进行准确的分类,对于提高日常监管工作效率是非常重要的。该文主要基于数据挖掘技术,以矢量空间模型VSM为文本的表示方法,提出了一个基于协同演化遗传算法的多文本特征抽取算法... 展开更多; 关键词协同演化 VSM 遗传算法文本特征抽取; 在线阅读下载PDF 职称材料

基于混合模式的文本过滤模型被引量：22: 3; 作者林鸿飞《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1127-1131,共5页; 文本过滤旨在帮助用户处理自己感兴趣的文本 .提出了基于混合模式的文本过滤模型 .其基本思想是将基于内容的过滤方法和合作过滤方法结合起来 ,给出了用户评注的权威性和一致性度量 ,以便更好地运用用户的评注信息 .在此基础上 ,结合用... 展开更多; 关键词文本过滤内容过滤文本特征抽取用户模板混合模式知识库信息处理; 在线阅读下载PDF 职称材料

基于多策略的文档信息过滤技术的应用研究: 4; 作者杨陟卓韩燮《计算机工程与设计》 CSCD 北大核心 2009年第5期1262-1266,共5页; 为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用... 展开更多; 关键词信息检索信息过滤文本特征抽取 TFIDF+ 空间向量模型; 在线阅读下载PDF 职称材料

双语交叉分类模型的设计与实现: 5; 作者林鸿飞王剑峰《中文信息学报》 CSCD 北大核心 2001年第6期27-32,共6页; 利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法 ,本文给出了双语交叉分类的模型以及实现方法。其主要思想是不需要进行机器翻译和人工标注 ,利用文本特征抽取机制提取类别特征项和文本特征项 ,通过基于概念扩充... 展开更多; 关键词双语交叉文本分类概念扩充潜在语义分析空间向量模型知识挖掘语义相似度文本特征抽取机制; 在线阅读下载PDF 职称材料

基于多标签分类的学术文献潜在时间意图识别研究被引量：2: 6; 作者沈思吴玺煜《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2017年第10期158-164,共7页; 为了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算... 展开更多; 关键词多标签分类主题模型潜在时间意图文本特征抽取文本分类; 在线阅读下载PDF 职称材料

题名中文文本挖掘的特征导航机制被引量：12: 1; 作者林鸿飞战学刚姚天顺; 机构东北大学信息科学与工程学院; 出处《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心 2000年第3期240-243,共4页; 基金国家"九七三"重点基础研究发展规划! (G1998- 0 3- 0 5- 0 1) 国家自然科学基金! ( 6 96 750 19) 国家教委博士点基金; 文摘文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制。; 关键词文本挖掘文本特征抽取概念导航信息处理; Keywords text mining text feature extraction factor analysis conceptual navigation; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于协同演化的文本特征获取算法被引量：3: 2; 作者刘明吉; 机构中国证券登记结算有限责任公司上海分公司; 出处《计算机工程》 EI CAS CSCD 北大核心 2005年第4期85-87,共3页; 文摘作为证券监管机构,如何从海量的网络信息中有效地对文本信息进行准确的分类,对于提高日常监管工作效率是非常重要的。该文主要基于数据挖掘技术,以矢量空间模型VSM为文本的表示方法,提出了一个基于协同演化遗传算法的多文本特征抽取算法,有效地降低了文本特征矢量的维数,为文本分类模板获取等多文本特征获取问题提供了一个可行的解决方案。; 关键词协同演化 VSM 遗传算法文本特征抽取; Keywords Cooperativeevolution VSM Genetic algorithm Text feature abstract; 分类号 TP312 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于混合模式的文本过滤模型被引量：22: 3; 作者林鸿飞; 机构大连理工大学计算机科学系; 出处《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1127-1131,共5页; 基金国家自然科学基金重点项目资助 ( 6 978930 1); 文摘文本过滤旨在帮助用户处理自己感兴趣的文本 .提出了基于混合模式的文本过滤模型 .其基本思想是将基于内容的过滤方法和合作过滤方法结合起来 ,给出了用户评注的权威性和一致性度量 ,以便更好地运用用户的评注信息 .在此基础上 ,结合用户的个人兴趣 ,给出了文本特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制 .该方法不依赖于具体的领域知识库 ,大大降低“噪音”影响 ,并可以适用于多媒体类型文件的过滤和信息服务 .; 关键词文本过滤内容过滤文本特征抽取用户模板混合模式知识库信息处理; Keywords text filtering, content-based filtering, collaborative filtering, text feature extraction, user profile, user annotation; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多策略的文档信息过滤技术的应用研究: 4; 作者杨陟卓韩燮; 机构中北大学电子与计算机科学技术学院; 出处《计算机工程与设计》 CSCD 北大核心 2009年第5期1262-1266,共5页; 文摘为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户。从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性。实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量。; 关键词信息检索信息过滤文本特征抽取 TFIDF+ 空间向量模型; Keywords information retrieval information filtering text feature extraction TFIDF＋ VSM; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP301.4 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名双语交叉分类模型的设计与实现: 5; 作者林鸿飞王剑峰; 机构大连理工大学计算机系大连外国语学院计算机中心; 出处《中文信息学报》 CSCD 北大核心 2001年第6期27-32,共6页; 文摘利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法 ,本文给出了双语交叉分类的模型以及实现方法。其主要思想是不需要进行机器翻译和人工标注 ,利用文本特征抽取机制提取类别特征项和文本特征项 ,通过基于概念扩充的对译映射规则自动生成类别和文本特征向量 ,在此基础上利用潜在语义分析 ,将双语文本在语义层面上统一起来 ,通过类别与文本的语义相似度进行分类。; 关键词双语交叉文本分类概念扩充潜在语义分析空间向量模型知识挖掘语义相似度文本特征抽取机制; Keywords bi linguistic text categorization conceptual expansion latent semantic indexing vector space model; 分类号 TP391.12 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于多标签分类的学术文献潜在时间意图识别研究被引量：2: 6; 作者沈思吴玺煜; 机构南京理工大学经济管理学院华南师范大学计算机学院; 出处《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2017年第10期158-164,共7页; 基金国家自然科学基金资助项目(71503124) 江苏省社会科学基金青年资助项目(15TQC03)~~; 文摘为了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算法.首先,在获取的文献时间信息基础上,将文献检索潜在时间意图映射至具体时间类别.其次,为了减少时间信息的稀疏性对分类特征学习过程的影响,利用交叉学科中时间短语分布特征优化Labeled LDA分类模型的标签选择过程.最后,将所提算法与其他多标签分类算法进行对比实验,分析和评估文献检索潜在时间意图自动分类的准确率.结果表明,所提算法的AUC的值达到79.6%,较同类基准算法ECC(整体分类链)提高约10.9%,且针对不同学科均取得了较好的分类效果,是一种有效的文献检索潜在时间意图学习方法.; 关键词多标签分类主题模型潜在时间意图文本特征抽取文本分类; Keywords multi-label classification topic model temporal information need text feature Extraction ext classification; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	中文文本挖掘的特征导航机制	林鸿飞战学刚姚天顺	《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心	2000	12	在线阅读下载PDF 职称材料
2	基于协同演化的文本特征获取算法	刘明吉	《计算机工程》 EI CAS CSCD 北大核心	2005	3	在线阅读下载PDF 职称材料
3	基于混合模式的文本过滤模型	林鸿飞	《计算机研究与发展》 EI CSCD 北大核心	2001	22	在线阅读下载PDF 职称材料
4	基于多策略的文档信息过滤技术的应用研究	杨陟卓韩燮	《计算机工程与设计》 CSCD 北大核心	2009	0	在线阅读下载PDF 职称材料
5	双语交叉分类模型的设计与实现	林鸿飞王剑峰	《中文信息学报》 CSCD 北大核心	2001	0	在线阅读下载PDF 职称材料
6	基于多标签分类的学术文献潜在时间意图识别研究	沈思吴玺煜	《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2017	2	在线阅读下载PDF 职称材料