期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
中文文本挖掘的特征导航机制 被引量:12
1
作者 林鸿飞 战学刚 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2000年第3期240-243,共4页
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交... 文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点 ,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项 ,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制 。 展开更多
关键词 文本挖掘 文本特征抽取 概念导航 信息处理
在线阅读 下载PDF
基于协同演化的文本特征获取算法 被引量:3
2
作者 刘明吉 《计算机工程》 EI CAS CSCD 北大核心 2005年第4期85-87,共3页
作为证券监管机构,如何从海量的网络信息中有效地对文本信息进行准确的分类,对于提高日常监管工作效率是非常重要的。该文主要基于数据挖掘技术,以矢量空间模型VSM为文本的表示方法,提出了一个基于协同演化遗传算法的多文本特征抽取算法... 作为证券监管机构,如何从海量的网络信息中有效地对文本信息进行准确的分类,对于提高日常监管工作效率是非常重要的。该文主要基于数据挖掘技术,以矢量空间模型VSM为文本的表示方法,提出了一个基于协同演化遗传算法的多文本特征抽取算法,有效地降低了文本特征矢量的维数,为文本分类模板获取等多文本特征获取问题提供了一个可行的解决方案。 展开更多
关键词 协同演化 VSM 遗传算法 文本特征抽取
在线阅读 下载PDF
基于混合模式的文本过滤模型 被引量:22
3
作者 林鸿飞 《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1127-1131,共5页
文本过滤旨在帮助用户处理自己感兴趣的文本 .提出了基于混合模式的文本过滤模型 .其基本思想是将基于内容的过滤方法和合作过滤方法结合起来 ,给出了用户评注的权威性和一致性度量 ,以便更好地运用用户的评注信息 .在此基础上 ,结合用... 文本过滤旨在帮助用户处理自己感兴趣的文本 .提出了基于混合模式的文本过滤模型 .其基本思想是将基于内容的过滤方法和合作过滤方法结合起来 ,给出了用户评注的权威性和一致性度量 ,以便更好地运用用户的评注信息 .在此基础上 ,结合用户的个人兴趣 ,给出了文本特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制 .该方法不依赖于具体的领域知识库 ,大大降低“噪音”影响 ,并可以适用于多媒体类型文件的过滤和信息服务 . 展开更多
关键词 文本过滤 内容过滤 文本特征抽取 用户模板 混合模式 知识库 信息处理
在线阅读 下载PDF
基于多策略的文档信息过滤技术的应用研究
4
作者 杨陟卓 韩燮 《计算机工程与设计》 CSCD 北大核心 2009年第5期1262-1266,共5页
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用... 为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户。从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性。实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量。 展开更多
关键词 信息检索 信息过滤 文本特征抽取 TFIDF+ 空间向量模型
在线阅读 下载PDF
双语交叉分类模型的设计与实现
5
作者 林鸿飞 王剑峰 《中文信息学报》 CSCD 北大核心 2001年第6期27-32,共6页
利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法 ,本文给出了双语交叉分类的模型以及实现方法。其主要思想是不需要进行机器翻译和人工标注 ,利用文本特征抽取机制提取类别特征项和文本特征项 ,通过基于概念扩充... 利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法 ,本文给出了双语交叉分类的模型以及实现方法。其主要思想是不需要进行机器翻译和人工标注 ,利用文本特征抽取机制提取类别特征项和文本特征项 ,通过基于概念扩充的对译映射规则自动生成类别和文本特征向量 ,在此基础上利用潜在语义分析 ,将双语文本在语义层面上统一起来 ,通过类别与文本的语义相似度进行分类。 展开更多
关键词 双语交叉文本分类 概念扩充 潜在语义分析 空间向量模型 知识挖掘 语义相似度 文本特征抽取机制
在线阅读 下载PDF
基于多标签分类的学术文献潜在时间意图识别研究 被引量:2
6
作者 沈思 吴玺煜 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第10期158-164,共7页
为了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算... 为了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算法.首先,在获取的文献时间信息基础上,将文献检索潜在时间意图映射至具体时间类别.其次,为了减少时间信息的稀疏性对分类特征学习过程的影响,利用交叉学科中时间短语分布特征优化Labeled LDA分类模型的标签选择过程.最后,将所提算法与其他多标签分类算法进行对比实验,分析和评估文献检索潜在时间意图自动分类的准确率.结果表明,所提算法的AUC的值达到79.6%,较同类基准算法ECC(整体分类链)提高约10.9%,且针对不同学科均取得了较好的分类效果,是一种有效的文献检索潜在时间意图学习方法. 展开更多
关键词 多标签分类 主题模型 潜在时间意图 文本特征抽取 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部