-
题名基于概念的文本类别特征提取与文本模糊匹配
被引量:22
- 1
-
-
作者
罗三定
陆文彦
王浩
贾维嘉
-
机构
中南大学信息科学与工程学院
香港城市大学电脑工程与信息技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第16期97-99,104,共4页
-
基金
国家海外杰出青年自然科学基金(编号:699282201)
香港城市大学计划项目(编号:9640006)
-
文摘
文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语—概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。
-
关键词
概念
文本类别
特征提取
文本模糊匹配
信息处理
-
Keywords
Conceptual Network,Concept Space,Feature Extraction,Text Categorization,Fuzz distance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于概念的文档评价模型
被引量:4
- 2
-
-
作者
罗三定
冯元勇
沈德耀
贾维嘉
-
机构
中南大学信息工程学院
香港城市大学电脑工程与信息技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第8期79-80,283,共3页
-
基金
香港Research on lnternet Reliable Multicast Protocol
(7000765)
-
文摘
理解文档的内容和查询的真实意图是提高搜索引擎智能水平的一种有效途径。提出了一种以分析概念及其关系为基础来理解文档、揣摩查询意图的模型。在该模型中,结合用户背景知识构造一个用户概念库,将文档及查询要求转化为概念集,并适当扩充查询要求概念集,最后将两概念集转化为特征向量,计算其相似度,作为文档的评价值。文中详细给出了概念库及必需的概念运算的数学模型。
-
关键词
概念
文档评价模型
搜索引擎
概念库
INTERNET
-
Keywords
Document evaluation
Document feature
Retrieval intention
Search engine
Concept base
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-