-
题名基于Ontology和EM方法的网页分类研究
被引量:1
- 1
-
-
作者
丁艳
曹倩
王超
潘金贵
-
机构
南京大学计算机软件新技术国家重点实验室南京大学多媒体技术研究所
-
出处
《计算机科学》
CSCD
北大核心
2003年第11期112-115,共4页
-
文摘
1.引言
当前,Internet上广泛流行的各种搜索引擎,为人们寻找资源提供了便利,而且还辅以各种用于提高精确度的技术,但普遍缺乏导引能力,即不能帮助用户确定所需信息所在的领域,使得获得的结果经常是风马牛不相及.所以,目前迫切需要的就是开发一种智能化、个性化的搜索工具,使其能够满足不同用户对不同领域的信息进行发现和积累的要求.
-
关键词
网页分类
TFIDF
EM
研究
方法
-
Keywords
ontology ,vsm,classifier,feature vector ,document vector
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于减少相似主题分类错误的权重分配新策略
- 2
-
-
作者
唐焕玲
王敬东
陆玉昌
-
机构
烟台职业学院计算机专业教研室
中国工商银行烟台市分行信用卡业务部
中国工商银行烟台市分行信用卡业务部
清华大学计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第13期185-188,共4页
-
基金
国家自然科学基金重大项目(编号:79990580)
国家973重点基础研究发展规划项目(编号:G1998030414)资助
-
文摘
文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数,目的是减少相似主题类别的文档的分类错误。
-
关键词
向量空间模型(vsm)
特征选择
权值调整
贝叶斯分类
-
Keywords
vector Space Model(vsm),feature selection,weight adjustment ,Nave Bayes classifier
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名CFV-NB:基于概念特征向量的NB文档分类模型
- 3
-
-
作者
何丽
刘军
-
机构
天津大学管理学院
天津财经大学理工学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期4-6,共3页
-
基金
天津自然科学基金资助项目(033611011)
天津市高等学校科技发展基金资助项目(20041603)
-
文摘
提出了一种基于概念特征向量的NB文档分类方法。该方法在未标注文档集上通过SOM(Self-OrganizingMaps)聚类产生若干初始文档类,并为每个文档类分配一个类标签,使用最大信息熵的方法建立每个文档类的概念特征向量。在概念特征向量空间上建立最终的文档分类器:CFB-NB。
-
关键词
文档分类
概念特征向量
NB分类器
-
Keywords
document classification
Concept feature vectors
NB classifier
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向领域的语义搜索引擎的应用研究
被引量:5
- 4
-
-
作者
赵宏亮
杨鹤标
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第5期1801-1805,共5页
-
基金
国家自然科学基金项目(61005017)
-
文摘
针对基于关键字的搜索引擎缺乏语义的问题,提出了一种面向专业领域的语义搜索引擎模型。以领域本体形式化描述为基础,构建本体语义框架,进而给出语义搜索模型。在模型中,以概念、概念-实例以及关键字等3种扩展特征项作为基础,对查询扩展算法和文档语义标注算法进行了研究,并且构建了语义索引,通过引入向量空间模型判定扩展检索词与语义文档的相似度。实验结果表明,该模型较传统模型较大提高了检索的查准率和查全率。
-
关键词
搜索引擎
语义索引
查询扩展
语义标注
领域本体
-
Keywords
based search engines
a semantic search engine model is proposed.With the formal description of domain ontology
the ontology semantic frame is built
and the semantic search model is presented.In this model
concept
concept-instance and keyword are used as three feature items as the basis of the semantic query expansion algorithm and document annotation algorithm
and the semantic index is built.The similarity between expanded words and the semantic document is determined by vector space model.The experiment with data from an university news report shows that this model is of large improvement in precision and recall
compared with the traditional model. Key words:search engine
semantic indexing
query expanding
semantic annotation
domain ontology
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-