-
题名基于主题本体扩展特征的短文本分类
被引量:4
- 1
-
-
作者
湛燕
陈昊
-
机构
河北大学数学与计算机学院、河北省机器学习与计算智能重点实验室
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2014年第3期307-311,共5页
-
基金
国家自然科学基金资助项目(60903088)
河北省自然科学基金资助项目(F2013201064
+2 种基金
A2010000188)
河北大学自然科学研究计划青年基金资助项目(2010Q23)
河北省软科学研究计划项目(14450318D)
-
文摘
短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性.
-
关键词
短文本分类
主题本体
案例维护
-
Keywords
short text categorization
theme ontology
case-base maintenance
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名优化主题词本体的方法
- 2
-
-
作者
李冠宇
王长霞
刘树鹏
-
机构
大连海事大学信息科学技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第9期2108-2111,共4页
-
基金
国家自然科学基金项目(60672031)
辽宁省自然科学基金项目(20072142)
-
文摘
为了解决利用主题词表构建的本体在描述上过于简单的问题,提出了一种优化主题词本体的框架。对主题词本体进行本体解析,在此基础上,对已有的相似度计算公式进行修改,给出了一种适合主题词本体的综合的相似度计算公式,并制订了优化主题词本体的规则,设计了相应的算法,将优化主题词本体功能发布成了语义Web服务。该方法弥补了主题词本体在描述上的不足,实验结果表明了该方法的可行性和有效性。
-
关键词
表
主题词本体
本体
本体解析
语义WEB服务
-
Keywords
thesaurus
thesaurus ontology
ontology
ontology parsing
semantic web service
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-