-
题名基于语义关联的中文网页主题词提取方法研究
被引量:5
- 1
-
-
作者
李芳芳
葛斌
毛星亮
汤大权
-
机构
国防科学技术大学C
中共湖南省委互联网新闻宣传办公室
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第1期105-107,123,共4页
-
基金
国家自然科学基金资助项目(60903225)
湖北省自然科学基金资助项目(2008CDB388)
-
文摘
提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题词权重进行建模;最后选取权值较高的名词作为主题词。实验结果表明,相比未建立语义关联的主题词提取方法,本方法在查准率、召回率和F1测度值上均有一定的提高,当提取主题词个数为7时,本方法召回率和F1测度值达到最大值,且分别较传统方法最大值提高了12.5%和9.53%。
-
关键词
语义关联
中文网页
主题词
权重
-
Keywords
semantic relations
Chinese Web pages
thematic words
weight
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-