-
题名面向导航型网页关键词自动抽取的视觉模型与算法
- 1
-
-
作者
彭浩
蔡美玲
陈继锋
刘炽
余炳锐
-
机构
湖南涉外经济学院计算机科学与技术学院
中南大学信息科学与工程学院
中国电力出版社用电技术出版中心
-
出处
《计算机应用》
CSCD
北大核心
2012年第8期2360-2363,2368,共5页
-
基金
国家自然科学基金资助项目(60803024)
湖南省自然科学基金资助项目(10JJ6092)
+1 种基金
湖南省大学生研究性学习和创新性实验计划项目(湘教通[2011]272号
编号:393)
-
文摘
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区域;然后,依据人类视觉特点,对各区域进行视觉"奇异性"量化,同时利用奇异性传递规则进一步强化关键词相关区域的视觉"奇异性"。P-KEA根据PIX-PAGE模型模型的视觉量化结果,能够较准确地找到视觉突出区域中的关键词。实验结果表明,与基于DocView模型的算法DVM相比,P-KEA的准确率平均提高了20.9%。
-
关键词
区域合并
视觉量化
网页表示模型
关键词自动抽取
-
Keywords
block composition
visual characteristic measurement
Web page representation model
automatic keywordsextraction
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-