-
题名基于规则的网页分割预处理算法研究
被引量:1
- 1
-
-
作者
彭红超
童名文
邹军华
郝秋红
-
机构
华中师范大学信息与新闻传播学院
湖北大学教育学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第11A期379-382,388,共5页
-
基金
教育部人文社科基金项目:移动学习服务适配决策技术及优化策略研究(10YJC880113)
国家科技支撑计划课题:全媒体在线编辑与适配推送数字出版技术研究及应用示范(2013BAH30F01)
+1 种基金
中央高校基本科研业务费项目:泛在多媒体服务中内容适配决策模型及优化研究
中央高校基本科研业务费项目:数字化学习环境及工具的典型应用(CCNU10C01003)资助
-
文摘
针对国家精品课程网站中网页内容和样式独立设计,网页分割算法难以运行的问题,基于规则提出了一种网页分割预处理算法,建立了网页标签和样式信息的关联。算法包括3个步骤:第一,获取样式信息;第二,关联样式信息和标签;第三,输出HTML和PerfectNode关联类列表。随机选取了100个国家精品课程网站的网页运行预处理算法,实验结果表明该算法可以有效地融合网页标签和样式信息,解决了网页分割算法无法运行的问题。
-
关键词
网页分割
预处理算法
级联样式表
样式信息
-
Keywords
Web page segmentation, Preprocessing algorithm, Cascading style sheets, Style information
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-