摘要
提出了一个采用新的抽取规则的包装器 ,结合采用基于文档结构抽取规则和基于特征Pattern匹配抽取规则包装器的优点 ,可以适用于含有多个信息块的Web页面。
A wrapper with new extraction rules, which combines the advantage of extraction rules based on document structure and extraction rules based on patterns, is introduced to solve the problem.
出处
《计算机应用研究》
CSCD
北大核心
2002年第10期23-26,共4页
Application Research of Computers
基金
国家自然科学基金资助项目 (6 0 0 730 30 )
国家高技术研究发展计划"86 3"计划资助项目 (2 0 0 1AA114 0 4 1)