Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作...Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.展开更多
异构数据集成可分为实际存储方式和虚拟方式两种.主要介绍后一种方式中的基于包装器/中介器(w rapper/m ed iator)的信息集成方式.它通过在全局模式和数据源模式间建立映射关系,实时地对各个数据源进行查询,适用于数据源众多,数据量庞大...异构数据集成可分为实际存储方式和虚拟方式两种.主要介绍后一种方式中的基于包装器/中介器(w rapper/m ed iator)的信息集成方式.它通过在全局模式和数据源模式间建立映射关系,实时地对各个数据源进行查询,适用于数据源众多,数据量庞大,数据变化快的情况.它有4种映射方式,LAV、GAV、GLAV和BAV.对同一数据情况分别采用4种映射方法进行对比.最后总结各种方法的特点,及未来发展方向.展开更多
文摘Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.
文摘异构数据集成可分为实际存储方式和虚拟方式两种.主要介绍后一种方式中的基于包装器/中介器(w rapper/m ed iator)的信息集成方式.它通过在全局模式和数据源模式间建立映射关系,实时地对各个数据源进行查询,适用于数据源众多,数据量庞大,数据变化快的情况.它有4种映射方式,LAV、GAV、GLAV和BAV.对同一数据情况分别采用4种映射方法进行对比.最后总结各种方法的特点,及未来发展方向.