Deep Web中蕴涵了海量的高质量信息.文中从Deep Web数据源的功能属性和非功能属性两个方面对数据源的质量进行度量,建立了一种基于综合模糊评价指标体系的扩展的数据源质量估计模型.实验结果表明该模型得到的数据源质量排序序列和人工...Deep Web中蕴涵了海量的高质量信息.文中从Deep Web数据源的功能属性和非功能属性两个方面对数据源的质量进行度量,建立了一种基于综合模糊评价指标体系的扩展的数据源质量估计模型.实验结果表明该模型得到的数据源质量排序序列和人工排序序列的Kendall’s距离较扩展前有了很大提高,而且质量估计结果也能使数据源的选择得到较高精确度.展开更多
最大均值差异嵌入(Maximum Mean Discrepancy Embedding,MMDE)作为一种基于最大均值差异(MaximumMean Discrepancy,MMD)度量的特征提取方法被成功地运用.然而通过分析得知,该方法在处理原始输入空间上的特征提取问题时一定程度上缺乏适...最大均值差异嵌入(Maximum Mean Discrepancy Embedding,MMDE)作为一种基于最大均值差异(MaximumMean Discrepancy,MMD)度量的特征提取方法被成功地运用.然而通过分析得知,该方法在处理原始输入空间上的特征提取问题时一定程度上缺乏适应性.因此本文在MMD准则的基础上,并结合已经被广泛研究和探讨的局部学习方法,提出一个新的评价度量:最大局部加权均值差异(Maximum LocalWeightedMean Discrepancy,MLMD),该度量反映源域和目标域分布差异时能充分考虑两个区域内在的局部结构,同时还能通过局部分布差异去反映全局分布差异.本文还在此度量的基础上提出一种能实现迁移学习任务并具有一定局部学习能力的特征提取方法:最大局部加权均值差异嵌入(Maximum Local WeightedMean Discrepancy Embedding,MWME).该方法不但能完成传统意义上的特征提取,同时还能完成在两个分布存在差异但相关的两个区域上实现领域适应学习,从而表明该特征提取方法具有较好的鲁棒性和适应性.实验证明MLMD准则和MWME方法具有上述优势.展开更多