跨域图像识别技术旨在利用已标注源域完成未标注目标域上的图像标注任务,且这2个域服从不同数据分布。现有方法一般通过提取域不变表征缩小域间分布差异,从而提升源域训练模型在目标域上的图像标注能力。然而,部分源域样本与目标域样本...跨域图像识别技术旨在利用已标注源域完成未标注目标域上的图像标注任务,且这2个域服从不同数据分布。现有方法一般通过提取域不变表征缩小域间分布差异,从而提升源域训练模型在目标域上的图像标注能力。然而,部分源域样本与目标域样本的分布偏差较大,强行提取所有源域样本的域不变表征容易导致模型负适配问题。为此,提出一种基于类条件最优传输的跨域样本选择(CDSS)策略。对于2个域中对应相同类的样本,该策略在源域中选择最能代表目标域的样本子集,并将该过程建模为在源域上学习一个稀疏概率分布的优化问题,使该分布与目标域分布之间的最优传输距离最小。在3个跨域图像识别数据集上的实验结果表明,应用所提策略后,方法的平均识别精度较3种主流基准方法(批谱正则化项(BSP)、批量核范数最大化(BNM)和MDD(Maximum Density Divergence))均取得了显著提升,验证了所提策略在改善模型负适配问题上的有效性。展开更多
文摘跨域图像识别技术旨在利用已标注源域完成未标注目标域上的图像标注任务,且这2个域服从不同数据分布。现有方法一般通过提取域不变表征缩小域间分布差异,从而提升源域训练模型在目标域上的图像标注能力。然而,部分源域样本与目标域样本的分布偏差较大,强行提取所有源域样本的域不变表征容易导致模型负适配问题。为此,提出一种基于类条件最优传输的跨域样本选择(CDSS)策略。对于2个域中对应相同类的样本,该策略在源域中选择最能代表目标域的样本子集,并将该过程建模为在源域上学习一个稀疏概率分布的优化问题,使该分布与目标域分布之间的最优传输距离最小。在3个跨域图像识别数据集上的实验结果表明,应用所提策略后,方法的平均识别精度较3种主流基准方法(批谱正则化项(BSP)、批量核范数最大化(BNM)和MDD(Maximum Density Divergence))均取得了显著提升,验证了所提策略在改善模型负适配问题上的有效性。