作为一种基本图像类型,文本图像在电子商务等方面得到了广泛应用。针对图像数据库中文本图像识别与分类的应用需求,依据文本图像数据与连续色调图像的总体灰度分布差异,该文提出了一种基于图像信息度量(Picture Information Measure,PIM...作为一种基本图像类型,文本图像在电子商务等方面得到了广泛应用。针对图像数据库中文本图像识别与分类的应用需求,依据文本图像数据与连续色调图像的总体灰度分布差异,该文提出了一种基于图像信息度量(Picture Information Measure,PIM)的图像特征和基于该特征的文本图像分类方法。约2G、800幅网络图像数据库的分析和实验表明,图像的PIM特征可以显著区分文本图像和连续色调图像,识别和分类效果好。展开更多
本文提出了一种基于关键词的中文文档图像检索方法,能在不经OCR(Optical Character Recognition)识别的情况下,直接利用中文字符的图像特征进行关键词检索。首先将文档图像分割成单个中文字符图像,接着对字符图像进行汉字笔画的特征数...本文提出了一种基于关键词的中文文档图像检索方法,能在不经OCR(Optical Character Recognition)识别的情况下,直接利用中文字符的图像特征进行关键词检索。首先将文档图像分割成单个中文字符图像,接着对字符图像进行汉字笔画的特征数据提取,然后在特征数据间进行基于WMHD(Weighted Modified Hausdorff Dis-tance)的相似性测量。该方法不受字号的影响,也有一定的抗字体能力,实验证明其具有较高的检索效果。展开更多
针对传统近重复文本图像检索方法需人工事先确定近重复文本图像之间存在的变换类型,易受到人主观性影响这一问题,提出一个面向近重复文本图像检索的三分支孪生网络,能自动学习图像之间存在的各种变换。该网络输入为三元组,包括查询图像...针对传统近重复文本图像检索方法需人工事先确定近重复文本图像之间存在的变换类型,易受到人主观性影响这一问题,提出一个面向近重复文本图像检索的三分支孪生网络,能自动学习图像之间存在的各种变换。该网络输入为三元组,包括查询图像、查询图像的近重复图像以及其非近重复图像,训练时采用三元损失使得查询图像和近重复图像之间的距离小于查询图像与非近重复图像之间的距离。提出的方法在两个数据集上的mAP(mean average precision)分别达到98.76%和96.50%,优于目前已有方法。展开更多
文摘作为一种基本图像类型,文本图像在电子商务等方面得到了广泛应用。针对图像数据库中文本图像识别与分类的应用需求,依据文本图像数据与连续色调图像的总体灰度分布差异,该文提出了一种基于图像信息度量(Picture Information Measure,PIM)的图像特征和基于该特征的文本图像分类方法。约2G、800幅网络图像数据库的分析和实验表明,图像的PIM特征可以显著区分文本图像和连续色调图像,识别和分类效果好。
文摘针对传统近重复文本图像检索方法需人工事先确定近重复文本图像之间存在的变换类型,易受到人主观性影响这一问题,提出一个面向近重复文本图像检索的三分支孪生网络,能自动学习图像之间存在的各种变换。该网络输入为三元组,包括查询图像、查询图像的近重复图像以及其非近重复图像,训练时采用三元损失使得查询图像和近重复图像之间的距离小于查询图像与非近重复图像之间的距离。提出的方法在两个数据集上的mAP(mean average precision)分别达到98.76%和96.50%,优于目前已有方法。