SimRank方法是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的方法,针对在真实的大规模社交网络中节点与节点之间的迭代计算过程需要消耗大量的时间,提出了一种基于SimRank全局矩阵平滑收敛的网络社区发现方法(SimRank global...SimRank方法是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的方法,针对在真实的大规模社交网络中节点与节点之间的迭代计算过程需要消耗大量的时间,提出了一种基于SimRank全局矩阵平滑收敛的网络社区发现方法(SimRank global smooth convergence,SGSC)。首先,该算法通过经典度量来识别网络中的初始核心节点;然后利用矩阵平滑收敛来计算SimRank得到最终核心节点;最后,基于全局收敛矩阵,将社区聚集在核心节点周围,使用Closeness指数合并两个社区,通过递归的重复该过程,聚类出最终社区。在3种真实的不同规模的社交网络中将SGSC和其他2种具有代表性的方法进行比较,并验证了提出的算法在不同规模的社交网络中社区划分的准确率和算法运行的时间性能上有所提升。展开更多
无监督域自适应行人重识别(Unsupervised Domain Adaptation for person Re-identification, UDA-ReID)任务致力于将知识从已标记的源域数据转移到目标域。和传统的单源域自适应相比,将多源域的知识迁移到目标域是一项更具挑战性的任务...无监督域自适应行人重识别(Unsupervised Domain Adaptation for person Re-identification, UDA-ReID)任务致力于将知识从已标记的源域数据转移到目标域。和传统的单源域自适应相比,将多源域的知识迁移到目标域是一项更具挑战性的任务。由于领域上的差距,多数据集的简单组合只能产生有限的改进。针对此问题,提出了一种基于精确特征分布匹配和多域信息融合的多源域对比学习(exact feature distribution Matching and multi-domain information Fusion based Multi-domain Contrastive Learning, MFMCL)方法。该方法首先采用具有混合记忆的自步对比学习提取不同域数据的特征,并对提取到的特征进行构图,然后通过两层残差图卷积网络进行多域特征融合。其次,为了增强交叉分布特征、产生更丰富的信息,通过基于排序算法的精确直方图匹配来实现精确特征分布匹配,以获得更多样化的特征增强。实验表明,与目前先进的无监督域自适应行人重识别方法相比,所提出的MFMCL方法在广泛使用的行人重识别数据集Market1501、MSMT17和Duke上都取得了优越的性能。展开更多
异构信息网络(Heterogeneous Information Network, HIN)凭借其丰富的语义信息和结构信息被广泛应用于推荐系统中,虽然取得了很好的推荐效果,但较少考虑局部特征放大、信息交互和多嵌入聚合等问题。针对这些问题,提出了一种新的用于top-...异构信息网络(Heterogeneous Information Network, HIN)凭借其丰富的语义信息和结构信息被广泛应用于推荐系统中,虽然取得了很好的推荐效果,但较少考虑局部特征放大、信息交互和多嵌入聚合等问题。针对这些问题,提出了一种新的用于top-N推荐的多嵌入融合推荐(Multi-embedding Fusion Recommendation, MFRec)模型。首先,该模型在用户和项目学习分支中都采用对象上下文表示网络,充分利用上下文信息以放大局部特征,增强相邻节点的交互性;其次,将空洞卷积和空间金字塔池化引入元路径学习分支,以便获取多尺度信息并增强元路径的节点表示;然后,采用多嵌入融合模块以便更好地进行用户、项目以及元路径的嵌入融合,细粒度地进行多嵌入之间的交互学习,并强调了各特征的不同重要性程度;最后,在两个公共推荐系统数据集上进行了实验,结果表明所提模型MFRec优于现有的其他top-N推荐系统模型。展开更多
为了提高U-Net网络性能的同时尽可能减少额外计算量,本文提出了一种新的多尺度偶数卷积注意力UNet(Multiscale Even Convolution Attention U-Net,MECAU-Net)网络。该网络在编码端采用2×2偶数卷积代替3×3卷积进行特征提取,并...为了提高U-Net网络性能的同时尽可能减少额外计算量,本文提出了一种新的多尺度偶数卷积注意力UNet(Multiscale Even Convolution Attention U-Net,MECAU-Net)网络。该网络在编码端采用2×2偶数卷积代替3×3卷积进行特征提取,并借鉴多尺度思想,采用4×4偶数卷积将得到的信息直接传递给主干部分,以获取更全面的图像信息并减少额外计算开销,同时还采用对称填充解决偶数卷积提取信息过程中产生的偏移问题。此外,在2×2偶数卷积模块后加入卷积注意力模块,结合空间和通道注意力,在提取更丰富的信息的同时几乎不增加额外开销。最后,在两个医学图像数据集上进行仿真实验,实验结果表明提出的MECAU-Net网络相对于U-Net在稍微增加计算成本的情况下,分割性能得到了较大的提升,并比其他对比网络取得更好的分割性能的同时还降低了参数量。展开更多
针对传统低秩稀疏分解(low rank and sparse decomposition,LRSD)用于视频运动目标检测时检测精度较低的问题,提出了一种鲁棒非凸运动辅助LRSD(robust nonconvex motion-assisted LRSD,RNMALRSD)的运动目标检测算法。该算法首先考虑到...针对传统低秩稀疏分解(low rank and sparse decomposition,LRSD)用于视频运动目标检测时检测精度较低的问题,提出了一种鲁棒非凸运动辅助LRSD(robust nonconvex motion-assisted LRSD,RNMALRSD)的运动目标检测算法。该算法首先考虑到视频背景的低秩特性,采用非凸γ范数对秩函数进行逼近,考虑视频背景在变换域上仍然具有稀疏性,引入背景在变换域的稀疏先验。其次,引入运动辅助信息矩阵,使其融入前景的运动信息,表示每个像素属于背景的可能性,提高视频运动目标检测的准确度。然后,采用交替方向乘子法(alternating direction method of multipliers,ADMM)对提出的模型进行求解。最后,将提出的方法应用到视频运动目标检测上进行仿真实验。对实验结果的分析表明,提出的RNMALRSD方法比其他基于LRSD的运动目标检测方法具有更高的检测精度。展开更多
为了解决传统基于特征描述匹配算法鲁棒性和精度较差的问题,提出一种基于改进的蜘蛛网局部图像特征(Spider Local Image Feature,SLIF)描述子的图像配准算法。该算法对SLIF描述子进行改进,将特征点采样模型范围内的方形、径向、环形邻...为了解决传统基于特征描述匹配算法鲁棒性和精度较差的问题,提出一种基于改进的蜘蛛网局部图像特征(Spider Local Image Feature,SLIF)描述子的图像配准算法。该算法对SLIF描述子进行改进,将特征点采样模型范围内的方形、径向、环形邻域像素信息纳入描述范围,增强SLIF描述子空域描述能力。此外,还对SLIF描述子描述方法进行改进,利用特征点采样模型范围内像素点之间自相似性构建特征描述方法。实验表明,该方法在平移旋转图像特征点配对的准确率和配准精度高,抗噪声能力强,具有较好的鲁棒性和图像变换适应性。展开更多
视频前背景分离的主要目的是从视频中提取感兴趣目标,但是由于噪声、光照变化等的影响使其仍是计算机视觉等领域最具有挑战性的任务之一。截断核范数(truncated nuclear norm,TNN)算法是一种经典的鲁棒主成分分析(robust principal comp...视频前背景分离的主要目的是从视频中提取感兴趣目标,但是由于噪声、光照变化等的影响使其仍是计算机视觉等领域最具有挑战性的任务之一。截断核范数(truncated nuclear norm,TNN)算法是一种经典的鲁棒主成分分析(robust principal component analysis,RPCA)算法,被广泛地应用于视频前背景分离。但是,该算法中的截断核范数对传统鲁棒主成分分析中的秩函数逼近度不高,导致其稳定性不强,对一些复杂场景下的视频前背景分离精度不高。针对该问题,本文提出了一种改进的截断核范数(improved truncated nuclear norm,ITNN)算法。该算法首先采用非凸γ范数替代TNN模型中的核范数,并分析了相对于核范数而言,非凸γ范数对秩函数具有更高的逼近度,同时提出了该算法所对应的模型;其次,为了求解提出的模型,本文引入了广义交替方向乘子法(generalized alternating direction method of multipliers,GADMM)对该模型进行求解;最后,将提出的ITNN算法应用于多个公共视频的前背景分离实验中,并通过展示提取不同视频的前景效果,从视觉角度验证了ITNN算法的有效性。同时,计算提出算法和对比算法提取的视频前景的F-measure值,从量化的角度进一步验证了ITNN算法的有效性。另外,实验还记录了各算法的视频前背景分离的运行时间,验证了ITNN算法的效率。总之,本文通过实验验证了提出的ITNN算法在视频前背景分离中的有效性和优越性。展开更多
低秩稀疏分解(Low Rank and Sparse Decomposition,LRSD)是一种被广泛应用于计算机视觉等领域的数据表示技术,通过将已知矩阵分解为低秩成分和稀疏成分,实现视频前背景分离、图像去噪等的实际应用。分析了这一技术的研究现状,针对11种...低秩稀疏分解(Low Rank and Sparse Decomposition,LRSD)是一种被广泛应用于计算机视觉等领域的数据表示技术,通过将已知矩阵分解为低秩成分和稀疏成分,实现视频前背景分离、图像去噪等的实际应用。分析了这一技术的研究现状,针对11种经典低秩稀疏分解方法,给出了各种方法的模型及算法的优缺点。将各种算法应用于视频前背景分离和图像去噪实验中,视频前背景分离的实验结果包括使用各种算法提取的不同视频的前景效果图、视频前背景分离的F-measure值和运行时间,图像去噪实验结果展示了各种算法对不同图像的去噪效果图、PSNR值和FSIM值,从视觉效果和定量评价两个角度验证了各种算法在视频前背景分离和图像去噪这两个实际应用中的优缺点。展开更多
文摘SimRank方法是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的方法,针对在真实的大规模社交网络中节点与节点之间的迭代计算过程需要消耗大量的时间,提出了一种基于SimRank全局矩阵平滑收敛的网络社区发现方法(SimRank global smooth convergence,SGSC)。首先,该算法通过经典度量来识别网络中的初始核心节点;然后利用矩阵平滑收敛来计算SimRank得到最终核心节点;最后,基于全局收敛矩阵,将社区聚集在核心节点周围,使用Closeness指数合并两个社区,通过递归的重复该过程,聚类出最终社区。在3种真实的不同规模的社交网络中将SGSC和其他2种具有代表性的方法进行比较,并验证了提出的算法在不同规模的社交网络中社区划分的准确率和算法运行的时间性能上有所提升。
文摘无监督域自适应行人重识别(Unsupervised Domain Adaptation for person Re-identification, UDA-ReID)任务致力于将知识从已标记的源域数据转移到目标域。和传统的单源域自适应相比,将多源域的知识迁移到目标域是一项更具挑战性的任务。由于领域上的差距,多数据集的简单组合只能产生有限的改进。针对此问题,提出了一种基于精确特征分布匹配和多域信息融合的多源域对比学习(exact feature distribution Matching and multi-domain information Fusion based Multi-domain Contrastive Learning, MFMCL)方法。该方法首先采用具有混合记忆的自步对比学习提取不同域数据的特征,并对提取到的特征进行构图,然后通过两层残差图卷积网络进行多域特征融合。其次,为了增强交叉分布特征、产生更丰富的信息,通过基于排序算法的精确直方图匹配来实现精确特征分布匹配,以获得更多样化的特征增强。实验表明,与目前先进的无监督域自适应行人重识别方法相比,所提出的MFMCL方法在广泛使用的行人重识别数据集Market1501、MSMT17和Duke上都取得了优越的性能。
文摘具有混合记忆的自步对比学习(Self-paced Contrastive Learning,SpCL)通过集群聚类生成不同级别的伪标签来训练网络,取得了较好的识别效果,然而该方法从源域和目标域中捕获的行人数据之间存在典型的分布差异,使得训练出的网络不能准确区别目标域和源域数据域特征。针对此问题,提出了双分支动态辅助对比学习(Dynamic Auxiliary Contrastive Learning,DACL)框架。该方法首先通过动态减小源域和目标域之间的局部最大平均差异(Local Maximum Mean Discrepancy,LMMD),以有效地学习目标域的域不变特征;其次,引入广义均值(Generalized Mean,GeM)池化策略,在特征提取后再进行特征聚合,使提出的网络能够自适应地聚合图像的重要特征;最后,在3个经典行人重识别数据集上进行了仿真实验,提出的DACL与性能次之的无监督域自适应行人重识别方法相比,mAP和rank-1在Market1501数据集上分别增加了6.0个百分点和2.2个百分点,在MSMT17数据集上分别增加了2.8个百分点和3.6个百分点,在Duke数据集上分别增加了1.7个百分点和2.1个百分点。
文摘为了提高U-Net网络性能的同时尽可能减少额外计算量,本文提出了一种新的多尺度偶数卷积注意力UNet(Multiscale Even Convolution Attention U-Net,MECAU-Net)网络。该网络在编码端采用2×2偶数卷积代替3×3卷积进行特征提取,并借鉴多尺度思想,采用4×4偶数卷积将得到的信息直接传递给主干部分,以获取更全面的图像信息并减少额外计算开销,同时还采用对称填充解决偶数卷积提取信息过程中产生的偏移问题。此外,在2×2偶数卷积模块后加入卷积注意力模块,结合空间和通道注意力,在提取更丰富的信息的同时几乎不增加额外开销。最后,在两个医学图像数据集上进行仿真实验,实验结果表明提出的MECAU-Net网络相对于U-Net在稍微增加计算成本的情况下,分割性能得到了较大的提升,并比其他对比网络取得更好的分割性能的同时还降低了参数量。
文摘针对传统低秩稀疏分解(low rank and sparse decomposition,LRSD)用于视频运动目标检测时检测精度较低的问题,提出了一种鲁棒非凸运动辅助LRSD(robust nonconvex motion-assisted LRSD,RNMALRSD)的运动目标检测算法。该算法首先考虑到视频背景的低秩特性,采用非凸γ范数对秩函数进行逼近,考虑视频背景在变换域上仍然具有稀疏性,引入背景在变换域的稀疏先验。其次,引入运动辅助信息矩阵,使其融入前景的运动信息,表示每个像素属于背景的可能性,提高视频运动目标检测的准确度。然后,采用交替方向乘子法(alternating direction method of multipliers,ADMM)对提出的模型进行求解。最后,将提出的方法应用到视频运动目标检测上进行仿真实验。对实验结果的分析表明,提出的RNMALRSD方法比其他基于LRSD的运动目标检测方法具有更高的检测精度。
文摘为了解决传统基于特征描述匹配算法鲁棒性和精度较差的问题,提出一种基于改进的蜘蛛网局部图像特征(Spider Local Image Feature,SLIF)描述子的图像配准算法。该算法对SLIF描述子进行改进,将特征点采样模型范围内的方形、径向、环形邻域像素信息纳入描述范围,增强SLIF描述子空域描述能力。此外,还对SLIF描述子描述方法进行改进,利用特征点采样模型范围内像素点之间自相似性构建特征描述方法。实验表明,该方法在平移旋转图像特征点配对的准确率和配准精度高,抗噪声能力强,具有较好的鲁棒性和图像变换适应性。
文摘视频前背景分离的主要目的是从视频中提取感兴趣目标,但是由于噪声、光照变化等的影响使其仍是计算机视觉等领域最具有挑战性的任务之一。截断核范数(truncated nuclear norm,TNN)算法是一种经典的鲁棒主成分分析(robust principal component analysis,RPCA)算法,被广泛地应用于视频前背景分离。但是,该算法中的截断核范数对传统鲁棒主成分分析中的秩函数逼近度不高,导致其稳定性不强,对一些复杂场景下的视频前背景分离精度不高。针对该问题,本文提出了一种改进的截断核范数(improved truncated nuclear norm,ITNN)算法。该算法首先采用非凸γ范数替代TNN模型中的核范数,并分析了相对于核范数而言,非凸γ范数对秩函数具有更高的逼近度,同时提出了该算法所对应的模型;其次,为了求解提出的模型,本文引入了广义交替方向乘子法(generalized alternating direction method of multipliers,GADMM)对该模型进行求解;最后,将提出的ITNN算法应用于多个公共视频的前背景分离实验中,并通过展示提取不同视频的前景效果,从视觉角度验证了ITNN算法的有效性。同时,计算提出算法和对比算法提取的视频前景的F-measure值,从量化的角度进一步验证了ITNN算法的有效性。另外,实验还记录了各算法的视频前背景分离的运行时间,验证了ITNN算法的效率。总之,本文通过实验验证了提出的ITNN算法在视频前背景分离中的有效性和优越性。
文摘低秩稀疏分解(Low Rank and Sparse Decomposition,LRSD)是一种被广泛应用于计算机视觉等领域的数据表示技术,通过将已知矩阵分解为低秩成分和稀疏成分,实现视频前背景分离、图像去噪等的实际应用。分析了这一技术的研究现状,针对11种经典低秩稀疏分解方法,给出了各种方法的模型及算法的优缺点。将各种算法应用于视频前背景分离和图像去噪实验中,视频前背景分离的实验结果包括使用各种算法提取的不同视频的前景效果图、视频前背景分离的F-measure值和运行时间,图像去噪实验结果展示了各种算法对不同图像的去噪效果图、PSNR值和FSIM值,从视觉效果和定量评价两个角度验证了各种算法在视频前背景分离和图像去噪这两个实际应用中的优缺点。