期刊文献+
共找到1,127篇文章
< 1 2 57 >
每页显示 20 50 100
Research on multi-view collaborative detection system for UAV swarms based on Pix2Pix framework and BAM attention mechanism
1
作者 Yan Ding Qingxin Cao +2 位作者 Bozhi Zhang Peilin Li Zhongjiao Shi 《Defence Technology(防务技术)》 2025年第4期213-226,共14页
Drone swarm systems,equipped with photoelectric imaging and intelligent target perception,are essential for reconnaissance and strike missions in complex and high-risk environments.They excel in information sharing,an... Drone swarm systems,equipped with photoelectric imaging and intelligent target perception,are essential for reconnaissance and strike missions in complex and high-risk environments.They excel in information sharing,anti-jamming capabilities,and combat performance,making them critical for future warfare.However,varied perspectives in collaborative combat scenarios pose challenges to object detection,hindering traditional detection algorithms and reducing accuracy.Limited angle-prior data and sparse samples further complicate detection.This paper presents the Multi-View Collaborative Detection System,which tackles the challenges of multi-view object detection in collaborative combat scenarios.The system is designed to enhance multi-view image generation and detection algorithms,thereby improving the accuracy and efficiency of object detection across varying perspectives.First,an observation model for three-dimensional targets through line-of-sight angle transformation is constructed,and a multi-view image generation algorithm based on the Pix2Pix network is designed.For object detection,YOLOX is utilized,and a deep feature extraction network,BA-RepCSPDarknet,is developed to address challenges related to small target scale and feature extraction challenges.Additionally,a feature fusion network NS-PAFPN is developed to mitigate the issue of deep feature map information loss in UAV images.A visual attention module(BAM)is employed to manage appearance differences under varying angles,while a feature mapping module(DFM)prevents fine-grained feature loss.These advancements lead to the development of BA-YOLOX,a multi-view object detection network model suitable for drone platforms,enhancing accuracy and effectively targeting small objects. 展开更多
关键词 Drone swarm systems Reconnaissance and strike Image generation multi-view detection Pix2Pix framework Attention mechanism
在线阅读 下载PDF
Multi-view video color correction using dynamic programming 被引量:1
2
作者 Shao Feng Jiang Gangyi Yu Mei 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第6期1115-1120,共6页
Color inconsistency between views is an important problem to be solved in multi-view video systems. A multi-view video color correction method using dynamic programming is proposed. Three-dimensional histograms are co... Color inconsistency between views is an important problem to be solved in multi-view video systems. A multi-view video color correction method using dynamic programming is proposed. Three-dimensional histograms are constructed with sequential conditional probability in HSI color space. Then, dynamic programming is used to seek the best color mapping relation with the minimum cost path between target image histogram and source image histogram. Finally, video tracking technique is performed to correct multi-view video. Experimental results show that the proposed method can obtain better subjective and objective performance in color correction. 展开更多
关键词 multi-view video color correction dynamic programming video tracking
在线阅读 下载PDF
Efficient fast mode decision using mode complexity for multi-view video coding 被引量:1
3
作者 王凤随 沈庆宏 都思丹 《Journal of Central South University》 SCIE EI CAS 2014年第11期4244-4253,共10页
The variable block-size motion estimation(ME) and disparity estimation(DE) are adopted in multi-view video coding(MVC) to achieve high coding efficiency. However, much higher computational complexity is also introduce... The variable block-size motion estimation(ME) and disparity estimation(DE) are adopted in multi-view video coding(MVC) to achieve high coding efficiency. However, much higher computational complexity is also introduced in coding system, which hinders practical application of MVC. An efficient fast mode decision method using mode complexity is proposed to reduce the computational complexity. In the proposed method, mode complexity is firstly computed by using the spatial, temporal and inter-view correlation between the current macroblock(MB) and its neighboring MBs. Based on the observation that direct mode is highly possible to be the optimal mode, mode complexity is always checked in advance whether it is below a predefined threshold for providing an efficient early termination opportunity. If this early termination condition is not met, three mode types for the MBs are classified according to the value of mode complexity, i.e., simple mode, medium mode and complex mode, to speed up the encoding process by reducing the number of the variable block modes required to be checked. Furthermore, for simple and medium mode region, the rate distortion(RD) cost of mode 16×16 in the temporal prediction direction is compared with that of the disparity prediction direction, to determine in advance whether the optimal prediction direction is in the temporal prediction direction or not, for skipping unnecessary disparity estimation. Experimental results show that the proposed method is able to significantly reduce the computational load by 78.79% and the total bit rate by 0.07% on average, while only incurring a negligible loss of PSNR(about 0.04 d B on average), compared with the full mode decision(FMD) in the reference software of MVC. 展开更多
关键词 multi-view video coding mode decision mode complexity computational complexity
在线阅读 下载PDF
Multi-view ladar data registration in obscure environment
4
作者 Mingbo Zhao Jun He +1 位作者 Wei Qiu Qiang Fu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2013年第4期606-616,共11页
Multi-view laser radar (ladar) data registration in obscure environments is an important research field of obscured target detection from air to ground. There are few overlap regions of the observational data in dif... Multi-view laser radar (ladar) data registration in obscure environments is an important research field of obscured target detection from air to ground. There are few overlap regions of the observational data in different views because of the occluder, so the multi-view data registration is rather difficult. Through indepth analyses of the typical methods and problems, it is obtained that the sequence registration is more appropriate, but needs to improve the registration accuracy. On this basis, a multi-view data registration algorithm based on aggregating the adjacent frames, which are already registered, is proposed. It increases the overlap region between the pending registration frames by aggregation and further improves the registration accuracy. The experiment results show that the proposed algorithm can effectively register the multi-view ladar data in the obscure environment, and it also has a greater robustness and a higher registration accuracy compared with the sequence registration under the condition of equivalent operating efficiency. 展开更多
关键词 laser radar (ladar) multi-view data registration iterative closest point obscured target point cloud data.
在线阅读 下载PDF
Relational graph location network for multi-view image localization
5
作者 YANG Yukun LIU Xiangdong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第2期460-468,共9页
In multi-view image localization task,the features of the images captured from different views should be fused properly.This paper considers the classification-based image localization problem.We propose the relationa... In multi-view image localization task,the features of the images captured from different views should be fused properly.This paper considers the classification-based image localization problem.We propose the relational graph location network(RGLN)to perform this task.In this network,we propose a heterogeneous graph construction approach for graph classification tasks,which aims to describe the location in a more appropriate way,thereby improving the expression ability of the location representation module.Experiments show that the expression ability of the proposed graph construction approach outperforms the compared methods by a large margin.In addition,the proposed localization method outperforms the compared localization methods by around 1.7%in terms of meter-level accuracy. 展开更多
关键词 multi-view image localization graph construction heterogeneous graph graph neural network
在线阅读 下载PDF
3-D morphological feature measurement and reconstruction of wear particles using multi-view polarized optical coherence tomography
6
作者 MENG Yi-ru LV Jin-guang +9 位作者 ZHENG Kai-feng ZHAO Bai-xuan QIN Yu-xin CHEN Yu-peng ZHAO Ying-ze NIE Hai-tao WANG Wei-biao XU Jing-jiang LAN Gong-pu LIANG Jing-qiu 《中国光学(中英文)》 2025年第6期1449-1462,共14页
The morphological description of wear particles in lubricating oil is crucial for wear state monitoring and fault diagnosis in aero-engines.Accurately and comprehensively acquiring three-dimensional(3D)morphological d... The morphological description of wear particles in lubricating oil is crucial for wear state monitoring and fault diagnosis in aero-engines.Accurately and comprehensively acquiring three-dimensional(3D)morphological data of these particles has became a key focus in wear debris analysis.Herein,we develop a novel multi-view polarization-sensitive optical coherence tomography(PS-OCT)method to achieve accurate 3D morphology detection and reconstruction of aero-engine lubricant wear particles,effectively resolving occlusion-induced information loss while enabling material-specific characterization.The particle morphology is captured by multi-view imaging,followed by filtering,sharpening,and contour recognition.The method integrates advanced registration algorithms with Poisson reconstruction to generate high-precision 3D models.This approach not only provides accurate 3D morphological reconstruction but also mitigates information loss caused by particle occlusion,ensuring model completeness.Furthermore,by collecting polarization characteristics of typical metals and their oxides in aero-engine lubricants,this work comprehensively characterizes and comparatively analyzes particle polarization properties using Stokes vectors,polarization uniformity,and cumulative phase retardation,and obtains a three-dimensional model containing polarization information.Ultimately,the proposed method enables multidimensional information acquisition for the reliable identification of abrasive particle types. 展开更多
关键词 multi-view optical low coherence polarization 3D reconstruction wear particles
在线阅读 下载PDF
融合加权不一致性的多视图聚类 被引量:2
7
作者 滕少华 盛文涛 +2 位作者 滕璐瑶 张巍 曾莹 《小型微型计算机系统》 北大核心 2025年第2期381-388,共8页
图学习是一种广泛应用于多视图聚类的技术,它可以从多视图中学习出统一的相似图.现有的图学习方法大多只能发掘多视图的一致性,忽视了不一致的信息,这使得它们可能在学习过程中丢失视图独有的信息.为了解决这个问题,本文提出了一种融合... 图学习是一种广泛应用于多视图聚类的技术,它可以从多视图中学习出统一的相似图.现有的图学习方法大多只能发掘多视图的一致性,忽视了不一致的信息,这使得它们可能在学习过程中丢失视图独有的信息.为了解决这个问题,本文提出了一种融合一致性和不一致性,面向图的多视图低秩聚类框架.该方法首先将多视图分解为一致性和不一致性两个部分,然后利用自适应加权融合多视图的一致性图,并在此过程中防止权重出现平凡解;进而,提出了一种新颖的低秩融合策略,用一个统一的目标函数融合多视图一致性和不一致性,并通过谱聚类获得结果.本文还设计并实现了一种迭代优化方法来求解目标函数.最后,7个多视图数据集的对比实验验证了该方法的有效性. 展开更多
关键词 多视图聚类 融合多视图一致性和不一致性 多视图不一致性 低秩表示
在线阅读 下载PDF
基于自适应增强的多视图对比推荐算法 被引量:1
8
作者 姚迅 王海鹏 +1 位作者 胡新荣 杨捷 《计算机工程》 北大核心 2025年第5期103-113,共11页
近年来,基于神经网络架构的推荐系统取得了显著成功,但在处理富含流行偏见和交互噪声的数据时,未能达到期望的效果。对比学习作为一种从无标记数据中学习的新兴技术备受关注,为解决这一问题提供了潜在方案。提出一种端到端的图对比推荐... 近年来,基于神经网络架构的推荐系统取得了显著成功,但在处理富含流行偏见和交互噪声的数据时,未能达到期望的效果。对比学习作为一种从无标记数据中学习的新兴技术备受关注,为解决这一问题提供了潜在方案。提出一种端到端的图对比推荐算法AMV-CL。首先,基于节点的潜在表征构建用户-项目交互图的互补图;其次,引入自适应增强技术,分别从节点和边缘角度生成多视图数据,并通过重参数化网络调整图结构;最后,规范化对比损失中锚节点的正样本来源,同时利用多视图对比损失来学习用户/项目的潜在表征。在公共数据集上的实验结果显示,相较于最优基准方法SimGCL,AMV-CL在评价指标Recall@20和NDCG@20上的提升最高可达到12.03%和12.64%,表明所提方法能够有效提升推荐性能。 展开更多
关键词 图神经网络 推荐系统 多视图 对比学习 自适应增强
在线阅读 下载PDF
共享和特定表示的多视图属性图聚类 被引量:3
9
作者 曹付元 陈晓惠 《软件学报》 北大核心 2025年第3期1254-1267,共14页
现有的多视图属性图聚类方法通常是在融合多个视图的统一表示中学习一致信息与互补信息,然而先融合再学习的方法不仅会损失原始各个视图的特定信息,而且统一表示难以兼顾一致性与互补性.为了保留各个视图的原始信息,采用先学习再融合的... 现有的多视图属性图聚类方法通常是在融合多个视图的统一表示中学习一致信息与互补信息,然而先融合再学习的方法不仅会损失原始各个视图的特定信息,而且统一表示难以兼顾一致性与互补性.为了保留各个视图的原始信息,采用先学习再融合的方式,先分别学习每个视图的共享表示与特定表示再进行融合,更细粒度地学习多视图的一致信息和互补信息,构建一种基于共享和特定表示的多视图属性图聚类模型(multi-view attribute graph clustering based on shared and specific representation,MSAGC).具体来说,首先通过多视图编码器获得每个视图的初级表示,进而获得每个视图的共享信息和特定信息;然后对齐视图共享信息来学习多视图的一致信息,联合视图特定信息来利用多视图的互补信息,通过差异性约束来处理冗余信息;之后训练多视图解码器重构图的拓扑结构和属性特征矩阵;最后,附加自监督聚类模块使得图表示的学习和聚类任务趋向一致.MSAGC的有效性在真实的多视图属性图数据集上得到了很好地验证. 展开更多
关键词 多视图属性图 共享信息 特定信息 聚类
在线阅读 下载PDF
基于多视角的成像技术与图像增强方法综述 被引量:1
10
作者 李安虎 金佳亮 +1 位作者 刘也琳 马珺琳 《陕西师范大学学报(自然科学版)》 北大核心 2025年第4期1-23,共23页
多视角成像技术通过捕捉不同角度的图像而获取丰富的场景信息,可为自动驾驶、智能制造和机器人导航等领域提供关键的视觉数据。该文总结了主流的多视角成像系统的构成要素、工作原理及其实现方法,从动态成像的适应性、成像精度、成本效... 多视角成像技术通过捕捉不同角度的图像而获取丰富的场景信息,可为自动驾驶、智能制造和机器人导航等领域提供关键的视觉数据。该文总结了主流的多视角成像系统的构成要素、工作原理及其实现方法,从动态成像的适应性、成像精度、成本效益及系统综合性能等关键维度,深入剖析了不同多视角成像系统的显著优势及其存在的局限。进一步针对视觉图像增强技术,结合传统图像处理方法与深度学习技术,讨论了在提升多视角成像质量方面的应用与效果。小型化与低功耗的硬件系统、深度学习算法的集成和应用及多模态数据融合将是多视角成像技术未来发展的重要方向。 展开更多
关键词 多视角 计算成像 图像增强 机器成像
在线阅读 下载PDF
路基病害雷达图像多视图融合识别方法 被引量:1
11
作者 陈登峰 何拓航 +2 位作者 杨小燕 刘世鹏 孟屯良 《测绘通报》 北大核心 2025年第5期66-73,共8页
三维探地雷达(GPR)技术是道路隐性病害检测的重要手段,利用智能辨识算法分析GPR数据能提升病害检测效率,然而现有算法未充分利用GPR多视图信息,导致辨识准确率较低。为此,本文提出了一种GPR多视图融合的路基病害识别模型。该模型采用双... 三维探地雷达(GPR)技术是道路隐性病害检测的重要手段,利用智能辨识算法分析GPR数据能提升病害检测效率,然而现有算法未充分利用GPR多视图信息,导致辨识准确率较低。为此,本文提出了一种GPR多视图融合的路基病害识别模型。该模型采用双通道并行结构,利用MobileViT网络分别从GPR的B-scan和C-scan图像中提取高维特征,挖掘双视图的互补信息以进行特征学习。为有效整合双视图信息,提出了特征交错加权融合方法,将提取到的双视图高维特征进行近邻排列,并通过动态优化特征通道的权重分配,突出关键特征并抑制无关信息。试验结果表明,该网络模型对测试集的准确率达到90.5%;此外,在高斯白噪声干扰下,相较于基线模型,模型总体退化指数降低了13.51%,展示出优越的稳健性。 展开更多
关键词 路基病害 深度学习 探地雷达 多视图融合
在线阅读 下载PDF
基于余弦相似自适应加权视图重构的不完全多视图聚类算法
12
作者 陈永泰 邱野 +1 位作者 万鸣华 杨国为 《济南大学学报(自然科学版)》 北大核心 2025年第3期362-370,378,共10页
为了解决实际应用中多视图数据经常包含缺失或异常信息,以及现有不完全多视图聚类方法在优化数据相似性矩阵时未能充分表示原始数据相似性,增加计算复杂性并忽视视图间判别信息差异等问题,提出一种基于余弦相似自适应加权视图重构的不... 为了解决实际应用中多视图数据经常包含缺失或异常信息,以及现有不完全多视图聚类方法在优化数据相似性矩阵时未能充分表示原始数据相似性,增加计算复杂性并忽视视图间判别信息差异等问题,提出一种基于余弦相似自适应加权视图重构的不完全多视图聚类算法,通过引入局部保留重建项以实现对缺失视图的自然对齐,避免使用平均值填充缺失视图可能带来的负面影响。在初始化阶段,算法通过计算原始多视图空间中的余弦相似度增强原始多视图数据的流形结构保持能力,并在构建完整视图过程中采用自适应加权策略捕捉不同视图的重要性。在4个基准数据集中进行聚类实验,并与现有9种代表性算法的最优结果相比较。结果表明,所提算法的聚类精度、归一化互信息率和纯度的平均值分别提升了5.52%、8.78%和4.77%,具有出色的不完全多视图聚类性能。 展开更多
关键词 不完全多视图聚类 自适应加权 余弦相似性 流形结构 视图重构
在线阅读 下载PDF
基于多视图多尺度对比学习的图协同过滤
13
作者 党伟超 温鑫瑜 +1 位作者 高改梅 刘春霞 《计算机应用》 北大核心 2025年第4期1061-1068,共8页
针对图协同过滤推荐方法存在的单一视图局限性和数据稀疏性问题,提出一种基于多视图多尺度对比学习的图协同过滤(MVMSCL)模型。首先,根据用户-项目交互构建初始交互图,并考虑用户-项目中存在的多种潜在意图,以构建多意图分解视图;其次,... 针对图协同过滤推荐方法存在的单一视图局限性和数据稀疏性问题,提出一种基于多视图多尺度对比学习的图协同过滤(MVMSCL)模型。首先,根据用户-项目交互构建初始交互图,并考虑用户-项目中存在的多种潜在意图,以构建多意图分解视图;其次,利用高阶关系改进邻接矩阵,以构建协同邻居视图;再次,去除不重要的噪声交互,以构建自适应增强的初始交互图和多意图分解视图;最后,引入局部、跨层和全局3种尺度的对比学习范式生成自监督信号,从而提高推荐性能。在Gowalla、Amazon-book和Tmall 3个公共数据集上的实验结果表明,MVMSCL的推荐性能均优于对比模型。与最优基线模型DCCF(Disentangled Contrastive Collaborative Filtering framework)相比,MVMSCL的召回率Recall@20分别提升了5.7%、14.5%和10.0%,归一化折损累计增益NDCG@20分别提升了4.6%、17.9%和11.5%。 展开更多
关键词 推荐系统 协同过滤 图神经网络 多视图 对比学习
在线阅读 下载PDF
基于三维结构模型的晚稻杨梅冠层光分布模拟研究
14
作者 华珊 李双伟 +2 位作者 张淑文 戚行江 张真真 《中国农机化学报》 北大核心 2025年第4期80-85,共6页
果树冠层形态结构决定其冠层内部的光分布情况,果园修剪管理通过改变冠层内微环境进而影响果树的生长发育和光截获能力,最终影响果实产量和品质形成。以晚稻杨梅果树自然生长与修剪管理两种树型结构为研究对象,采用多视角图像序列法重... 果树冠层形态结构决定其冠层内部的光分布情况,果园修剪管理通过改变冠层内微环境进而影响果树的生长发育和光截获能力,最终影响果实产量和品质形成。以晚稻杨梅果树自然生长与修剪管理两种树型结构为研究对象,采用多视角图像序列法重建杨梅树冠层三维结构,结合三维辐射模型和光线追踪算法定量模拟冠层内光分布规律。结果表明,多视角图像序列法可以较好地重建杨梅树冠层形态结构,果树主要形态参数模型提取值与人工实测值之间具有较好的一致性,均方根误差RMSE<19.3 cm。自然生长树型结构较为紧凑,叶片相对集中,光截获量大多集中于冠层顶部,中下部由于枝条叶片的遮挡,截获光照较少。修剪后,果树矮化,枝条分布松散均匀,尤其冠层中下部枝条叶片遮挡较少,整体叶面积较自然生长树型增加16.3%,中下部光截获系数高于自然生长树型。修剪管理使得晚稻杨梅的叶片光截获能力提高15.8%。可用于定量分析不同修剪方案形成的树型结构对果树冠层光分布和光截获量的影响,为杨梅果树整形修剪装备智能化决策提供数据参考。 展开更多
关键词 晚稻杨梅 多视角图像 三维重建 冠层结构 光分布 辐射模型
在线阅读 下载PDF
基于显著性特征的多视角动作图像识别研究
15
作者 惠向晖 孙艳红 沈小乐 《现代电子技术》 北大核心 2025年第13期62-65,共4页
文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体... 文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体运动特征图;构建CNN+CA模型,将处理后的多视角动作视频帧生成感兴趣区域(ROI)拼接图,再将其输入到CNN中,提取多视角融合特征,并在CA模块中突出那些对于动作图像识别最为关键的区域;通过序列匹配算法将多视角动作识别问题转化为预测标签序列的匹配问题,为待识别动作图像分配动作类别标签,实现准确的多视角动作图像识别。实验结果表明:该方法不仅能够有效处理来自不同视角的动作图像,还能够准确识别出篮球运动员的多种动作。 展开更多
关键词 显著性特征 多视角动作图像 运动特征图 ROI拼接图 CNN CA模块 LSTM 序列匹配算法
在线阅读 下载PDF
融合局部和全局特征的深度多视图聚类网络
16
作者 李顺勇 李嘉茗 +1 位作者 曹付元 郑孟蛟 《计算机科学与探索》 北大核心 2025年第8期2085-2098,共14页
多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多... 多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多视图深度聚类方法,通过深度神经网络或对比学习增强了表征能力,但大多只关注局部或全局特征,未能在同一框架下对这两类特征进行综合处理。针对这些不足,提出了一种融合卷积神经网络与Transformer的深度多视图聚类模型(DMVCN-ILGF)。该模型设计了并行的卷积分支和Transformer分支,分别用于提取局部特征和全局特征。为了实现特征的有效融合,引入了特征交互机制(FIM)和特征融合模块(FFM),通过充分整合各视图的特征信息,以增强不同特征的交互和融合,最终提升聚类性能。进一步地,还设计了实例级和类别级对比损失,分别计算各视图的局部与全局特征之间的相似性,从而优化模型的表征能力和聚类效果。实验结果表明,提出的DMVCN-ILGF模型在多个多视图数据集上均取得了显著优于现有方法的聚类性能。 展开更多
关键词 多视图聚类 卷积神经网络 TRANSFORMER 特征融合
在线阅读 下载PDF
基于二部图和一致图学习的多视图聚类算法
17
作者 李顺勇 刘坤 +1 位作者 曹利娜 赵兴旺 《计算机应用》 北大核心 2025年第11期3583-3592,共10页
目前大多数多视图聚类算法存在融合机制不够完善、对多视图协同关系挖掘不足以及鲁棒性较弱等问题,导致聚类结果一致性偏低,且在噪声和冗余信息下的性能不够稳健。针对上述问题,提出一种基于二部图和一致图学习的多视图聚类算法(BGC-MV... 目前大多数多视图聚类算法存在融合机制不够完善、对多视图协同关系挖掘不足以及鲁棒性较弱等问题,导致聚类结果一致性偏低,且在噪声和冗余信息下的性能不够稳健。针对上述问题,提出一种基于二部图和一致图学习的多视图聚类算法(BGC-MVC),旨在通过融合各视图信息来提升聚类的一致性和互补性。该算法通过构造二部图以捕获不同视图之间的邻域关系,并通过学习一致性图强化视图间的相似性。它将原始多视图数据的嵌入整合进一个统一的框架中,结合了图学习与聚类过程,从而能提高聚类的整体效果。实验结果表明,BGC-MVC在满足收敛性条件下的准确度、F-score、归一化互信息(NMI)和纯度均有明显的提升。其中,在MSRC_v1数据集上的F-score比LMVSC(Large-scale Multi-View Subspace Clustering)算法提高了19.48个百分点,并且表现出更强的鲁棒性与准确度。 展开更多
关键词 多视图聚类 二部图 一致图 图融合 嵌入学习
在线阅读 下载PDF
考虑视图可信度的用户多模态意图识别方法
18
作者 杨颖 杨艳秋 余本功 《电子与信息学报》 北大核心 2025年第6期1966-1975,共10页
在人机交互的闲聊型对话中,准确理解用户多模态意图有助于机器为用户提供智能高效的聊天服务。当前的用户多模态意图识别方法面临着跨模态信息交互性与模型不确定性的挑战。该文提出一种基于Transformer的可信多模态意图识别方法。考虑... 在人机交互的闲聊型对话中,准确理解用户多模态意图有助于机器为用户提供智能高效的聊天服务。当前的用户多模态意图识别方法面临着跨模态信息交互性与模型不确定性的挑战。该文提出一种基于Transformer的可信多模态意图识别方法。考虑用户意图表达时的文本、视频和音频等数据的异质性,通过模块特定编码模块,生成单模态特征视图;为了捕捉跨模态间的互补性和长距离依赖性,通过跨模态交互模块,生成跨模态特征视图;为了降低模型的不确定性,设计一个多视图可信融合模块,考虑每个视图的可信度进行主观意见的动态融合,基于主观意见的Dirichlet分布,设计一种组合优化策略进行模型训练。最后在多模态意图识别数据集MIntRec上进行实验。实验结果表明,与基线模型相比,该文方法在准确率和召回率上分别提升了1.73%和1.1%。该方法不仅能够提升多模态意图识别的效果,而且能够对每个视图预测结果的可信度进行度量,提高模型的可解释性。 展开更多
关键词 意图识别 多模态融合 多视图学习
在线阅读 下载PDF
基于多目近红外视觉的多目标实时跟踪方法
19
作者 陈忠 王傲辰 +2 位作者 高心怡 何利辉 张宪民 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期31-38,共8页
近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成... 近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成像特性,利用灰度质心法提取各个反光标记球的几何中心,然后在各单目相机中使用SORT算法作为多目标跟踪方法对各个标记点进行帧间匹配,并根据对极几何原理,结合带权二分图匹配方法确定反光标记球在各个相机中像点的匹配关系,依据三角测量方法实时计算各个受跟踪反光标记球的三维空间坐标;其次,根据运动过程中各反光标记球之间的空间位置关系对反光标记球进行分组,识别属于同一物体的反光标记球,并根据同组反光标记球间的欧氏距离建立被跟踪物体与反光标记球的外观特征向量,以此作为物体丢失重现的匹配依据,而完全丢失后再重现的被跟踪物体利用外观特征向量的余弦距离进行重匹配;最后,对所提方法进行实验验证。实验结果表明:所提方法在不小于60 f/s的帧率下的跟踪精度约可达0.5 mm;另外,其可以对丢失的重现物体以及反光标记球进行正确的重匹配。 展开更多
关键词 多目视觉 近红外光学跟踪 立体匹配 反光标记球
在线阅读 下载PDF
基于中心锚困难三元组损失和多视图特征融合的三维模型分类
20
作者 高雪瑶 张澐凯 张春祥 《电子与信息学报》 北大核心 2025年第6期1937-1949,共13页
多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入... 多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入,利用深度残差收缩网络(DRSN)提取视图特征并融合2维形状分布特征D1,D2和D3得到视图融合特征;其次,根据3维模型视图融合特征,通过香农熵来衡量视图分类的不确定性,并将3维模型的多视图按视图显著性由高到低排序;然后,搭建基于注意力-长短期记忆网络(Att-LSTM)的3元组多视图特征融合网络,利用LSTM学习多视图之间的上下文信息,并融入多头注意力机制充分捕捉多视图间的相关信息;最后,引入度量学习并提出了一种新颖的中心锚困难3元组损失(CAH Triplet Loss),并联合交叉熵损失(CE Loss)来优化多视图特征融合网络,减小同类样本、增大异类样本在特征空间上的距离,加强网络对3维模型区分性特征的学习。实验表明:该方法在3维模型数据集ModelNet10上的分类准确率达到93.83%,分类性能突出。 展开更多
关键词 3维模型分类 多视图特征融合 注意力机制 3元组损失
在线阅读 下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部