期刊文献+
共找到1,413篇文章
< 1 2 71 >
每页显示 20 50 100
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
1
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
Disparity estimation for multi-scale multi-sensor fusion
2
作者 SUN Guoliang PEI Shanshan +2 位作者 LONG Qian ZHENG Sifa YANG Rui 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第2期259-274,共16页
The perception module of advanced driver assistance systems plays a vital role.Perception schemes often use a single sensor for data processing and environmental perception or adopt the information processing results ... The perception module of advanced driver assistance systems plays a vital role.Perception schemes often use a single sensor for data processing and environmental perception or adopt the information processing results of various sensors for the fusion of the detection layer.This paper proposes a multi-scale and multi-sensor data fusion strategy in the front end of perception and accomplishes a multi-sensor function disparity map generation scheme.A binocular stereo vision sensor composed of two cameras and a light deterction and ranging(LiDAR)sensor is used to jointly perceive the environment,and a multi-scale fusion scheme is employed to improve the accuracy of the disparity map.This solution not only has the advantages of dense perception of binocular stereo vision sensors but also considers the perception accuracy of LiDAR sensors.Experiments demonstrate that the multi-scale multi-sensor scheme proposed in this paper significantly improves disparity map estimation. 展开更多
关键词 stereo vision light deterction and ranging(LiDAR) multi-sensor fusion multi-scale fusion disparity map
在线阅读 下载PDF
Ship recognition based on HRRP via multi-scale sparse preserving method
3
作者 YANG Xueling ZHANG Gong SONG Hu 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期599-608,共10页
In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) ba... In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) based on the maximum margin criterion(MMC) is proposed for recognizing the class of ship targets utilizing the high-resolution range profile(HRRP). Multi-scale fusion is introduced to capture the local and detailed information in small-scale features, and the global and contour information in large-scale features, offering help to extract the edge information from sea clutter and further improving the target recognition accuracy. The proposed method can maximally preserve the multi-scale fusion sparse of data and maximize the class separability in the reduced dimensionality by reproducing kernel Hilbert space. Experimental results on the measured radar data show that the proposed method can effectively extract the features of ship target from sea clutter, further reduce the feature dimensionality, and improve target recognition performance. 展开更多
关键词 ship target recognition high-resolution range profile(HRRP) multi-scale fusion kernel sparse preserving projection(MSFKSPP) feature extraction dimensionality reduction
在线阅读 下载PDF
A multi-source image fusion algorithm based on gradient regularized convolution sparse representation
4
作者 WANG Jian QIN Chunxia +2 位作者 ZHANG Xiufei YANG Ke REN Ping 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第3期447-459,共13页
Image fusion based on the sparse representation(SR)has become the primary research direction of the transform domain method.However,the SR-based image fusion algorithm has the characteristics of high computational com... Image fusion based on the sparse representation(SR)has become the primary research direction of the transform domain method.However,the SR-based image fusion algorithm has the characteristics of high computational complexity and neglecting the local features of an image,resulting in limited image detail retention and a high registration misalignment sensitivity.In order to overcome these shortcomings and the noise existing in the image of the fusion process,this paper proposes a new signal decomposition model,namely the multi-source image fusion algorithm of the gradient regularization convolution SR(CSR).The main innovation of this work is using the sparse optimization function to perform two-scale decomposition of the source image to obtain high-frequency components and low-frequency components.The sparse coefficient is obtained by the gradient regularization CSR model,and the sparse coefficient is taken as the maximum value to get the optimal high frequency component of the fused image.The best low frequency component is obtained by using the fusion strategy of the extreme or the average value.The final fused image is obtained by adding two optimal components.Experimental results demonstrate that this method greatly improves the ability to maintain image details and reduces image registration sensitivity. 展开更多
关键词 gradient regularization convolution sparse representation(CSR) image fusion
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
5
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection Feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
A multi-source information fusion layer counting method for penetration fuze based on TCN-LSTM 被引量:1
6
作者 Yili Wang Changsheng Li Xiaofeng Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第3期463-474,共12页
When employing penetration ammunition to strike multi-story buildings,the detection methods using acceleration sensors suffer from signal aliasing,while magnetic detection methods are susceptible to interference from ... When employing penetration ammunition to strike multi-story buildings,the detection methods using acceleration sensors suffer from signal aliasing,while magnetic detection methods are susceptible to interference from ferromagnetic materials,thereby posing challenges in accurately determining the number of layers.To address this issue,this research proposes a layer counting method for penetration fuze that incorporates multi-source information fusion,utilizing both the temporal convolutional network(TCN)and the long short-term memory(LSTM)recurrent network.By leveraging the strengths of these two network structures,the method extracts temporal and high-dimensional features from the multi-source physical field during the penetration process,establishing a relationship between the multi-source physical field and the distance between the fuze and the target plate.A simulation model is developed to simulate the overload and magnetic field of a projectile penetrating multiple layers of target plates,capturing the multi-source physical field signals and their patterns during the penetration process.The analysis reveals that the proposed multi-source fusion layer counting method reduces errors by 60% and 50% compared to single overload layer counting and single magnetic anomaly signal layer counting,respectively.The model's predictive performance is evaluated under various operating conditions,including different ratios of added noise to random sample positions,penetration speeds,and spacing between target plates.The maximum errors in fuze penetration time predicted by the three modes are 0.08 ms,0.12 ms,and 0.16 ms,respectively,confirming the robustness of the proposed model.Moreover,the model's predictions indicate that the fitting degree for large interlayer spacings is superior to that for small interlayer spacings due to the influence of stress waves. 展开更多
关键词 Penetration fuze Temporal convolutional network(TCN) Long short-term memory(LSTM) Layer counting Multi-source fusion
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
7
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 TRANSFORMER 注意力模块 梯度融合
在线阅读 下载PDF
卷积自编码器和残差循环神经网络在刀具剩余寿命预测中的应用 被引量:1
8
作者 周学良 潘晓明 吴瑶 《机械科学与技术》 北大核心 2025年第5期806-813,共8页
针对刀具剩余寿命预测问题,提出了一种将一维卷积自编码器(One-dimensional convolutional auto encoder,1DCAE)和残差双向门控循环单元(Residual bidirectional gated recurrent unit,RBGRU)相结合的预测方法。通过1DCAE连续卷积池化... 针对刀具剩余寿命预测问题,提出了一种将一维卷积自编码器(One-dimensional convolutional auto encoder,1DCAE)和残差双向门控循环单元(Residual bidirectional gated recurrent unit,RBGRU)相结合的预测方法。通过1DCAE连续卷积池化和反卷积上采样方法获取工况信号的深层特征,并将其与分段后的原始信号融合后作为刀具剩余寿命的表征;同时结合残差网络的思想对双向门控循环单元(Bidirectional gated recurrent unit,BiGRU)的结构进行改进以增强对时序特征的捕获能力。实验结果表明,该方法比其他算法具有更高的预测精度。 展开更多
关键词 刀具 剩余寿命预测 卷积自编码器 残差门控循环单元 特征融合
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测 被引量:2
9
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
基于复合域多尺度分解的红外偏振图像融合方法 被引量:1
10
作者 陈广秋 魏洲 +1 位作者 段锦 黄丹丹 《吉林大学学报(理学版)》 北大核心 2025年第2期479-491,共13页
针对目前红外偏振融合图像质量差、偏振信息缺失、目标纹理细节不够等问题,提出一种基于复合域多尺度分解的红外偏振图像融合方法.首先,在空间域内利用引导滤波器对源图像进行二尺度分解,得到细节层和基础层,在频域内利用非下采样剪切... 针对目前红外偏振融合图像质量差、偏振信息缺失、目标纹理细节不够等问题,提出一种基于复合域多尺度分解的红外偏振图像融合方法.首先,在空间域内利用引导滤波器对源图像进行二尺度分解,得到细节层和基础层,在频域内利用非下采样剪切波变换对基础层图像进行多尺度多方向分解,得到低频子带图像和高频子带图像;其次,对高频子带采用主成分分析-自适应脉冲耦合神经网络融合规则,对低频子带采用改进的卷积稀疏表示进行系数合并,细节层融合采用基于像素相似度的局部能量加权和选择性融合规则;最后,在复合域内利用逆变换重构出融合图像.实验结果表明,该方法在主观视觉性能和8个客观评价指标上均优于其他对比融合方法,说明该方法在红外偏振图像融合中具有较多优势,能有效提高融合图像的质量. 展开更多
关键词 红外偏振图像融合 非下采样剪切波变换 自适应脉冲耦合神经网络 卷积稀疏表示
在线阅读 下载PDF
基于多尺度卷积自编码器的船舶逆变器故障诊断 被引量:1
11
作者 崔博文 张思远 《舰船科学技术》 北大核心 2025年第3期135-140,共6页
为实现对船舶逆变器的有效维护,确保船舶逆变器模块的正常运行,提出一种基于多尺度特征融合和降噪卷积自编码器的船舶逆变器开路故障诊断方法。可以直接对一维原始电流数据自适应地提取数据特征,降低信号内的噪声,实现端到端的故障诊断... 为实现对船舶逆变器的有效维护,确保船舶逆变器模块的正常运行,提出一种基于多尺度特征融合和降噪卷积自编码器的船舶逆变器开路故障诊断方法。可以直接对一维原始电流数据自适应地提取数据特征,降低信号内的噪声,实现端到端的故障诊断。首先,利用数据增强方法来增强数据集;其次,根据数据特点设计可以提取局部细节和整体结构信息的多尺度卷积特征融合模块,并在编码器中引入该模块,形成特征提取模型;最后,利用全连接神经网络对模型输出的数据特征进行分类,根据分类结果实现故障诊断。实验结果表明,所提出的方法具有优越的数据特征提取性能及噪声鲁棒性能,可以实现船舶逆变器开关器件开路故障诊断。 展开更多
关键词 船舶逆变器 故障诊断 多尺度特征融合 卷积自编码器
在线阅读 下载PDF
基于融合卷积Transformer的航空发动机故障诊断 被引量:1
12
作者 赵洪利 杨佳强 《北京航空航天大学学报》 北大核心 2025年第4期1117-1126,共10页
航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊... 航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊断方法。利用自注意力机制提取有用特征,抑制冗余信息,并将最大池化层引入Transformer模型中,进一步降低模型内存消耗及参数量,缓解过拟合现象。采用基于GasTurb建模的涡扇发动机仿真数据集进行验证,结果与Transformer模型和反向传播(BP)神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等传统深度学习模型相比,准确率分别提高了6.552%和28.117%、13.189%、10.29%,证明了所提方法的有效性,可为航空发动机故障诊断提供一定的参考。 展开更多
关键词 航空发动机 故障诊断 自注意力机制 融合卷积Transformer 深度神经网络
在线阅读 下载PDF
基于ASFF-AAKR和CNN-BILSTM滚动轴承寿命预测 被引量:1
13
作者 张永超 刘嵩寿 +2 位作者 陈昱锡 杨海昆 陈庆光 《科学技术与工程》 北大核心 2025年第2期567-573,共7页
针对滚动轴承寿命预测精度低,构建健康指标困难的问题。提出了一种基于自适应特征融合(adaptively spatial feature fusion,ASFF)和自联想核回归模型(auto associative kernel regression,AAKR)与卷积神经网络(convolutional neural net... 针对滚动轴承寿命预测精度低,构建健康指标困难的问题。提出了一种基于自适应特征融合(adaptively spatial feature fusion,ASFF)和自联想核回归模型(auto associative kernel regression,AAKR)与卷积神经网络(convolutional neural networks,CNN)和双向长短期记忆网络(bi-directional long-short term memory,BILSTM)的轴承剩余寿命预测模型。首先,在时域、频域和时频域提取多维特征,利用单调性和趋势性筛选敏感特征;其次利用ASFF-AAKR对敏感特征进行特征融合构建健康指标;最后,将健康指标输入到CNN和BILSTM中,实现对滚动轴承的寿命预测。结果表明:所构建的寿命预测模型优于其他模型,该方法具有更低的误差、寿命预测精度更高。 展开更多
关键词 滚动轴承 自适应特征融合 自联想核回归 卷积神经网络 双向长短期记忆网络 剩余寿命预测
在线阅读 下载PDF
基于改进CenterNet算法的番茄叶片病害检测
14
作者 李亚 蒋晨 +2 位作者 王海瑞 朱贵富 胡灿 《浙江大学学报(工学版)》 北大核心 2025年第11期2370-2378,共9页
为了解决在传统番茄叶片病害检测中出现的误检和漏检现象,提出基于改进CenterNet算法的番茄叶片病害检测模型.构建融合注意力机制的特征融合模块,增强模型的跨尺度特征融合能力.在骨干网络中加入多分支卷积模块RFB,扩大感受野,加强对目... 为了解决在传统番茄叶片病害检测中出现的误检和漏检现象,提出基于改进CenterNet算法的番茄叶片病害检测模型.构建融合注意力机制的特征融合模块,增强模型的跨尺度特征融合能力.在骨干网络中加入多分支卷积模块RFB,扩大感受野,加强对目标特征的提取能力.在骨干网络中引入金字塔卷积PyConv,通过计算不同尺度的感受野来强化多尺度特征的提取,减少信息损失.设计剪枝优化策略,减少引入模块给模型参数量和计算量带来的影响.试验结果显示,改进后模型的准确率、召回率、mAP_(50)和mAP_(50:95)达到96.3%、80.2%、91.4%和78.7%.利用提出的模型,能够有效地提升番茄叶片病害检测的准确性,模型具有良好的泛化性. 展开更多
关键词 番茄叶片病害 CenterNet 特征融合 金字塔卷积 多分支卷积
在线阅读 下载PDF
基于词嵌入和特征融合的恶意软件检测研究 被引量:1
15
作者 师智斌 孙文琦 +1 位作者 窦建民 于孟洋 《信息安全研究》 北大核心 2025年第5期412-419,共8页
针对现有传统方法存在特征提取和表示受限、无法同时捕获API序列的空间语义特征和时序特征、无法捕获能决定目标任务的关键特征信息等问题,利用自然语言处理领域的词嵌入技术和多模型特征抽取以及特征融合技术,提出一种基于词嵌入和特... 针对现有传统方法存在特征提取和表示受限、无法同时捕获API序列的空间语义特征和时序特征、无法捕获能决定目标任务的关键特征信息等问题,利用自然语言处理领域的词嵌入技术和多模型特征抽取以及特征融合技术,提出一种基于词嵌入和特征融合的恶意软件检测方法.首先使用自然语言处理领域的词嵌入技术对API序列编码,得到其语义特征编码表示;然后分别利用多重卷积网络和Bi-LSTM网络提取API序列的n-gram局部空间特征和时序特征;最后利用自注意力机制对捕获的特征进行关键位置信息的深度融合,通过刻画深层恶意行为特征实现分类任务.实验结果表明,在二分类任务中,该方法准确率达到94.79%,相较于传统机器学习方法平均提高了12.37%,比深度学习方法平均提高5.78%.在多分类任务中,该方法的准确率也达到91.95%,能够有效地提高对恶意软件的检测准确率. 展开更多
关键词 恶意软件检测 软件调用序列 多重卷积网络 长短期记忆网络 特征融合
在线阅读 下载PDF
高频信息物体多层多元特征权重自适应融合三维重建网络
16
作者 王标 李影 +3 位作者 融百川 刘璟 张进 王永红 《光学精密工程》 北大核心 2025年第15期2424-2440,共17页
为解决光度立体深度学习在实现物体表面法向量重建过程中存在的表面纹理的高频信息丢失而导致重建精度偏差大的问题,提出了一种多层多元特征权重自适应融合三维重建网络(MMF-Net)。网络主要将PS-FCN作为基准模型,引入对称式编码-解码结... 为解决光度立体深度学习在实现物体表面法向量重建过程中存在的表面纹理的高频信息丢失而导致重建精度偏差大的问题,提出了一种多层多元特征权重自适应融合三维重建网络(MMF-Net)。网络主要将PS-FCN作为基准模型,引入对称式编码-解码结构,增强网络的学习和特征表达能力,提升了不同层级之间特征整合能力;设计独立层间权重自适应调节的多元卷积层,通过增加额外的可训练权重,兼顾具有形状信息与纹理信息,并且能够更好地捕捉到表面纹理的细节变化信息,使得该网络在高频信息较密集场景下的表现更加稳定和准确;辅助增加跳跃连接结构,通过中间层特征跨层连接至后续层级,保留物体高频信息且强化低频信息,以实现物体高低频特征信息的融合性应用。利用DiLiGenT基准数据集进行了相关测试,实验结果表明,MMF-Net能够实现平均MAE达到6.94°,对比PS-FCN(Norm)的7.39°提升了6%,在其中两幅含有高频信息物体的平均重建误差为11.03°,对比先前方法FUPS-Net的12.52°提升了12%。MMF-Net实现了光度立体物体表面低频信息和高频信息的有效性获取,为以物体表面法向量为基础的三维高精度重建提供参考。 展开更多
关键词 深度学习 光度立体视觉 多元卷积 特征融合 自适应权重
在线阅读 下载PDF
融合局部和全局特征的深度多视图聚类网络
17
作者 李顺勇 李嘉茗 +1 位作者 曹付元 郑孟蛟 《计算机科学与探索》 北大核心 2025年第8期2085-2098,共14页
多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多... 多视图聚类是当前数据分析领域的一个重要研究方向,旨在通过整合来自不同视角的数据,提升聚类精度。然而,传统的多视图聚类方法虽然在一定程度上提高了聚类效果,但往往忽略了视图间局部与全局特征的交互与融合。此外,尽管近年提出的多视图深度聚类方法,通过深度神经网络或对比学习增强了表征能力,但大多只关注局部或全局特征,未能在同一框架下对这两类特征进行综合处理。针对这些不足,提出了一种融合卷积神经网络与Transformer的深度多视图聚类模型(DMVCN-ILGF)。该模型设计了并行的卷积分支和Transformer分支,分别用于提取局部特征和全局特征。为了实现特征的有效融合,引入了特征交互机制(FIM)和特征融合模块(FFM),通过充分整合各视图的特征信息,以增强不同特征的交互和融合,最终提升聚类性能。进一步地,还设计了实例级和类别级对比损失,分别计算各视图的局部与全局特征之间的相似性,从而优化模型的表征能力和聚类效果。实验结果表明,提出的DMVCN-ILGF模型在多个多视图数据集上均取得了显著优于现有方法的聚类性能。 展开更多
关键词 多视图聚类 卷积神经网络 TRANSFORMER 特征融合
在线阅读 下载PDF
基于立体感感知的全景图像质量评价算法
18
作者 安平 汤旭锋 +1 位作者 杨超 黄新彭 《信号处理》 北大核心 2025年第4期759-769,共11页
无参考全景图像质量评价旨在客观衡量全景图像的人类视觉感知质量,而无需依赖原始图像的质量信息。随着虚拟现实技术的迅猛发展,全景图像质量评价的重要性日益凸显。然而,现有全景图像质量评价算法仍存在着一些限制,如不能很好模拟观察... 无参考全景图像质量评价旨在客观衡量全景图像的人类视觉感知质量,而无需依赖原始图像的质量信息。随着虚拟现实技术的迅猛发展,全景图像质量评价的重要性日益凸显。然而,现有全景图像质量评价算法仍存在着一些限制,如不能很好模拟观察者的浏览过程、未能有效考虑观看者的立体感知过程等。这严重影响了全景图像质量评价的准确性。为解决这一问题,本文提出一种基于沉浸式立体感知和视口感知交互的无参考全景图像质量评价算法。首先,设计一种视口提取策略,通过在球形域上提取特征视点,选择具有较高被观察概率的视点。对选定的视点提取相应的视口内容,并将多个视口内容并行输入特征编码器,以实现多尺度视口特征的提取。随后,鉴于当前实现多个视口间信息交互的方式尚存在局限性,本文提出一个视口特征交互模块,旨在实现对输入的多个视口内容进行跨视口的信息交互。最后,本文还探索了在缺乏视口采样的情况下,利用整个全景图像实现对立体感信息的获取,以实现对立体感过程建模从而提高整体评价性能。实验结果证明了本文提出算法的有效性,与当前最先进的质量评价算法相比之下,斯皮尔曼等级相关系数(Spearman Rank Order Correlation Coefficient,SROCC)指标和皮尔逊线性相关系数(Linear Pearson Correlation Coefficient,PLCC)在公开数据集CVIQD上分别达到0.72%和0.70%的提升,而在数据集OIQA上分别达到了1.10%和0.54%的提升。 展开更多
关键词 全景图像质量评价 视口提取 球面卷积 特征融合
在线阅读 下载PDF
WiLCount:一种适用于无线感知场景的轻量级人数识别模型
19
作者 段鹏松 张伊航 +2 位作者 方焘 曹仰杰 王超 《计算机科学》 北大核心 2025年第10期317-327,共11页
针对CSI中空间特征缺失导致人数识别模型精度有限且计算复杂度较高的问题,提出了一种基于幅相融合的轻量级人数识别模型WiLCount。首先,针对原始相位信息中存在载波频率偏移和采样频率偏移而无法直接使用的问题,使用线性变换方法对相位... 针对CSI中空间特征缺失导致人数识别模型精度有限且计算复杂度较高的问题,提出了一种基于幅相融合的轻量级人数识别模型WiLCount。首先,针对原始相位信息中存在载波频率偏移和采样频率偏移而无法直接使用的问题,使用线性变换方法对相位信息进行校准;其次,将幅相数据重构为二维图像,以充分利用CSI信息中蕴含的人数空间映射特征;最后,融合深度可分离卷积与多分支结构技术,设计了一种轻量级的人数识别模型WiLCount。目前,在Wi-Fi感知人数领域暂无公开数据集,为此精心构建了一个在人数规模、行为种类均处于业界领先水平的自采数据集,并已公开。实验结果表明,WiLCount在自采数据集上的识别准确率高达99.58%,参数规模仅为同类模型的4%,相比现有方法有显著提升,且具有较好的鲁棒性。 展开更多
关键词 Wi-Fi感知 信道状态信息 人数识别 幅相融合 深度可分离卷积
在线阅读 下载PDF
基于异构数据的患者术后非计划内再入院预测
20
作者 俞凯 董小锋 +2 位作者 袁贞明 崔朝健 罗伟斌 《工程科学与技术》 北大核心 2025年第1期89-97,共9页
非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标。目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数... 非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标。目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数据。前者未能充分利用电子病历中丰富的数据与信息,后者则未能更好地融合异构数据的信息。基于上述问题,本文提出了一种基于CTFN异构数据融合方法,结合患者出院小结文本与住院期间产生的横断面数据预测患者再入院风险。预测模型的构建分为3个步骤。首先,利用RoBerta模型提取患者出院小结中的特征信息并得到表征矩阵;其次,使用CNN模型学习患者横断面特征信息,得到表征矩阵;最后,通过CTFN方法融合两个表征矩阵,得到异构数据的表征矩阵并通过线性层分类器得到最后的预测结果。CTFN融合方法利用张量外积融合多个单模态表征矩阵,并增加CNN模型及残差结构设计加强异构数据模态内与模态间的信息学习。根据某公立医院的临床数据对上述方法进行验证,实验结果表明其表现出色,其中,召回率达到了76.1%,ROC曲线下面积达到了71.5%,均高于所对比的基线模型。证实了异构数据能提升分类器预测效果,且CTFN融合方法能够更好地融合异构数据间的信息,进一步提升分类器预测效果。 展开更多
关键词 异构数据 深度学习 张量融合 再入院 卷积网络 残差结构
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部