期刊文献+
共找到1,403篇文章
< 1 2 71 >
每页显示 20 50 100
Tri-party deep network representation learning using inductive matrix completion 被引量:4
1
作者 YE Zhong-lin ZHAO Hai-xing +2 位作者 ZHANG Ke ZHU Yu XIAO Yu-zhi 《Journal of Central South University》 SCIE EI CAS CSCD 2019年第10期2746-2758,共13页
Most existing network representation learning algorithms focus on network structures for learning.However,network structure is only one kind of view and feature for various networks,and it cannot fully reflect all cha... Most existing network representation learning algorithms focus on network structures for learning.However,network structure is only one kind of view and feature for various networks,and it cannot fully reflect all characteristics of networks.In fact,network vertices usually contain rich text information,which can be well utilized to learn text-enhanced network representations.Meanwhile,Matrix-Forest Index(MFI)has shown its high effectiveness and stability in link prediction tasks compared with other algorithms of link prediction.Both MFI and Inductive Matrix Completion(IMC)are not well applied with algorithmic frameworks of typical representation learning methods.Therefore,we proposed a novel semi-supervised algorithm,tri-party deep network representation learning using inductive matrix completion(TDNR).Based on inductive matrix completion algorithm,TDNR incorporates text features,the link certainty degrees of existing edges and the future link probabilities of non-existing edges into network representations.The experimental results demonstrated that TFNR outperforms other baselines on three real-world datasets.The visualizations of TDNR show that proposed algorithm is more discriminative than other unsupervised approaches. 展开更多
关键词 network representation network embedding representation learning matrix-forestindex inductive matrix completion
在线阅读 下载PDF
Fast image super-resolution algorithm based on multi-resolution dictionary learning and sparse representation 被引量:3
2
作者 ZHAO Wei BIAN Xiaofeng +2 位作者 HUANG Fang WANG Jun ABIDI Mongi A. 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第3期471-482,共12页
Sparse representation has attracted extensive attention and performed well on image super-resolution(SR) in the last decade. However, many current image SR methods face the contradiction of detail recovery and artif... Sparse representation has attracted extensive attention and performed well on image super-resolution(SR) in the last decade. However, many current image SR methods face the contradiction of detail recovery and artifact suppression. We propose a multi-resolution dictionary learning(MRDL) model to solve this contradiction, and give a fast single image SR method based on the MRDL model. To obtain the MRDL model, we first extract multi-scale patches by using our proposed adaptive patch partition method(APPM). The APPM divides images into patches of different sizes according to their detail richness. Then, the multiresolution dictionary pairs, which contain structural primitives of various resolutions, can be trained from these multi-scale patches.Owing to the MRDL strategy, our SR algorithm not only recovers details well, with less jag and noise, but also significantly improves the computational efficiency. Experimental results validate that our algorithm performs better than other SR methods in evaluation metrics and visual perception. 展开更多
关键词 single image super-resolution(SR) sparse representation multi-resolution dictionary learning(MRDL) adaptive patch partition method(APPM)
在线阅读 下载PDF
Deep plug-and-play self-supervised neural networks for spectral snapshot compressive imaging
3
作者 ZHANG Xing-Yu ZHU Shou-Zheng +4 位作者 ZHOU Tian-Shu QI Hong-Xing WANG Jian-Yu LI Chun-Lai LIU Shi-Jie 《红外与毫米波学报》 CSCD 北大核心 2024年第6期846-857,共12页
The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it int... The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it into three-dimensional spectral data through deep neural networks.However,training the deep neural net⁃works requires a large amount of clean data that is difficult to obtain.To address the problem of insufficient training data for deep neural networks,a self-supervised hyperspectral denoising neural network based on neighbor⁃hood sampling is proposed.This network is integrated into a deep plug-and-play framework to achieve self-supervised spectral reconstruction.The study also examines the impact of different noise degradation models on the fi⁃nal reconstruction quality.Experimental results demonstrate that the self-supervised learning method enhances the average peak signal-to-noise ratio by 1.18 dB and improves the structural similarity by 0.009 compared with the supervised learning method.Additionally,it achieves better visual reconstruction results. 展开更多
关键词 compressed sensing deep learning self-supervised coded aperture imaging
在线阅读 下载PDF
Pre-detection and dual-dictionary sparse representation based face recognition algorithm in non-sufficient training samples 被引量:2
4
作者 ZHAO Jian ZHANG Chao +3 位作者 ZHANG Shunli LU Tingting SU Weiwen JIA Jian 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第1期196-202,共7页
Face recognition based on few training samples is a challenging task. In daily applications, sufficient training samples may not be obtained and most of the gained training samples are in various illuminations and pos... Face recognition based on few training samples is a challenging task. In daily applications, sufficient training samples may not be obtained and most of the gained training samples are in various illuminations and poses. Non-sufficient training samples could not effectively express various facial conditions, so the improvement of the face recognition rate under the non-sufficient training samples condition becomes a laborious mission. In our work, the facial pose pre-recognition(FPPR) model and the dualdictionary sparse representation classification(DD-SRC) are proposed for face recognition. The FPPR model is based on the facial geometric characteristic and machine learning, dividing a testing sample into full-face and profile. Different poses in a single dictionary are influenced by each other, which leads to a low face recognition rate. The DD-SRC contains two dictionaries, full-face dictionary and profile dictionary, and is able to reduce the interference. After FPPR, the sample is processed by the DD-SRC to find the most similar one in training samples. The experimental results show the performance of the proposed algorithm on olivetti research laboratory(ORL) and face recognition technology(FERET) databases, and also reflect comparisons with SRC, linear regression classification(LRC), and two-phase test sample sparse representation(TPTSSR). 展开更多
关键词 face recognition facial pose pre-recognition(FPPR) dual-dictionary sparse representation method machine learning
在线阅读 下载PDF
Learning a discriminative high-fidelity dictionary for single channel source separation 被引量:1
5
作者 TIAN Yuanrong WANG Xing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2021年第5期1097-1110,共14页
Sparse-representation-based single-channel source separation,which aims to recover each source’s signal using its corresponding sub-dictionary,has attracted many scholars’attention.The basic premise of this model is... Sparse-representation-based single-channel source separation,which aims to recover each source’s signal using its corresponding sub-dictionary,has attracted many scholars’attention.The basic premise of this model is that each sub-dictionary possesses discriminative information about its corresponding source,and this information can be used to recover almost every sample from that source.However,in a more general sense,the samples from a source are composed not only of discriminative information but also common information shared with other sources.This paper proposes learning a discriminative high-fidelity dictionary to improve the separation performance.The innovations are threefold.Firstly,an extra sub-dictionary was combined into a conventional union dictionary to ensure that the source-specific sub-dictionaries can capture only the purely discriminative information for their corresponding sources because the common information is collected in the additional sub-dictionary.Secondly,a task-driven learning algorithm is designed to optimize the new union dictionary and a set of weights that indicate how much of the common information should be allocated to each source.Thirdly,a source separation scheme based on the learned dictionary is presented.Experimental results on a human speech dataset yield evidence that our algorithm can achieve better separation performance than either state-of-the-art or traditional algorithms. 展开更多
关键词 single channel source separation sparse representation dictionary learning DISCRIMINATION high-fidelity
在线阅读 下载PDF
Local sparse representation for astronomical image denoising
6
作者 杨阿锋 鲁敏 +1 位作者 滕书华 孙即祥 《Journal of Central South University》 SCIE EI CAS 2013年第10期2720-2727,共8页
Motivated by local coordinate coding(LCC) theory in nonlinear manifold learning, a new image representation model called local sparse representation(LSR) for astronomical image denoising was proposed. Borrowing ideas ... Motivated by local coordinate coding(LCC) theory in nonlinear manifold learning, a new image representation model called local sparse representation(LSR) for astronomical image denoising was proposed. Borrowing ideas from surrogate function and applying the iterative shrinkage-thresholding algorithm(ISTA), an iterative shrinkage operator for LSR was derived. Meanwhile, a fast approximated LSR method by first performing a K-nearest-neighbor search and then solving a l1optimization problem was presented under the guarantee of denoising performance. In addition, the LSR model and adaptive dictionary learning were incorporated into a unified optimization framework, which explicitly established the inner connection of them. Such processing allows us to simultaneously update sparse coding vectors and the dictionary by alternating optimization method. The experimental results show that the proposed method is superior to the traditional denoising method and reaches state-of-the-art performance on astronomical image. 展开更多
关键词 astronomical image DENOISING LOCAL SPARSE representation(LSR) DICTIONARY learning ALTERNATING optimization
在线阅读 下载PDF
深度学习的多视角三维重建技术综述 被引量:3
7
作者 王文举 唐邦 +1 位作者 顾泽骅 王森 《计算机工程与应用》 北大核心 2025年第6期22-35,共14页
为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几... 为解决经典的多视角三维重建方法难以重建复杂物体、重建效果不佳以及在高分辨率上的扩展等问题,深度学习方法被引入用以重建具有更高精度的三维模型。系统地总结归纳、分析和比较了使用深度学习方法的多视角三维重建算法,并按照显式几何和隐式几何两种几何表示方式对近几年的多视角三维重建算法进行了分类与梳理。重点介绍了目前具有较高重建精度的将隐式函数以及体渲染相结合的神经隐式三维重建算法,并分别定量、定性分析了该类部分算法在数据集上的结果;另外列举了常用数据集和评价指标,并对未来的研究趋势和发展方向进行了展望。 展开更多
关键词 深度学习 三维重建 神经隐式表示 体渲染
在线阅读 下载PDF
基于深度学习的轨迹相似性度量方法研究综述 被引量:1
8
作者 孟祥福 师光启 +2 位作者 张霄雁 冷强奎 方金凤 《计算机科学与探索》 北大核心 2025年第3期623-644,共22页
移动通信和传感设备技术的发展与应用,产生了大量轨迹数据,这些数据呈现出高维异构性、多粒度性和不确定性等特征,这使得传统基于点对匹配的轨迹相似性度量方法难以适用。近年来,研究者将深度学习技术用于轨迹相似性度量,旨在挖掘更多... 移动通信和传感设备技术的发展与应用,产生了大量轨迹数据,这些数据呈现出高维异构性、多粒度性和不确定性等特征,这使得传统基于点对匹配的轨迹相似性度量方法难以适用。近年来,研究者将深度学习技术用于轨迹相似性度量,旨在挖掘更多轨迹特征,提高计算效率,增强模型鲁棒性。对近年来基于深度学习的轨迹相似性度量方法进行系统性综述。阐述轨迹的相关定义;根据相似性度量方法分类框架,从度量表示形式(即序列表示与图表示)和学习策略(即表示学习、度量学习与对比学习)两个角度综述相关方法。从轨迹数据预处理、嵌入表示学习和相似性度量三个方面,对上述方法的实现原理及其特点进行详细对比分析;阐述了基于深度学习的轨迹相似性度量方法的常用数据集和评估指标,并对学习模型的来源、评估指标、时间复杂度和应用场景进行了归纳总结。分析了当前轨迹相似性度量方法所面临的挑战并对未来研究方向进行了展望。 展开更多
关键词 轨迹相似性度量 深度学习 度量表示形式 学习策略
在线阅读 下载PDF
基于驾驶上下文感知的驾驶员识别模型
9
作者 杨林 张磊 +2 位作者 刘佰龙 梁志贞 张雪飞 《计算机工程与科学》 北大核心 2025年第3期548-560,共13页
随着隐私保护意识的提升,利用车辆轨迹识别汽车驾驶员已成为车辆数据分析热点。然而,现有模型难以准确捕捉驾驶风格与驾驶上下文之间的关系,导致识别准确率不高。因此,提出基于驾驶上下文感知的驾驶员识别模型CDIM。CDIM利用轨迹数据计... 随着隐私保护意识的提升,利用车辆轨迹识别汽车驾驶员已成为车辆数据分析热点。然而,现有模型难以准确捕捉驾驶风格与驾驶上下文之间的关系,导致识别准确率不高。因此,提出基于驾驶上下文感知的驾驶员识别模型CDIM。CDIM利用轨迹数据计算车辆运动特征,同时通过路网匹配获取出行路线,并设计基于双向Transformer的路段信息嵌入模块,为出行路线中每一段路段生成融合邻接路段特征的嵌入。然后,通过卷积跨模态注意力融合模块结合路段特征与运动特征,实现二者的高效融合。此外,结合外部因素特征,全面捕捉驾驶上下文对驾驶风格的影响。在公开数据集上的实验结果表明,CDIM的识别准确率为68.54%,相较于RM-Driver与Doufu分别提高了8.14%和4.81%,具有更高的驾驶员识别准确率。 展开更多
关键词 驾驶员识别 表示学习 上下文感知 特征融合
在线阅读 下载PDF
多模态视觉语言表征学习模型及其对抗样本攻防技术综述
10
作者 曾诚 葛云洁 +1 位作者 赵令辰 王骞 《计算机研究与发展》 北大核心 2025年第9期2208-2232,共25页
随着计算机视觉、自然语言处理与深度学习技术的快速发展,多模态视觉语言表征学习模型在图像描述、文本生成图像、视觉问答等任务中展现出了卓越的性能,已成为当前学术界与工业界共同关注的研究热点.然而,这类模型的多模态特性和复杂性... 随着计算机视觉、自然语言处理与深度学习技术的快速发展,多模态视觉语言表征学习模型在图像描述、文本生成图像、视觉问答等任务中展现出了卓越的性能,已成为当前学术界与工业界共同关注的研究热点.然而,这类模型的多模态特性和复杂性为攻击者提供了更加多样的攻击途径,攻击者可以通过对抗样本引导模型输出错误的、有害的或虚假的内容,使该类模型面临的安全威胁日益严峻.系统地梳理了多模态视觉语言模型的研究现状,同时,对近年来出现的针对该类模型的对抗样本攻击方法及其防御策略进行了分类总结,详细归纳了相关研究的基本原理、实施方法与研究结论.在此基础上,对多模态视觉语言表征学习的安全研究现状与未来方向进行了探讨,并展望了视觉语言表征学习技术在未来结合可解释性技术的应用前景. 展开更多
关键词 表征学习 视觉语言学习 对抗性攻击 对抗性防御 网络空间安全
在线阅读 下载PDF
自监督流形结构的第一视角视频时序分割算法
11
作者 张明明 闫小强 +2 位作者 孙中川 胡世哲 叶阳东 《计算机学报》 北大核心 2025年第2期266-283,共18页
随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难... 随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难以有效地处理复杂高维的视频数据。现有时序分割算法在处理第一视角长视频时,很难应对因手部遮挡和运动模糊而导致的帧信息丢失问题。针对上述问题,本文提出了一种自监督流形结构的第一视角视频时序分割算法(Self-Supervised Manifold Structure,SSMS)。受高维视频数据在低维流形空间中具有相似语义聚集现象的启发,该算法将包含时序信息的帧特征进行低维嵌入,使得语义相似的帧特征映射到流形空间中相近位置。首先,本文提出了一种改进的局部流形结构特征学习策略,提取帧数据的局部流形结构。其次,SSMS算法构建了动态时序网络,基于最大相似关系来获得具有不变性的特征表示。然后,将帧数据的流形结构特征作为监督信号进行自监督学习。经过不断迭代优化,得到低维高质量的帧数据特征。最后,通过聚类过程实现第一视角视频的无监督时序分割,避免了标注数据的限制和成本。相比于现有的无监督时序分割算法,本文方法在五个第一视角数据集上平均提高了3.37%的准确度。 展开更多
关键词 第一视角视频 流形结构 自监督学习 时序分割 特征表示
在线阅读 下载PDF
基于细粒度代码表示和特征融合的即时软件缺陷预测方法
12
作者 朱晓燕 王文格 +1 位作者 王嘉寅 张选平 《计算机科学》 北大核心 2025年第1期242-249,共8页
即时软件缺陷预测指在软件更改初次提交之际预测该更改引入缺陷的倾向。此类预测针对单一程序变更,而非在粗粒度上进行。由于其即时性和可追溯性,该技术已在持续测试等领域得到广泛应用。目前的研究中,提取变更代码表示的方法粒度较粗,... 即时软件缺陷预测指在软件更改初次提交之际预测该更改引入缺陷的倾向。此类预测针对单一程序变更,而非在粗粒度上进行。由于其即时性和可追溯性,该技术已在持续测试等领域得到广泛应用。目前的研究中,提取变更代码表示的方法粒度较粗,仅标出了变更行,而没有进行细粒度的标记。此外,现有的使用提交内容进行缺陷预测的方法,仅仅是把提交消息与变更代码的特征进行简单拼接,缺失了在特征空间上的深度对齐,这使得在提交消息质量参差不齐的情况下,会出现预测结果易受噪声干扰的情形,并且现有方法也未将领域专家设计的人工特征以及变更内容中的语义语法信息综合起来进行预测。为了解决上述问题,提出了一种基于细粒度代码表征和特征融合的即时软件缺陷预测方法。通过引入新的变更嵌入计算方法来在细粒度上表示变更代码。同时,引入特征对齐模块,降低提交消息中噪声对方法性能的影响。此外,使用神经网络从人工设计的特征中学习专业知识,充分利用现有特征进行预测。实验结果表明,相较于现有方法,该方法在3个性能指标上均有显著提升。 展开更多
关键词 即时软件缺陷预测 特征融合 软件工程 深度学习 代码表示
在线阅读 下载PDF
RESCAL-DLP:融合动态学习二元组的图谱嵌入模型
13
作者 冯勇 闫寒 +2 位作者 徐红艳 徐涵琪 贾永鑫 《中文信息学报》 北大核心 2025年第7期17-26,共10页
知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体... 知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体关系对,当前研究较少考虑利用二元组潜在的语义信息来提升嵌入的效果。为此,该文提出了一种融合动态学习二元组的图谱嵌入模型(RESCAL-DLP)。首先,使用正负实例构建策略进行数据扩充,使数据集包含更丰富的二元组的特征信息;其次,通过对比学习二元组的语义相似度来加强模型的学习能力,提升嵌入效果;最后,动态调整二元组学习权重进行模型训练。在两个公开标准数据集WN18RR、FB15K-237上进行链接预测实验以评估所提模型的效果。实验结果表明,所提模型相较于当前主流模型在各项指标上均有一定的提升,并在最小化计算资源和模型训练时间的前提下,取得了令人满意的结果。 展开更多
关键词 知识图谱 嵌入表示 数据扩充 二元组 对比学习
在线阅读 下载PDF
联合不相关回归和潜在表示的无监督特征选择
14
作者 刘威 朱乙鑫 +2 位作者 白润才 高琪 李晓红 《辽宁工程技术大学学报(自然科学版)》 北大核心 2025年第4期495-504,共10页
针对基于图的无监督特征选择算法存在挖掘数据内在信息不充分,且易受噪声干扰难以获取更具有判别性特征的问题,提出一种基于广义不相关回归和潜在表示学习的无监督特征选择方法(uncorrelated regression and latent representation for ... 针对基于图的无监督特征选择算法存在挖掘数据内在信息不充分,且易受噪声干扰难以获取更具有判别性特征的问题,提出一种基于广义不相关回归和潜在表示学习的无监督特征选择方法(uncorrelated regression and latent representation for unsupervised feature selection,URLUFS)。该方法将非负矩阵分解作用于广义不相关回归模型的投影矩阵,使投影矩阵实现非线性的维数约简并获得特征选择矩阵。在特征选择矩阵的基础上,引入自适应图学习来进一步挖掘数据的局部流形结构,并对特征选择矩阵施加范数约束以保持稀疏性。利用潜在表示对数据样本间的相互关系进行学习,引导回归模型中的伪标签矩阵,从而选择出更具有判别性的特征。在8个公开的数据集上进行了数值对比实验,实验结果表明:基于广义不相关回归和潜在表示学习的无监督特征选择算法明显优于其他8种无监督特征选择算法。 展开更多
关键词 无监督特征选择 广义不相关回归 非负矩阵分解 潜在表示学习 自适应图学习
在线阅读 下载PDF
基于测井曲线异构特征多视重采样的元学习岩性识别方法
15
作者 曹志民 刘鹏程 +1 位作者 韩建 郝乐川 《石油物探》 北大核心 2025年第3期575-586,共12页
岩性识别是测井解译工作中的基础性及关键性工作之一。然而,由于不同储层性质的复杂性,井间岩性分布和测井响应规律不可避免地存在一定的不一致性,直接影响了井间岩性识别的鲁棒性。针对这一问题,提出了几种异构数据的表示方法,以揭示... 岩性识别是测井解译工作中的基础性及关键性工作之一。然而,由于不同储层性质的复杂性,井间岩性分布和测井响应规律不可避免地存在一定的不一致性,直接影响了井间岩性识别的鲁棒性。针对这一问题,提出了几种异构数据的表示方法,以揭示局部储层描述的不变性。具体来说,首先在测井数据的纵向和横向采用图来表示局部拓扑信息;然后,提取了结构张量(ST)、局部二值模式(LBP)和Hu不变矩(Hu)3种不变特征,用于鲁棒地表示测井数据局部结构信息;最后,用多视重采样策略解决原始数据域中测井曲线的取值分布不平衡和岩性重叠问题以及采用元学习方法对异构特征与目标岩性信息间的非线性关系进行建模。利用大庆油田齐家凹陷工区多口实际测井数据进行了实验,实验结果表明,所提出的不变性特征支持的异构特征多重采样元学习岩性识别方法的井间岩性识别准确率达到86%以上,体现了较强的解决井间测井曲线取值及岩性分布不一致和岩性数据不平衡问题的能力。 展开更多
关键词 测井 岩性识别 储层表征 图表示 不变特征 元学习
在线阅读 下载PDF
基于改进BERT和轻量化CNN的业务流程合规性检查方法
16
作者 田银花 杨立飞 +1 位作者 韩咚 杜玉越 《计算机工程》 北大核心 2025年第7期199-209,共11页
业务流程合规性检查可以帮助企业及早发现潜在问题,保证业务流程的正常运行和安全性。提出一种基于改进BERT(Bidirectional Encoder Representations from Transformers)和轻量化卷积神经网络(CNN)的业务流程合规性检查方法。首先,根据... 业务流程合规性检查可以帮助企业及早发现潜在问题,保证业务流程的正常运行和安全性。提出一种基于改进BERT(Bidirectional Encoder Representations from Transformers)和轻量化卷积神经网络(CNN)的业务流程合规性检查方法。首先,根据历史事件日志中的轨迹提取轨迹前缀,构造带拟合情况标记的数据集;其次,使用融合相对上下文关系的BERT模型完成轨迹特征向量的表示;最后,使用轻量化CNN模型构建合规性检查分类器,完成在线业务流程合规性检查,有效提高合规性检查的准确率。在5个真实事件日志数据集上进行实验,结果表明,该方法相比Word2Vec+CNN模型、Transformer模型、BERT分类模型在准确率方面有较大提升,且与传统BERT+CNN相比,所提方法的准确率最高可提升2.61%。 展开更多
关键词 业务流程 合规性检查 表示学习 事件日志 卷积神经网络
在线阅读 下载PDF
轨迹表示学习方法研究综述
17
作者 孟祥福 孙硕男 +2 位作者 张霄雁 冷强奎 方金凤 《计算机科学与探索》 北大核心 2025年第6期1437-1454,共18页
全球定位系统(GPS)、全球移动通信系统(GSM)的快速发展以及移动设备的普遍应用,产生了大量的轨迹数据。目前的轨迹数据处理方法通常以定长的向量形式输入到模型,因此如何将变长的轨迹数据转换成定长低维的嵌入向量十分重要。轨迹表示学... 全球定位系统(GPS)、全球移动通信系统(GSM)的快速发展以及移动设备的普遍应用,产生了大量的轨迹数据。目前的轨迹数据处理方法通常以定长的向量形式输入到模型,因此如何将变长的轨迹数据转换成定长低维的嵌入向量十分重要。轨迹表示学习旨在将轨迹数据转换为更具表达力和可解释性的表示形式。对轨迹表示学习的研究现状、方法及应用进行了全面综述。分类介绍了轨迹表示学习的关键技术,总结了现有轨迹公开数据集。将轨迹表示学习方法按照不同的下游任务进行分类,重点综述了轨迹表示学习方法在轨迹相似性计算、相似轨迹搜索、轨迹聚类、轨迹预测等领域的原理、优缺点和应用,并分别分析了每一类任务中具有代表性的模型结构和原理,及各类任务中不同方法的特点和优势。分析了当前轨迹表示学习所面临的挑战,探讨了如何解决轨迹表示学习中的数据稀疏性、多模态以及模型优化与隐私保护等问题,并提出了具体的研究思路和方法。 展开更多
关键词 轨迹表示学习 轨迹数据挖掘 轨迹相似性计算 相似轨迹搜索 轨迹聚类 轨迹预测
在线阅读 下载PDF
基于特征表征与学习反馈的动态带钢缺陷样本筛选方法
18
作者 苑玮琦 刘文滔 李绍丽 《仪器仪表学报》 北大核心 2025年第4期240-250,共11页
带钢表面缺陷检测是保证钢铁产品质量的关键环节,实现高效准确的缺陷检测对保障产品性能具有重要意义。近年来,深度学习方法在缺陷检测领域进展显著,但在实际应用中仍面临两个问题:一方面,由于工业生产追求高良品率,导致缺陷样本获取受... 带钢表面缺陷检测是保证钢铁产品质量的关键环节,实现高效准确的缺陷检测对保障产品性能具有重要意义。近年来,深度学习方法在缺陷检测领域进展显著,但在实际应用中仍面临两个问题:一方面,由于工业生产追求高良品率,导致缺陷样本获取受限,且样本标注耗时费力;另一方面,采集的样本中可能存在冗余特征,影响模型训练效率和泛化性能。针对特征冗余问题,提出一种基于特征表征与学习反馈机制的动态样本筛选方法。首先构建包含几何形态、灰度分布及方向特征等多维特征量化模型,系统表征缺陷特征。随后,设计基于特征表征的样本筛选策略,结合特征聚类快速筛选少量具有多样性和代表性的训练样本。最后,设计基于置信度评估的动态优化策略,通过模型的学习反馈获取关键补充样本,提升特征覆盖范围,实现训练样本的自适应优化。NEU-DET数据集的实验结果表明,该方法在将训练样本数量减少52%的情况下,平均检测精度达到76.99%,与完整数据集基本持平。同时,每轮训练迭代时间减少62%,降低了计算开销,验证了方法在样本筛选与检测性能之间的有效平衡。此外,在多种主流目标检测模型上的验证结果表明,该方法在不同检测架构下均能有效提升效率并保持性能,展现出良好的适用性。 展开更多
关键词 带钢表面缺陷检测 样本筛选 特征表征 形态学特征 深度学习
在线阅读 下载PDF
基于多视图表示学习的语义感知异质图注意力网络
19
作者 王静红 吴芝冰 +1 位作者 王熙照 李昊康 《计算机科学》 北大核心 2025年第6期167-178,共12页
近年来,图神经网络因能够高效处理异质图中的复杂结构和丰富语义信息而受到了广泛的关注。学习异质图的低维节点嵌入,同时为节点分类、节点聚类等下游任务保留异质结构和语义,是一个关键且具有挑战性的问题。现有研究主要基于元路径来... 近年来,图神经网络因能够高效处理异质图中的复杂结构和丰富语义信息而受到了广泛的关注。学习异质图的低维节点嵌入,同时为节点分类、节点聚类等下游任务保留异质结构和语义,是一个关键且具有挑战性的问题。现有研究主要基于元路径来设计模型,但这种方法至少存在两方面的局限性:1)合适元路径的选择通常需要专家知识或额外的标注信息;2)该方法限制了模型按预定义的模式学习,从而难以充分捕获网络的复杂性。针对这些问题,提出了一种多视图和语义感知的异质图注意力网络(Multi-view and Semantic-aware Heterogeneous Graph Attention Network,MS-HGANN)。该网络无需人工设计元路径,即可融合节点和关系中的丰富语义信息。MS-HGANN主要包括3个部分:特征映射、二阶特定视图自我图融合和语义感知。特征映射将特征映射到统一的节点特征空间;二阶特定视图自我图融合设计了特定关系的编码器和节点注意力学习节点在局部结构上的表示;语义感知设计了两种相互协调的注意力机制来评估节点和关系的重要性,从而得到最终的节点表示。在3个公开数据集上进行实验,结果表明,所提模型在节点分类和聚类任务上达到了先进水平。 展开更多
关键词 图神经网络 异质图 图表示学习 异质图嵌入 异质网络
在线阅读 下载PDF
混合动作表示强化学习下的城市交叉口智慧信控方法
20
作者 王庞伟 王思淼 +3 位作者 雷方舒 徐京辉 王子鹏 王力 《交通运输系统工程与信息》 北大核心 2025年第4期73-83,共11页
针对城市交叉口环境下单一离散或连续信号控制动作难以充分应对交通流量时空变化,以及现有强化学习方法无法同时解决混合动作空间中的可扩展性和动作依赖性问题,本文提出一种基于混合动作表示强化学习的城市交叉口智慧信控方法。首先,... 针对城市交叉口环境下单一离散或连续信号控制动作难以充分应对交通流量时空变化,以及现有强化学习方法无法同时解决混合动作空间中的可扩展性和动作依赖性问题,本文提出一种基于混合动作表示强化学习的城市交叉口智慧信控方法。首先,将交叉口智能体的动作空间设置为离散化信号相位选择及其相对应的连续性绿灯持续时间,并进行状态空间与奖励函数的一致性设计;其次,应用离散动作嵌入表和条件变分自编码器构建连续可解码的表示空间,将原始混合动作策略学习问题转化为隐式动作表示空间中的连续策略学习问题;再次,使用近端策略优化方法进行隐式动作表示空间策略训练,并通过解码器将输出动作解码为原始混合动作,与环境进行实时交互;最后,基于北京市高级别自动驾驶示范区实际数据开展测试验证。通过不同时段对比测试结果表明,本文所提方法相比于最优基准模型平均延误时间、平均排队长度和平均停车次数分别降低了2.57%~14.84%,4.00%~9.15%和7.25%~20.69%,达到了良好的城市交叉口信控优化效果。 展开更多
关键词 智能交通 交通信号控制 表示学习 混合动作空间 近端策略优化
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部