期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
AP-IS:面向多模态数据的智能高效索引选择模型 被引量:4
1
作者 乔少杰 刘晨旭 +5 位作者 韩楠 徐康镭 蒋宇河 元昌安 吴涛 袁冠 《自动化学报》 北大核心 2025年第2期457-474,共18页
现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问... 现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问题,提出一种面向多模态数据的智能高效索引选择模型APE-X DQN(Distributed prioritized experience replay in deep Q-network),称为AP-IS(APE-X DQN for index selection).AP-IS设计了新型索引集编码和SQL语句编码方法,该方法使AP-IS在感知多模态数据的同时兼顾索引结构本身的特性,极大地降低了索引的存储代价.APIS集成新型索引效益评估方法,在优化强化学习奖励机制的同时,监控数据库工作负载的执行状态,保证动态工作负载下AP-IS在时间和空间上的优化效果.在真实多模态数据集上进行大量实验,验证了AP-IS在工作负载的延迟、存储代价和训练效率等方面的性能,结果均明显优于最新索引选择方法. 展开更多
关键词 智能数据库 多模态数据 索引选择 强化学习 执行计划
在线阅读 下载PDF
一种轻量级DeepLabV3+遥感图像分割方法
2
作者 陆建波 彭俊桂 +1 位作者 霍雷刚 刘晓彬 《广西科学》 北大核心 2025年第2期374-385,共12页
针对遥感图像语义分割中的物体边界分割不全、模型参数量大和占用内存多等问题,本研究提出一种轻量级DeepLabV3+遥感图像分割方法(L-DeepLabV3+)。在模型参数量更小的情况下,该方法能够提升物体边界分割精度。具体而言,L-DeepLabV3+在... 针对遥感图像语义分割中的物体边界分割不全、模型参数量大和占用内存多等问题,本研究提出一种轻量级DeepLabV3+遥感图像分割方法(L-DeepLabV3+)。在模型参数量更小的情况下,该方法能够提升物体边界分割精度。具体而言,L-DeepLabV3+在残差模块中采用维度下降策略,通过减少输出特征图的通道数,降低模型参数量,将MobileNetV2主干网络中的倒残差模块替换为提出的降维残差模块,重构特征提取网络;为了加快模型训练速度,该方法在DeepLabV3+中的空洞空间金字塔池化层(Atrous Spatial Pyramid Pooling, ASPP)中使用深度可分离卷积(Depthwise Separable Convolution, DSConv);此外,为解决样本类别不均衡问题并提高分割准确率,将交叉熵损失函数(Cross-Entropy loss, CE loss)和Dice loss合并为新的损失函数进行训练;最后,通过将归一化层与卷积层融合、将1×1卷积和恒等残差转换成3×3卷积实现模型参数重构,从而在推理时实现模型轻量化。在DLRSD、WHDLD、UDD6等数据集上的实验结果表明,改进的L-DeepLabV3+模型的参数量仅3.5 M,有较高的分割准确率和训练效率,画面每秒传输帧数(Frames Per Second, FPS)可达到90.2。 展开更多
关键词 遥感图像 DeepLabV3+ 深度可分离卷积 轻量化
在线阅读 下载PDF
基于动态自适应时空图的多元时序预测模型 被引量:3
3
作者 乔少杰 薛骐 +5 位作者 杨国平 韩楠 李贺 袁冠 黄江涛 毛睿 《计算机学报》 EI CAS CSCD 北大核心 2024年第12期2925-2937,共13页
深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金... 深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金融等领域.多元时间序列数据具有复杂的时空依赖性,现有模型大多仅能捕获序列数据中的时间特征,难以捕获空间特征,而图神经网络解决了这一问题.图神经网络能够自然地建模实体间的复杂关系,可以很好地处理拓扑数据,而多元时序数据大多可以构造为拓扑图,因此图神经网络可以很好地学习多元时序数据中的空间特征.基于图神经网络的多元时间序列预测模型受到广泛关注并取得了一定的成果,但现有基于图神经网络的模型仍存在诸多不足.首先,现有方法大多分别捕获和建模多元时间序列数据中的空间特性和时间特性,未充分考虑多元时间序列的时空统一性,导致模型的次优建模;其次,现有方法主要基于静态预定义图或动态自适应图,其中静态预定义图通常根据监测节点之间的空间相关性进行构造且不会随着时间而改变,基于预定义图的研究忽略了时间序列数据中的时间特征,即忽略了数据模式随时间发生的改变;而自适应图通常由模型自主学习并不包含监测节点间的固有属性,基于自适应图的研究忽略了大量有效的领域知识,如道路的连通性和道路间的属性.为了解决上述问题,提出基于动态自适应时空图的多元时序预测模型MTP-Graph(Multivariate Time series Prediction model based on dynamic adaptive spatio-temporal Graph),利用时空融合模块将时空信息进行统一处理,避免了分开捕获时间特性与空间特性而导致的次优建模问题,提出图结合模块将静态预定义图和动态自适应图进行动态融合,获取时空信息的同时充分考虑领域知识,使模型可以更好地学习多元时间序列中的时空特性.在PeMSD3、PeMSD7和PeMSD8数据集上的大量实验结果表明,MTP-Graph预测性能优于其他基准方法,验证了MTP-Graph的可用性和有效性. 展开更多
关键词 多元时序预测 时空数据库 图神经网络 注意力机制 机器学习
在线阅读 下载PDF
MSViT:融合多尺度特征的轻量化图像分类混合模型
4
作者 覃晓 彭磊 +6 位作者 廖惠仙 元昌安 赵剑波 邓超 钱泉梅 卢虹妃 龚远旭 《广西科学》 北大核心 2024年第5期912-924,共13页
针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度... 针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度前馈神经网络(Multi-Scale Feed Forward Network, MSFFN)模块,该模块能有效提取空间和多尺度通道特征。其次,设计一个新的级联特征融合解码器(Cascade Feature Fusion Decoder, CFFD),通过整合特征金字塔网络(Feature Pyramid Network, FPN)和多阶段特征融合解码器,显著提升模型对不同尺度特征的交互和融合能力。最后,模型引入多阶损失函数,以全面优化不同尺度特征在图像分类任务中的表现。为了验证MSViT的有效性,在4个实验数据集[ImageNet-1k的1个子集(Small_ImageNet)、Cifar 100、糖尿病视网膜病变数据集(APTOS 2019)、蘑菇数据集(Mushroom 66)]上进行大量的实验。其中在Small_ImageNet数据集上的实验结果显示,MSViT实现了87.58%的Top-1准确率,较EdgeViT-XXS提升了2.27%。实验结果证明了MSViT在图像分类任务中的有效性。 展开更多
关键词 图像分类 多尺度特征融合 多阶损失函数 特征金字塔网络(FPN) TRANSFORMER
在线阅读 下载PDF
一种基于去噪自编码器融合相似度的药物-靶标相互作用预测方法
5
作者 林艳梅 曹爱清 彭昱忠 《广西科学》 北大核心 2024年第5期842-853,共12页
基于机器学习预测潜在药物-靶标相互作用(Drug-Target Interaction, DTI)的方法是一个具有竞争力的研究主题,但当前相关的预测方法和模型在特征学习方面尚有较大的发展空间。本研究基于无监督学习思想提出了一个结合去噪自编码器和分子... 基于机器学习预测潜在药物-靶标相互作用(Drug-Target Interaction, DTI)的方法是一个具有竞争力的研究主题,但当前相关的预测方法和模型在特征学习方面尚有较大的发展空间。本研究基于无监督学习思想提出了一个结合去噪自编码器和分子相似度非线性计算方式的药物-靶标相互作用预测方法。该方法通过去噪自编码器学习和构建药物-靶标相互作用对的特征,并在此基础上融入药物-药物、靶标-靶标之间的相似信息以增强药物-靶标特征的丰富度,从而提高模型的预测能力。在Enzymes、Ion channels、GPCRs和Nuclear receptors等4个基准数据集的比较实验结果表明,本研究所提出的模型显著优于PPAEDTI、AutoDTI++、CMF、Bi-PSSM、ESBoost、CNNDTI、NFSPDTI和EFMSDTI等8个较先进模型,并与另一先进模型aSDAE相当。可见,本研究所提出的模型提高了药物(化合物)与靶标相互作用的预测性能,可为新药研发和药物重新定位提供更优的药物-靶标相互作用预测支持。 展开更多
关键词 药物-靶标相互作用 深度学习 去噪自编码器 新药研发 药物重定位
在线阅读 下载PDF
GCTR:粒度统一的跨模态文本行人检索网络模型
6
作者 覃晓 张金勇 +4 位作者 龚远旭 吴琨生 黄豪杰 淳鑫 元昌安 《广西科学》 北大核心 2024年第5期988-1001,共14页
现有的文本行人检索网络模型在检索任务中缺乏对图文语义联系的关注,且容易忽略文本与图像特征之间的粒度差异,针对这两大问题,本研究提出一种粒度统一的跨模态文本行人检索网络模型(Granularity-unified Cross-modal Text-person Retri... 现有的文本行人检索网络模型在检索任务中缺乏对图文语义联系的关注,且容易忽略文本与图像特征之间的粒度差异,针对这两大问题,本研究提出一种粒度统一的跨模态文本行人检索网络模型(Granularity-unified Cross-modal Text-person Retrieval model, GCTR)。首先,GCTR利用具备跨模态迁移知识能力的视觉语言预训练模型来获取具有基础关联性的文本和图像特征;其次,本研究提出一个跨模态粒度特征增强模块(Cross-Model Feature Enhancement module, CMFE),它利用跨模态特征增强码表(Enhanced Cross-modal Feature Codebook, ECFC)获取具有统一粒度的图像文本特征,解决了图文特征粒度差异的问题;最后,结合局部和全局的匹配损失策略完成模型的训练。GCTR在CUHK-PEDES、ICFG-PEDES和RSTPReid 3个公开数据集上的表现均优于现有的主流模型,证明了GCTR在跨模态文本行人检索任务上的优越性。 展开更多
关键词 跨模态检索 图文检索 行人检索 视觉语言预训练 粒度特征增强
在线阅读 下载PDF
一种基于人体姿态的新型中国交警手势识别网络
7
作者 覃晓 李永玉 +3 位作者 吴琨生 元昌安 谭思靖 刘善锐 《广西科学》 北大核心 2024年第5期1011-1024,共14页
交警手势识别对于自动驾驶技术至关重要,现有的基于人体姿态的交警手势识别方法在骨架特征提取中存在特征不完整、鲁棒性不足等问题;时序特征提取存在动态信息丢失、时序依赖性弱、实时性差等问题,其效果也极易受到环境背景的影响。本... 交警手势识别对于自动驾驶技术至关重要,现有的基于人体姿态的交警手势识别方法在骨架特征提取中存在特征不完整、鲁棒性不足等问题;时序特征提取存在动态信息丢失、时序依赖性弱、实时性差等问题,其效果也极易受到环境背景的影响。本研究提出一种基于人体姿态的新型交警手势识别网络(Pose Long Short-Term Memory, PoseLSTM)。PoseLSTM中的关节组合编码器(Compositional Tokens Multi-layer perceptron Mixer, CTMM)能够捕捉身体各关节间的关联特征,并通过依赖建模来转换这些关节信息,形成多部位特征表示,解决了基于长短期记忆(Long Short-Term Memory, LSTM)的算法无法有效提取骨架特征的问题;此外,PoseLSTM中的混合架构注意力LSTM (Attention LSTM),能更好地融合输入与隐藏状态的信息,其效果优于原始LSTM。实验结果表明,PoseLSTM在开源的中国交警手势数据集上的准确率为100.00%,实现了最优。为了证明PoseLSTM的泛化能力,在开放手语数据集LSA64、WLASL-100和CSL-500上进行实验,其准确率分别达到100.00%、59.69%和96.40%。 展开更多
关键词 交警手势识别 注意力机制 LSTM 关节组合
在线阅读 下载PDF
基于多尺度特征提取的密集型小目标检测网络
8
作者 元昌安 王文姬 +10 位作者 黄豪杰 覃正优 张金勇 廖惠仙 覃晓 李小森 李永玉 符云琴 谭思婧 钱泉梅 吴琨生 《广西科学》 北大核心 2024年第5期939-953,共15页
针对现有的无锚框目标检测算法难以在密集场景下有效提取多尺度目标特征的问题,本研究提出基于多尺度特征提取的密集型小目标检测网络(Intensive small target detection network based on Multi-Scale feature Extraction, IMSE)。本... 针对现有的无锚框目标检测算法难以在密集场景下有效提取多尺度目标特征的问题,本研究提出基于多尺度特征提取的密集型小目标检测网络(Intensive small target detection network based on Multi-Scale feature Extraction, IMSE)。本研究首先提出多尺度特征增强(Multi-scale Feature Enhancement, MFE)模块,其包括窗口注意力(Window Attention, WA)模块和多尺度信息融合(Multi-scale Information Fusion, MIF)模块,通过建立全局级别的上下文联系从而增强IMSE在密集场景下的特征表达,进而能够更有效地提取检测目标的多尺度特征;其次提出可变形卷积特征金字塔网络(Deformable Convolutional Feature Pyramid Networks, DCFPN)结构,引入空洞卷积进行特征增强,从而能够有效提高IMSE检测形状不规则、分布无规律物体的能力;最后将融合后的多尺度特征分别输入检测头进行分类与边界框的回归任务。IMSE在公共数据集MS COCO、CARPK与基于实际生产场景构建的WOOD数据集上进行验证,实验结果表明,IMSE在3个数据集上的平均精度(Average Precision, AP)分别达到了49.4%、75.8%和55.0%,分别比原始FCOS方法高出1.8%、1.4%和2.1%,验证了所提出模型的有效性。 展开更多
关键词 目标检测 自注意力机制 特征金字塔 空洞卷积 可变形卷积
在线阅读 下载PDF
全局替换的自适应权重调整MOEA/D 被引量:2
9
作者 袁田 尹云飞 +1 位作者 黄发良 陈乙雄 《控制理论与应用》 EI CAS CSCD 北大核心 2023年第4期653-662,共10页
当多目标问题的帕累托前沿形状较为复杂时,基于分解的多目标进化算法MOEA/D的解的均匀性将受到很大的影响.MOEA/D利用相邻子问题的信息来优化,但早期因为种群中的个体与子问题的关联是随机分配的,仅在邻居间更新会浪费优秀解的信息,影... 当多目标问题的帕累托前沿形状较为复杂时,基于分解的多目标进化算法MOEA/D的解的均匀性将受到很大的影响.MOEA/D利用相邻子问题的信息来优化,但早期因为种群中的个体与子问题的关联是随机分配的,仅在邻居间更新会浪费优秀解的信息,影响收敛速度.针对这些问题,本文提出一种MOEA/D的改进算法(MOEA/DGUAW).该算法使用种群全局更新的策略,来提高收敛速度;使用自适应调整权重向量的策略来获得更均匀分布的解集.将MOEA/D-GUAW算法与现有的MOEA/D,MOEA/D-AWA,RVEA和NSGA-Ⅲ算法在10个广泛应用的测试问题上进行了实验比较.实验结果表明,提出的算法在大部分问题上,反转世代距离评价指标IGD优于其他算法,收敛速度也快于其他算法. 展开更多
关键词 多目标优化 基于分解的进化多目标优化 全局替换 自适应权重调整
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部