期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于混合编码和掩膜空间调制的图像补全算法
1
作者 冼进 徐小茹 +1 位作者 冼允廷 冼楚华 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期31-39,共9页
图像补全是指对图像缺失区域进行内容填充,是计算机视觉和图像处理研究的重要问题之一。当前图像补全算法的研究已经取得了很大的进展,但如果图像中的场景比较复杂且存在大面积的缺失区域时,现有算法由于缺乏有效的网络结构来捕捉图像... 图像补全是指对图像缺失区域进行内容填充,是计算机视觉和图像处理研究的重要问题之一。当前图像补全算法的研究已经取得了很大的进展,但如果图像中的场景比较复杂且存在大面积的缺失区域时,现有算法由于缺乏有效的网络结构来捕捉图像的长距离依赖和高级语义信息,仍然较难生成高质量的完整图像。针对大范围缺失的图像补全问题,为扩大图像补全网络有限的感受野,有效地获取图像可见区域的全局信息,同时充分利用图像可见区域的有效信息,该文提出了一种基于混合编码和掩膜空间调制的图像补全算法。该算法首先通过混合编码网络对图像可见区域进行局部和全局信息的特征提取;然后采用掩膜空间调制模块,根据缺失面积的大小动态调整在生成缺失区域时的多样性;最后基于StyleGAN2的方法生成完整图像。实验结果表明,该文提出的算法能够有效地处理大范围缺失的图像,可生成具有多样性的高质量图像,并且能应用在视觉显著性模型的数据增强上。 展开更多
关键词 图像补全 图像增强 混合编码 掩膜空间调制
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
2
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意力模块 编码器 上采样
在线阅读 下载PDF
基于小波变换增强位置编码Transformer的空域流量预测
3
作者 唐卫贞 刘波 +1 位作者 黄洲升 田齐齐 《现代电子技术》 北大核心 2025年第8期127-132,共6页
随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪... 随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪比选出性能最优的小波基函数,再进一步计算出小波系数并将其融入位置编码,以增强模型对时间序列数据的理解能力。实验结果表明,所提模型能够准确捕捉空中交通流量数据中的非平稳性和突变特征,其RMSE和MAPE评估指标较原始Transformer模型分别降低了29.9与2.9%,较LSTM模型分别降低了34.5与3.4%。该模型不仅提升了空域流量预测的准确性,也证实了小波变换在增强模型时间序列数据理解中的有效性,且为交通流量管理提供了一种新的技术方案。 展开更多
关键词 空域流量预测 增强位置编码 Transformer模型 小波变换 LSTM模型 小波基函数
在线阅读 下载PDF
多尺度差分特征增强网络的遥感影像变化检测 被引量:1
4
作者 王杰 蒋伏松 蒋鹏 《计算机科学与探索》 北大核心 2025年第1期211-222,共12页
遥感影像变化检测旨在识别不同时期遥感影像中的目标差异,近年来基于卷积神经网络的方法在遥感影像变化检测任务中取得了很大进展。然而,受光照变化和季节更替的影响,不同时期遥感影像中的伪变化问题仍然难以解决。同时,大多方法中未充... 遥感影像变化检测旨在识别不同时期遥感影像中的目标差异,近年来基于卷积神经网络的方法在遥感影像变化检测任务中取得了很大进展。然而,受光照变化和季节更替的影响,不同时期遥感影像中的伪变化问题仍然难以解决。同时,大多方法中未充分利用多尺度特征,导致模型的性能和准确率受到一定程度的限制。针对上述问题,提出一种多尺度差分特征增强的变化检测方法。利用由孪生网络编码器和差分网络编码器组成的并行编码框架分别提取不同层级的特征,将同级的双时特征和差分特征通过拼接的方式建立两者间的互补关系。引入差分特征增强模块获取更具判别性的特征图并将其作为差分网络编码器的补充输入,丰富变化信息的同时增加模型对变化区域的关注度,使其准确地区分地物的真实变化与伪变化。为了增强特征的多样性和表达能力,使用特征错位融合模块实现语义特征的交叉融合,让每个特征中的语义信息得到充分而不同的交互。该方法在CDD数据集和LEVIRCD数据集上的F1分数分别达到了95.45%和92.04%,交并比分别达到了92.26%和82.93%,与其余八种主流方法相比均为最优,实验结果证明了该方法的有效性。 展开更多
关键词 遥感影像 变化检测 差分增强 并行编码 多尺度特征融合
在线阅读 下载PDF
一种基于降质学习的低光照图像增强方法
5
作者 江奎 王中元 +3 位作者 黄文心 贾雪梅 王正 胡瑞敏 《小型微型计算机系统》 北大核心 2025年第2期353-364,共12页
低光照图像增强任务旨在提高图像的可见性,同时保持其视觉自然度.针对训练数据缺乏多样性以及恢复图像中细节丢失和颜色失真这两方面问题,基于分布一致性约束,本文提出一种无监督降质学习和数据增广方法用于低光照图像增强,其中包括设... 低光照图像增强任务旨在提高图像的可见性,同时保持其视觉自然度.针对训练数据缺乏多样性以及恢复图像中细节丢失和颜色失真这两方面问题,基于分布一致性约束,本文提出一种无监督降质学习和数据增广方法用于低光照图像增强,其中包括设计两阶段的网络来学习低光降质的内在特性以及重新恢复低光图像的亮度和纹理细节.受彩色图像成像原理的启发,本文将低光图像增强任务分解为降质学习环境干扰去除,和图像本体细节和颜色细化表达.具体来讲,本文首先从低光输入中估计降质以模拟环境关照因素导致的失真,然后细化内容以恢复漫射导致的内容和对比度损失,并设计一种新颖的降质学习和内容细化网络.在低光图像增强和联合检测任务上的大量实验验证了本文算法的有效性和效率. 展开更多
关键词 低光图像增强 降质学习 数据增广 编-解码器 扰动去除
在线阅读 下载PDF
基于多视角注意力的异构双分支解码单通道语音增强
6
作者 更藏措毛 黄鹤鸣 《计算机应用》 北大核心 2025年第10期3284-3293,共10页
针对单通道语音增强中主流编解码结构面临的声学特征提取不充分、通道信息丢失和幅度相位补偿困难等问题,提出一种融合不同维度语音特征的异构双分支解码单通道语音增强模型——HDBMV(Heterogeneous DualBranch with Multi-View)。该模... 针对单通道语音增强中主流编解码结构面临的声学特征提取不充分、通道信息丢失和幅度相位补偿困难等问题,提出一种融合不同维度语音特征的异构双分支解码单通道语音增强模型——HDBMV(Heterogeneous DualBranch with Multi-View)。该模型通过信息融合编码器(IFE)、时频残差Conformer(TFRC)模块、多视角注意力(MVA)模块和异构双分支解码器(HDBD)等机制,提升单通道语音增强的性能。首先,IFE联合处理振幅与复数特征,捕捉全局依赖和局部相关,生成紧凑的特征表示;其次,TFRC模块有效捕捉时间维度和频域维度上的相关性,同时降低计算复杂度;再次,MVA模块重构通道域和时频域信息,进一步增强模型对信息的多视角多层次的表征能力;最后,HDBD分别处理幅度特征和细化复数特征,解决幅度相位补偿问题,提升解码鲁棒性。实验结果表明,HDBMV在公开数据集VoiceBank+DEMAND、大数据集DNS Challenge 2020和自建的藏语数据集BodSpeDB上的语音质量感知评估(PESQ)分别达到了3.00、3.12和2.09,短时目标可理解度(STOI)分别达到了0.96、0.97和0.81。可见,HDBMV以最小的参数量和较高的计算效率获得了最佳的语音增强性能和较强的泛化能力。 展开更多
关键词 语音增强 编解码器 CONFORMER 注意力机制 复数特征
在线阅读 下载PDF
伺服电机内置编码器IAS信号增强方法及其在齿轮故障诊断中的应用研究
7
作者 徐晓强 宋霹 +1 位作者 何知义 胡宏伟 《现代制造工程》 北大核心 2025年第9期146-156,145,共12页
内置旋转编码器在电机位置和转速反馈控制中扮演关键角色,其测量的瞬时角速度(Instantaneous Angular Speed,IAS)信号能反映传动系统的扭振状态,能够被用来揭示传动系统中存在的机械缺陷,支撑构建具有自感知自诊断能力的伺服控制系统。... 内置旋转编码器在电机位置和转速反馈控制中扮演关键角色,其测量的瞬时角速度(Instantaneous Angular Speed,IAS)信号能反映传动系统的扭振状态,能够被用来揭示传动系统中存在的机械缺陷,支撑构建具有自感知自诊断能力的伺服控制系统。针对低精度的内置编码器利用传统信号处理方法从IAS信号中精准提取故障特征困难的问题,提出了一种IAS信号增强方法。该方法首先通过EtherCAT总线伺服驱动系统获取伺服电机的瞬时角位置信号,随后采用时间戳提取和局部多项式拟合微分技术获取IAS信号,最后通过角域同步平均技术处理获取的IAS信号,实现了对传动系统局部故障的定量诊断。仿真和齿轮故障试验验证了该方法的有效性,证明了其在低成本传动系统健康监测中的潜力。 展开更多
关键词 伺服电机 内置编码器 故障诊断 信号增强 瞬时角速度
在线阅读 下载PDF
基于频率感知与义原增强的文本防御编码
8
作者 罗浩岚 刘万平 +1 位作者 王宝娟 黄东 《计算机工程与设计》 北大核心 2025年第3期749-755,共7页
针对文本防御编码未考虑训练样本中词频的影响,同义词集缺乏囊括性且存在一定噪声的问题,提出一种基于频率感知与义原增强的编码训练方法。引入样本单词频率,利用编码器区分为样本中的低频词与非低频词,分别训练其鲁棒性;替换词集采用... 针对文本防御编码未考虑训练样本中词频的影响,同义词集缺乏囊括性且存在一定噪声的问题,提出一种基于频率感知与义原增强的编码训练方法。引入样本单词频率,利用编码器区分为样本中的低频词与非低频词,分别训练其鲁棒性;替换词集采用义原增强后的样本数据,能够有效扩充现有词集;编码算法能使样本有效训练确保模型原始准确率。在常见数据集上的实验结果表明,编码训练下的模型分类准确率优于之前防御方法,分别在TextCNN与LSTM上降低模型平均误差到3.6%与4.2%。 展开更多
关键词 文本防御编码 深度神经网络 文本分类 同义词替换攻击 频率感知 义原增强 文本对抗样本
在线阅读 下载PDF
唤醒民族危机感与自豪感选择性增强后续记忆编码
9
作者 张昕怡 汤文芯 +3 位作者 黄亦彤 张梦雪 温碧璇 刘威 《心理与行为研究》 北大核心 2025年第4期464-471,共8页
本研究通过行为实验探讨复杂社会情绪(民族危机感与自豪感)对后续记忆编码的选择性增强作用。实验1采用被试间设计,随机分配被试至民族危机感、民族自豪感及中性情绪唤醒组,随后评估记忆编码能力。结果表明,民族情绪唤醒显著增强了思政... 本研究通过行为实验探讨复杂社会情绪(民族危机感与自豪感)对后续记忆编码的选择性增强作用。实验1采用被试间设计,随机分配被试至民族危机感、民族自豪感及中性情绪唤醒组,随后评估记忆编码能力。结果表明,民族情绪唤醒显著增强了思政相关的记忆编码,而对插图记忆无显著影响。实验2沿用实验1设计,但以数理统计材料为记忆内容,发现民族情绪唤醒不影响数理统计记忆编码。本研究不仅增进了复杂社会情绪对记忆的影响作用的理解,还为高校思政教育方法的优化提供了有力的实证支撑。 展开更多
关键词 情绪唤醒 记忆编码 选择性记忆增强 民族危机感 民族自豪感
在线阅读 下载PDF
基于数据增强和残差网络的敏感信息命名实体识别
10
作者 李莉 宋涵 +1 位作者 刘培鹤 陈汉林 《计算机应用》 北大核心 2025年第9期2790-2797,共8页
敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建... 敏感信息命名实体识别(NER)是隐私保护的关键技术之一。然而,现有的NER方法在敏感信息领域的相关数据集稀缺,且传统技术存在准确率低、可移植性差等问题。为解决这些问题,首先,从互联网中爬取并人工标注含有敏感信息的文本语料,以构建敏感信息NER数据集SenResume;其次,提出一种基于实体掩码的数据增强模型E-MLM(Entity-based Masked Language Modeling),通过整词掩码技术生成新的数据样本,并扩充数据集以提升数据多样性;再次,提出RoBERTa-ResBiLSTM-CRF模型,该模型结合RoBERTa-WWM(Robustly optimized Bidirectional Encoder Representations from Transformers approach with Whole Word Masking)提取上下文特征以生成高质量的词向量编码,并利用残差双向长短期记忆(ResBiLSTM)增强文本特征;最后,通过多层残差网络提高训练效率和模型稳定性,并通过条件随机场(CRF)进行全局解码以提升序列标注的准确性。实验结果表明,E-MLM对数据集质量有显著的提升,并且提出的NER模型在原始和1倍扩充后的数据集上表现均为最优,F1分数分别为96.16%和97.84%。可见,E-MLM与残差网络的引入有利于提升敏感信息NER的准确度。 展开更多
关键词 敏感信息 数据集构建 数据增强 BERT 命名实体识别
在线阅读 下载PDF
基于图神经网络的多通道语音增强
11
作者 宁振杰 闫坤 +1 位作者 陈海贞 韦焯淇 《计算机工程与设计》 北大核心 2025年第10期2945-2951,共7页
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩... 多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩阵的图卷积网络(automatic adjacency matrix-returning graph convolutional network,AAMR-GCN),通过图自编码器(graph auto-encoder, GAE)从麦克风阵列捕获的语音信号中学习邻接矩阵,利用图卷积网络(graph convolutional network,GCN)和多层感知器(multilayer perceptron,MLP)实现语音增强。在多通道的语音增强任务中,AAMR-GCN在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两个指标上均优于几种先进方法。 展开更多
关键词 多通道语音增强 自动邻接矩阵返回的图卷积网络 图自编码器 多层感知器 麦克风阵列 客观语音质量评估 短时客观可懂度
在线阅读 下载PDF
基于卷积调制与空间协作的水下图像增强 被引量:2
12
作者 郭伟 王欣哲 +1 位作者 王江达 王春艳 《计算机工程》 CAS CSCD 北大核心 2024年第8期310-318,共9页
针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,... 针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,特征主导网络将RepVGG中提取到的水下图像特征转化成具有不同尺度的纹理和结构特征,使其与解码器中的特征图进行拼接融合。其次,在编码器中使用卷积调制模块,采用深度可分离卷积(DSConv)模拟自注意力机制的方式减少图像细节信息的丢失,提高编码器特征提取的能力。最后,在解码器中使用空间协作卷积(SCConv),在空间维度上处理水下特征保留更多的位置信息,以提高解码器对融合后特征的增强能力。实验结果表明,该算法在视觉感知与性能指标上优于对比算法,峰值信噪比(PSNR)和结构相似性(SSIM)指标最高达到23.4465 dB和0.8946,水下彩色图像质量评价(UCIQE)和水下图像质量测量(UIQM)指标最高达到0.5826和3.0689,进一步证明了该算法能够有效增强水下图像的纹理和结构特征,具有较好的视觉感知效果。 展开更多
关键词 图像处理 水下图像增强 卷积调制 空间协作 编解码结构
在线阅读 下载PDF
基于混合频域Transformer的相机位姿估计方法
13
作者 杨傲雷 甘少英 +2 位作者 杨帮华 苗中华 徐昱琳 《仪器仪表学报》 CSCD 北大核心 2024年第12期179-189,共11页
针对移动机器人相机位姿估计问题,提出一种基于混合频域Transformer的相机位姿估计方法,旨在从RGB图像中预测相机的位置与方向。首先,构建了室内场景数据集RotIndoor,每个样本包含场景RGB图像和通过VICON系统获取的相机位姿真值;其次,... 针对移动机器人相机位姿估计问题,提出一种基于混合频域Transformer的相机位姿估计方法,旨在从RGB图像中预测相机的位置与方向。首先,构建了室内场景数据集RotIndoor,每个样本包含场景RGB图像和通过VICON系统获取的相机位姿真值;其次,提出位姿回归网络模型CamPose,该模型融合空间域和频域的信息,提升了图像特征表达能力,进而实现高精度的相机位姿估计。具体而言,CamPose引入基于差分卷积网络的特征增强模块,捕获图像细粒度特征;设计了频域编码层,通过傅里叶变换提取频率特征,并整合频域注意力模块,使模型感知不同频率成分的重要性。最后,在公开数据集7Scenes和RotIndoor上进行了实验验证表明,该方法在7Scenes数据集上的位姿估计误差为0.17 m/7.85°,在RotIndoor上定位精度提高了23%。 展开更多
关键词 相机位姿估计 深度学习 特征增强 频域编码 TRANSFORMER
在线阅读 下载PDF
知识增强的BERT短文本分类算法 被引量:3
14
作者 傅薛林 金红 +2 位作者 郑玮浩 张奕 陶小梅 《计算机工程与设计》 北大核心 2024年第7期2027-2033,共7页
为解决短文本信息不全且缺乏领域知识导致关键信息难以充分挖掘而造成的深度学习模型分类性能不足等问题,提出一种知识增强的双向编码器表示转换器(BERT)短文本分类算法(KE-BERT)。提出一种建模短文本与领域知识的方法,通过知识图谱进... 为解决短文本信息不全且缺乏领域知识导致关键信息难以充分挖掘而造成的深度学习模型分类性能不足等问题,提出一种知识增强的双向编码器表示转换器(BERT)短文本分类算法(KE-BERT)。提出一种建模短文本与领域知识的方法,通过知识图谱进行领域知识的引入;提出一种知识适配器,通过知识适配器在BERT的各个编码层之间进行知识增强。通过在公开的短文本数据集上,将KE-BERT与其它深度学习模型相比较,该模型的F1均值和准确率均值达到93.46%和91.26%,结果表明了所提模型性能表现良好。 展开更多
关键词 短文本分类 深度学习 双向编码器表示转换器 知识图谱 领域知识 知识适配器 知识增强
在线阅读 下载PDF
综合多尺度信息和注意力机制的水下图像增强 被引量:3
15
作者 夏晓华 钟预全 +3 位作者 胡鹏 姚运仕 耿继光 张良奇 《光学精密工程》 EI CAS CSCD 北大核心 2024年第10期1582-1594,共13页
针对水下图像由于水的散射和吸收而存在颜色失真和细节丢失等问题,提出了一种综合多尺度信息和注意力机制的生成对抗网络模型来增强水下图像。首先,为了充分利用和增强图像的局部信息和全局信息,使用局部编码器和全局编码器分别提取图... 针对水下图像由于水的散射和吸收而存在颜色失真和细节丢失等问题,提出了一种综合多尺度信息和注意力机制的生成对抗网络模型来增强水下图像。首先,为了充分利用和增强图像的局部信息和全局信息,使用局部编码器和全局编码器分别提取图像的局部特征和全局特征,并互相融合以实现互补性。接着,设计多尺度混合卷积来捕捉多尺度信息,增加网络对不同尺度特征的适应性。然后,利用注意力机制增加特征提取的准确性,加强网络对高价值特征的关注度。最后,重复使用多尺度混合卷积和注意力机制进一步细化特征后,逐步上采样得到增强图像。与六种经典和最新的方法相比,提出的模型不仅在主观评价中取得了最好的视觉感受,而且在整个测试集上,峰值信噪比(PSNR)、结构相似指数(SSIM)、水下图像质量指标(UIQM)和自然图像质量(NIQE)四种客观评价指标分别取得了22.499,0.789,2.911和4.175的平均分数,均优于六种对比方法,较对比方法中的最优值分别提升0.353,0.002,0.025和0.307,证明提出的模型不仅能够矫正图像颜色失真,而且在恢复图像细节、增加图像对比度和清晰度等方面均有较好的表现,具有良好的应用前景。 展开更多
关键词 水下图像增强 生成对抗网络 编码器 多尺度混合卷积 注意力机制
在线阅读 下载PDF
基于模态语义增强的跨模态食谱检索方法 被引量:1
16
作者 李明 周栋 +1 位作者 雷芳 曹步清 《计算机应用研究》 CSCD 北大核心 2024年第4期1131-1137,共7页
在跨模态食谱检索任务中,如何有效地对模态进行特征表示是一个热点问题。目前一般使用两个独立的神经网络分别获取图像和食谱的特征,通过跨模态对齐实现跨模态检索。但这些方法主要关注模态内的特征信息,忽略了模态间的特征交互,导致部... 在跨模态食谱检索任务中,如何有效地对模态进行特征表示是一个热点问题。目前一般使用两个独立的神经网络分别获取图像和食谱的特征,通过跨模态对齐实现跨模态检索。但这些方法主要关注模态内的特征信息,忽略了模态间的特征交互,导致部分有效模态信息丢失。针对该问题,提出一种通过多模态编码器来增强模态语义的跨模态食谱检索方法。首先使用预训练模型提取图像和食谱的初始语义特征,并借助对抗损失缩小模态间差异;然后利用成对跨模态注意力使来自一个模态的特征反复强化另一个模态的特征,进一步提取有效信息;接着采用自注意力机制对模态的内部特征进行建模,以捕捉丰富的模态特定语义信息和潜在关联知识;最后,引入三元组损失最小化同类样本间的距离,实现跨模态检索学习。在Recipe 1M数据集上的实验结果表明,该方法在中位数排名(MedR)和前K召回率(R@K)等方面均优于目前的主流方法,为跨模态检索任务提供了有力的解决方案。 展开更多
关键词 跨模态食谱检索 特征提取 模态语义增强 多模态编码器
在线阅读 下载PDF
特征选择融合和增强的轻量级深度估计方法
17
作者 陈磊 梁正友 孙宇 《小型微型计算机系统》 CSCD 北大核心 2024年第9期2182-2187,共6页
目前大部分的单目深度估计网络存在网络参数庞大,消耗硬件资源多等问题.针对这些问题提出一种特征选择融合和特征增强的轻量级深度估计方法.首先,设计了特征选择融合模块来对编码器输出的多尺度特征进行选择融合,在解码器中融入编码器... 目前大部分的单目深度估计网络存在网络参数庞大,消耗硬件资源多等问题.针对这些问题提出一种特征选择融合和特征增强的轻量级深度估计方法.首先,设计了特征选择融合模块来对编码器输出的多尺度特征进行选择融合,在解码器中融入编码器底层位置特征信息,提高不同尺度特征信息的利用率;其次,设计了一个Sobel特征增强模块来加强模型对场景边界信息的感知,提高场景边界深度信息的估计精度.实验结果表明,该方法的模型参数量在仅有4.2M(M为百万),在NUY Depth V2数据集上取得δ1指标0.823的先进性能.该方法不但兼顾了推理速度和估计精度,而且对场景边缘信息有较强预测能力以及模型有较强鲁棒性. 展开更多
关键词 深度估计 多尺度特征融合 特征增强 编码器解码器 轻量级网络
在线阅读 下载PDF
基于SEI的煤矿智能监控视频传输方法 被引量:5
18
作者 陈佳 王琪 王鹏 《工矿自动化》 CSCD 北大核心 2024年第5期93-98,共6页
目前煤矿视频监控数据传输存在高延迟问题,而视频传输延迟的主要成因是编码延迟。针对该问题,提出了一种无视频编码的基于媒体补充增强信息(SEI)的煤矿智能监控视频传输方法。该方法在解复用视频流得到视频压缩帧后缓存一份副本,解码视... 目前煤矿视频监控数据传输存在高延迟问题,而视频传输延迟的主要成因是编码延迟。针对该问题,提出了一种无视频编码的基于媒体补充增强信息(SEI)的煤矿智能监控视频传输方法。该方法在解复用视频流得到视频压缩帧后缓存一份副本,解码视频压缩帧得到视频解码帧,通过SEI存储视频解码帧中AI模型分析结果,根据时间戳对应关系将自定义SEI写入该视频解码帧对应视频压缩帧副本的网络提取层单元,并复用视频压缩帧副本,实现煤矿智能监控视频实时传输。在24核CPU上对该方法进行实验测试,结果表明:对于1280×720分辨率的视频,采用该方法处理视频时CPU整体使用率由采用传统方法时的24.7%~36.6%降至20.3%~23.9%,端到端延迟由1946 ms降至345 ms;对于1920×1080分辨率的视频,采用该方法处理视频时CPU整体使用率由采用传统方法时的29.2%~41.8%降至18.5%~26.3%,端到端延迟由6204 ms降至479 ms。该方法通过规避视频编码环节,降低了煤矿智能监控视频传输延迟,且节省了视频编码所需的CPU或GPU资源,降低了智能视频监控系统硬件成本。 展开更多
关键词 煤矿智能视频监控 监控视频传输 视频AI分析 无视频编码 媒体补充增强信息 端到端延迟
在线阅读 下载PDF
液态奶中镉、铜等重金属的光谱智能检测新方法研究 被引量:2
19
作者 黄志轩 何天伦 +1 位作者 郭祥 陈达 《分析测试学报》 CAS CSCD 北大核心 2024年第7期1032-1038,共7页
该文针对传统重金属检测方法速度慢、通量低等问题,发展了表面富集扫描激光诱导击穿光谱(SES-LIBS)检测新方法,显著提升了液态奶中重金属的检测灵敏度和通量。SES-LIBS方法利用金属置换反应原理,将液态奶中游离的痕量重金属离子置换并... 该文针对传统重金属检测方法速度慢、通量低等问题,发展了表面富集扫描激光诱导击穿光谱(SES-LIBS)检测新方法,显著提升了液态奶中重金属的检测灵敏度和通量。SES-LIBS方法利用金属置换反应原理,将液态奶中游离的痕量重金属离子置换并富集到活性金属基底的特定区域表面,进而高效采集该区域表面的LIBS信号。SES-LIBS方法在有效避免液体离子猝灭效应的同时,显著提升了痕量重金属离子的检测灵敏度。为克服样品采集和基质的干扰,采用重加权特征光谱驱动的自编码孪生多网络算法(RCSD-ASMN)进行SES-LIBS信号解析,从复杂、变动的LIBS信号中准确提取出待测组分的光谱特征信息。SES-LIBS方法可同时检测Cd、Cu等多种重金属元素,检出限分别为0.11、0.13 mg/kg,R^(2)均不低于0.97。实验结果证明,SES-LIBS技术能有效克服不同品牌液态奶基底和重金属元素的交叉干扰,具备良好的检测精度和线性度,为液态样品中重金属的高通量检测提供了一种新手段。 展开更多
关键词 液态奶 重金属 表面富集扫描激光诱导击穿光谱 重加权光谱 自编码孪生多任务网络
在线阅读 下载PDF
基于幅度和相位混合特征交叉的语音增强方法 被引量:1
20
作者 卿朝进 付小伟 唐书海 《计算机工程与设计》 北大核心 2024年第2期587-593,共7页
为充分利用含噪语音信号的相位特征信息及其与幅度信息的相关性,提出一种幅度和相位混合特征交叉的单通道语音增强方法。提取含噪信号的对数功率谱和相位特征,依次交叉排列;计算复数掩模,将复数掩模的实虚部依次交叉以保持对称输入特征... 为充分利用含噪语音信号的相位特征信息及其与幅度信息的相关性,提出一种幅度和相位混合特征交叉的单通道语音增强方法。提取含噪信号的对数功率谱和相位特征,依次交叉排列;计算复数掩模,将复数掩模的实虚部依次交叉以保持对称输入特征;在此基础上,构建深度编解码器网络(amplitude phase deep encoder decoder network,APDEDN)增强语音质量。实验结果表明,相较单一特征方法,提出方法获得了语音质量感知评估评分和短时目标可懂度上的改善。 展开更多
关键词 语音增强 特征交叉 特征提取 混合特征 复数掩模 编解码器 深度学习
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部