期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
面向杂乱场景的机械臂抓取位姿预测方法
1
作者 李轩青 陈燕 《机电工程》 北大核心 2025年第6期1185-1192,共8页
针对复杂场景下机器人抓取智能化程度及抓取精度不足等问题,提出了一种新颖的机器人抓取位姿预测方法,即实时抓取网络(RGN)。首先,引入KPConv作为骨干网络,将其用于超点与密集点的特征提取,提出了一种新颖的几何特征计算方法,并利用交... 针对复杂场景下机器人抓取智能化程度及抓取精度不足等问题,提出了一种新颖的机器人抓取位姿预测方法,即实时抓取网络(RGN)。首先,引入KPConv作为骨干网络,将其用于超点与密集点的特征提取,提出了一种新颖的几何特征计算方法,并利用交叉注意力机制实现了多源特征的融合目的;然后,提出了区域关联特征提取模块,借助于几何特征信息进行了区域划分,通过多层感知机进一步完成了抓取位姿的预测,利用抓取系统运动链将夹爪位姿映射到了机械臂关节角特征上,控制机械臂完成了抓取;最后,引入了多样性损失函数,并将其与基线模型进行了对比,利用GraspNet-1Billion数据集和Cornell数据集开展了复杂场景下机械臂抓取性能的测试实验。研究结果表明:采用RGN方法可使抓取预测精度得到大幅提升,最大提升幅度达78.2%;将传统手工特征与深度学习相融合,对机械臂抓取位姿预测精度的提升起到了关键作用,这一规律可为构建良好的机械臂抓取模型提供具体参考方向。 展开更多
关键词 机器人抓取 抓取位姿估计 实时抓取网络 点云 深度学习 特征提取模块 交叉注意力模块
在线阅读 下载PDF
改进U-Net的SAR影像城市水体提取方法
2
作者 黄维 崔志美 +1 位作者 黄志都 邬蓉蓉 《遥感信息》 北大核心 2025年第5期43-50,共8页
随着城市化进程加快,城市洪涝灾害频发且破坏性强,对人类的生命和财产安全产生重大危险。目前基于深度学习的水体提取方法往往因为SAR影像的噪声背景复杂而不能取得满意的结果。文章针对原始U-Net存在的多尺度特征提取能力不足、细节信... 随着城市化进程加快,城市洪涝灾害频发且破坏性强,对人类的生命和财产安全产生重大危险。目前基于深度学习的水体提取方法往往因为SAR影像的噪声背景复杂而不能取得满意的结果。文章针对原始U-Net存在的多尺度特征提取能力不足、细节信息损失等问题,引入空间注意力模块、卷积注意力机制和空洞空间卷积池化金字塔模块,构建了一个多模块串联的特征增强结构,既加强了水体边界定位的准确性,又能有效抑制非水体区域的误分割。实验结果表明,与其他模型相对比,改进的模型有全面的性能优势,能够高效地从SAR影像中提取城市水体,为防灾减灾提供新的技术支持。 展开更多
关键词 SAR图像 深度学习 注意力机制 水体提取 U-Net ASPP模块
在线阅读 下载PDF
基于多级残差信息蒸馏的真实图像去噪方法 被引量:3
3
作者 冯妍舟 刘建霞 +2 位作者 王海翼 冯国昊 白宇 《计算机工程》 CAS CSCD 北大核心 2024年第3期216-223,共8页
深度神经网络对真实图像有较强的去噪能力,可以学习含噪图像和干净图像之间复杂的非线性映射关系。然而,过多的卷积操作导致计算成本增加并占据大量内存,限制了去噪技术在低运算能力设备中的应用,现有去噪算法容易损坏细节信息,恢复图... 深度神经网络对真实图像有较强的去噪能力,可以学习含噪图像和干净图像之间复杂的非线性映射关系。然而,过多的卷积操作导致计算成本增加并占据大量内存,限制了去噪技术在低运算能力设备中的应用,现有去噪算法容易损坏细节信息,恢复图像存在边缘过度平滑、纹理缺失、含有残留噪声等问题。针对这些问题,构造一种多级残差信息蒸馏模块。通过对特征通道进行分割,保留部分特征用于后续多级融合,并进一步通过深度提取单元提取细化后的特征信息;引入对比度感知通道注意力机制对不同通道的特征分配权重;使用多级跳跃连接充分融合不同阶段提取到的上下文信息。构建1个轻量级的多级残差信息蒸馏网络,采用块间复杂度低的编码-解码结构,编码部分为含噪图像特征提取模块,解码部分为干净图像恢复模块。为了加快训练速度,采用混合图像尺寸的渐进式训练方法。实验结果表明,该方法在SSID和DND真实图像数据集上的峰值信噪比分别为39.43 dB和39.49 dB,与其他网络相比提升了0.17~15.77 dB和0.02~7.06 dB,而模型参数量仅为6.92×106,所提模型在提高去噪性能的同时具有较少的参数量。 展开更多
关键词 图像复原 真实图像去噪 多级残差信息蒸馏模块 深度提取模块 对比度感知通道注意力
在线阅读 下载PDF
基于GAANET的立体匹配算法 被引量:2
4
作者 宋昊 毛宽民 朱洲 《计算机科学》 CSCD 北大核心 2024年第4期229-235,共7页
端到端的立体匹配算法在计算时间和匹配效果上均有一定的优势,近年来在立体匹配任务中得到了广泛的应用。但特征提取的过程中存在特征冗余、信息丢失,以及多尺度特征融合不充分等问题,造成算法的计算量和复杂度偏高,也影响了匹配的精度... 端到端的立体匹配算法在计算时间和匹配效果上均有一定的优势,近年来在立体匹配任务中得到了广泛的应用。但特征提取的过程中存在特征冗余、信息丢失,以及多尺度特征融合不充分等问题,造成算法的计算量和复杂度偏高,也影响了匹配的精度。针对上述问题,在自适应聚合网络AANET的基础上,设计了更加适合立体匹配的特征提取模块,提出了改进的幽灵自适应聚合网络GAANET。采用G-Ghost阶段提取多尺度的特征,通过廉价操作生成部分特征,减少特征的冗余现象并有效保存浅层特征;采取高效的通道注意力机制,将不同的权重分配到每个通道中;采取改进的特征金字塔结构,缓解传统金字塔中的通道信息丢失并优化融合特征,为各个尺度的特征进行丰富的信息补充。在SceneFlow,KITTI2015和KITTI2012数据集上进行训练和评估,评估结果显示,与基础方法相比,所提改进算法的精度分别提升了0.92%,0.25%和0.20%,且参数量减少了13.75%,计算量减少了4.8%。 展开更多
关键词 立体匹配 特征提取 端到端立体匹配网络 注意力模块 深度学习
在线阅读 下载PDF
基于IDRSN-BiLSTM的铣削加工表面粗糙度预测方法 被引量:4
5
作者 陈佳琳 尚志武 张雷 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第4期27-36,共10页
针对传统的表面粗糙度预测方法过度依赖人工提取特征以及预测精度较低的问题,提出一种基于Inception模块改进的深度残差收缩网络(IDRSN)和双向长短时记忆网络(BiLSTM)的表面粗糙度预测方法。首先,利用深度残差收缩网络(DRSN)中软阈值化... 针对传统的表面粗糙度预测方法过度依赖人工提取特征以及预测精度较低的问题,提出一种基于Inception模块改进的深度残差收缩网络(IDRSN)和双向长短时记忆网络(BiLSTM)的表面粗糙度预测方法。首先,利用深度残差收缩网络(DRSN)中软阈值化结构和注意力机制对输入信号进行降噪处理。其次,引入Inception模块构建IDRSN以提升网络的多尺度信息获取能力,实现自适应多尺度特征提取。然后,引入反向长短期记忆(LSTM)构建BiLSTM预测网络,利用正反两个LSTM提高网络捕捉历史和未来完整信息的能力。最后,进行实验验证,分别对比IDRSN、DRSN、BiLSTM和人工提取特征4种方法的提取特征效果,以及BiLSTM、卷积神经网络(CNN)、DRSN和CNN-LSTM 4种表面粗糙度预测模型的预测精度。结果表明所提方法具有较高的预测精度,为铣削加工表面粗糙度预测奠定了方法基础。 展开更多
关键词 粗糙度预测 深度残差收缩网络 Inception模块 自适应特征提取 双向长短时记忆网络
在线阅读 下载PDF
深度双分辨率融合多尺度的实时服装分割算法研究
6
作者 李虎啸 陈绪君 田春欣 《激光杂志》 CAS 北大核心 2024年第11期85-92,共8页
针对当前基于服装分割的实时语义分割算法(如Deeplab系列、ERFNet系列、BiseNet等)对服装边缘分割细节特征不足、分割精度差、推理速度慢等问题,提出了一种深度双分辨率融合多尺度的实时语义分割算法MDRNet。为提升服装图像特征的学习能... 针对当前基于服装分割的实时语义分割算法(如Deeplab系列、ERFNet系列、BiseNet等)对服装边缘分割细节特征不足、分割精度差、推理速度慢等问题,提出了一种深度双分辨率融合多尺度的实时语义分割算法MDRNet。为提升服装图像特征的学习能力,采用双分辨率特征网络同时提取高分辨率与低分辨特征,通过双边融合模块将不同分辨率特征进行多次融合,改进了高分辨率网络的深监督输出结构,并添加跨空间多尺度注意力模块捕捉跨空间的特征信息,最后将上下文提取模块DAPPM改为并行模块PAPPM,在提升准确率的同时,可有效减少参数量和计算复杂度并有效提升了FPS。实验结果表明,MDRNet在服装分割DeepFashion-MultiModal数据集上相对于DeeplabV3+、BiseNetv2等算法平均交并比分别提升9.2%、8.1%,为语义分割在服装上的应用提供了更好的技术解决方案。 展开更多
关键词 深度双分辨率 实时语义分割 跨空间多尺度 深监督 上下文提取模块
在线阅读 下载PDF
标签优化非对称卷积编码器的电力负荷深度嵌入聚类方法
7
作者 陈浈斐 包淼 +2 位作者 葛磊蛟 马程 焦奇昱 《电力自动化设备》 EI CSCD 北大核心 2024年第12期69-75,99,共8页
在分析电力系统负荷特性和用电行为的过程中,传统聚类方法面对高维数据的复杂样本往往难以学习负荷样本的深层特征。提出一种加入标签优化的非对称卷积自编码器的负荷深度嵌入聚类方法,取消传统卷积中的池化层和上采样层,以全面保留负... 在分析电力系统负荷特性和用电行为的过程中,传统聚类方法面对高维数据的复杂样本往往难以学习负荷样本的深层特征。提出一种加入标签优化的非对称卷积自编码器的负荷深度嵌入聚类方法,取消传统卷积中的池化层和上采样层,以全面保留负荷原始信息,并在编码侧使用残差模块强化特征提取能力;在聚类层的伪标签设置过程中,使用自组织映射-K均值方法提供更精确的初始软聚类标签,从而提高聚类效率。基于实际电力负荷数据集进行实验,结果表明:所提方法能够有效降低数据维度以及增强对负荷特征的学习,提高了聚类的准确性和稳定性;相较于改进的深度嵌入聚类-卷积自编码器方法,所提方法的方差比准则和轮廓系数分别提升了10.881 6和0.067 29,戴维森堡丁指数下降了0.133 14。 展开更多
关键词 负荷聚类 卷积自编码器 特征提取 残差模块 深度嵌入聚类 负荷特性
在线阅读 下载PDF
面向室内服务的中文语音指令深层信息解析系统 被引量:2
8
作者 孔令富 高胜男 吴培良 《高技术通讯》 CAS CSCD 北大核心 2014年第11期1101-1107,共7页
针对室内服务机器人的人机交互问题,对中文语音指令进行了深入研究,提出了一种基于概率/神经网络混合模型的深层信息解析系统。该系统由指令解析模块和深层信息提取模块组成,前者基于概率模型解析语音指令的有效信息,后者依据家庭环境... 针对室内服务机器人的人机交互问题,对中文语音指令进行了深入研究,提出了一种基于概率/神经网络混合模型的深层信息解析系统。该系统由指令解析模块和深层信息提取模块组成,前者基于概率模型解析语音指令的有效信息,后者依据家庭环境神经网络模型,将有效信息中的服务对象或目标对象作为已知条件提取指令深层信息,旨在将指令所蕴含的深层信息显性化。构建了一般家庭条件下的实验环境进行了仿真实验,仿真数据验证了指令解析模块和深层信息提取模块的可行性;选取两类典型结构的中文语音指令,在该系统上进行深层信息解析实验,提取了准确的有效信息和深层信息。 展开更多
关键词 概率/神经网络混合模型 指令解析模块 有效信息 深层信息提取模块 深层信息
在线阅读 下载PDF
基于改进U-Net模型的高分辨率遥感影像中城市建筑物的提取 被引量:9
9
作者 秦梦宇 刘勇 +2 位作者 张寅丹 张洋 侯建西 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,269,共9页
针对高分辨率遥感影像中城市建筑物周围环境复杂多样,易被阴影遮挡,难以精细化提取的问题,提出一种改进的U-Net网络用于图像中的城市建筑物提取.该网络在标准U-Net网络的编码器末端嵌入双重注意力模块,可以通过捕获全局建筑物信息和长... 针对高分辨率遥感影像中城市建筑物周围环境复杂多样,易被阴影遮挡,难以精细化提取的问题,提出一种改进的U-Net网络用于图像中的城市建筑物提取.该网络在标准U-Net网络的编码器末端嵌入双重注意力模块,可以通过捕获全局建筑物信息和长通道建筑物信息,实现建筑物特征的增强.在交叉熵损失函数的基础上加入Lovász损失函数,构成的复合损失函数增强了对建筑物提取结果的约束能力,进一步提高了模型的鲁棒性.将该模型在美国马萨诸塞州数据集上进行验证,提取建筑物的F1-score为87.83%.结果表明,本方法对高分辨率遥感影像中周围环境复杂多样、被阴影遮挡的城市建筑物具有较强的提取能力. 展开更多
关键词 高分辨率遥感影像 城市建筑物提取 U-Net 双重注意力模块 复合损失函数 深度学习
在线阅读 下载PDF
基于多重多尺度融合注意力网络的建筑物提取 被引量:9
10
作者 杨栋杰 高贤君 +3 位作者 冉树浩 张广斌 王萍 杨元维 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第10期1924-1934,共11页
针对全卷积神经网络模型在进行建筑物提取时易产生过度分割以及内部空洞的问题,提出基于多重多尺度融合注意力网络(MMFA-Net)的高分辨率遥感影像建筑物提取方法.该方法以U-Net为主体架构,设计2个模块:多重高效通道注意力(MECA)和多尺度... 针对全卷积神经网络模型在进行建筑物提取时易产生过度分割以及内部空洞的问题,提出基于多重多尺度融合注意力网络(MMFA-Net)的高分辨率遥感影像建筑物提取方法.该方法以U-Net为主体架构,设计2个模块:多重高效通道注意力(MECA)和多尺度特征融合注意力(MFA). MECA设计在模型跳跃连接中,通过权重配比强化有效特征信息,避免注意力向无效特征的过渡分配;采用多重特征提取,减少有效特征的损失. MFA被嵌入模型底部,结合并行连续中小尺度空洞卷积与通道注意力,获得不同的空间特征与光谱维度特征,缓解空洞卷积造成的大型建筑物像素缺失问题. MMFA-Net通过融合MECA和MFA,提高了建筑物提取结果的完整度和精确率.将模型在WHU、 Massachusetts和自绘建筑物数据集上进行验证,在定量评价方面优于其他5种对比方法,F_(1)分数和IoU分别达到93.33%、87.50%;85.38%、74.49%和88.46%、79.31%. 展开更多
关键词 深度学习 高分辨遥感影像 建筑物提取 多尺度特征融合 高效通道注意力模块 U-Net
在线阅读 下载PDF
融合随机擦除和通道注意力的行人重识别方法 被引量:3
11
作者 闫昊雷 李小春 +1 位作者 张仁飞 邱浪波 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1939-1945,共7页
通过不同角度和方位的视频传感器对进入重点区域的人员视频数据进行分析管控,精准、快速定位视频中的目标人员对于保障社会安全具有重大意义.为解决传统方法受复杂环境干扰严重,识别准度低的问题,本文提出一种基于随机擦除和残差注意力... 通过不同角度和方位的视频传感器对进入重点区域的人员视频数据进行分析管控,精准、快速定位视频中的目标人员对于保障社会安全具有重大意义.为解决传统方法受复杂环境干扰严重,识别准度低的问题,本文提出一种基于随机擦除和残差注意力网络的行人重识别方法.首先使用随机擦除的方法对原始数据进行数据增强,其次基于原始ResNet网络,提出一种融合注意力机制的残差网络模型,能够提取通道维度的视频序列特征,并且抑制冗余背景干扰,提高模型对重要特征的关注程度和提取能力,最后使用级联的难采样三元组损失函数和交叉熵损失函数对网络模型进行训练,使样本能够在高维特征空间中实现聚类,从而有效提供识别精度.实验结果表明,该算法在CUHK03数据集上的精准度优于其它被比较的方法,证明了该方法能够应用于不同条件下的行人重识别任务. 展开更多
关键词 行人重识别 特征提取 注意力机制 深度学习 随机擦除
在线阅读 下载PDF
基于循环残差跳连结构的多方位脊柱X光影像分割 被引量:1
12
作者 迟晓帆 杨环 +3 位作者 西永明 徐同帅 段文玉 洪承超 《计算机应用》 CSCD 北大核心 2022年第S02期249-258,共10页
脊柱X光影像分割为脊柱配准、参数测量与疾病分型奠定了基础,提出了一种基于深度学习的多方位脊柱X光影像自动分割方法。该方法级联粗分割网络与细分割网络,采用Inception模块进行特征提取,通过多尺度跳跃连接结构实现二者互连,构建循... 脊柱X光影像分割为脊柱配准、参数测量与疾病分型奠定了基础,提出了一种基于深度学习的多方位脊柱X光影像自动分割方法。该方法级联粗分割网络与细分割网络,采用Inception模块进行特征提取,通过多尺度跳跃连接结构实现二者互连,构建循环残差路径解决跳连处特征融合时易造成信息丢失现象,同时细分割网络瓶颈处引入并行空间和通道挤压激励模块(SCSE)提高网络对脊柱部位的关注。实验结果表明,该方法在冠状位和左、右Bending位X光影像数据集中平均交并比(IoU)为92.89%、94.10%和93.74%,其三方位脊柱分割效果优于全卷积网络(FCN)、U-Net、SegNet等模型。 展开更多
关键词 脊柱X光影像 深度学习 特征提取 特征融合 注意力模块
在线阅读 下载PDF
基于机器学习的调制格式识别算法研究 被引量:2
13
作者 靳瑞哲 迟楠 《光通信研究》 2022年第6期9-15,57,共8页
为满足新时代通信需求,新一代通信网络应具有速率更快、容量更大和覆盖范围更广等特点。通过在通信网络中混合应用不同调制格式可以满足新一代通信网络的要求。面对未来通信网络中多种调制格式混用且多变的情况,正确识别信号调制格式可... 为满足新时代通信需求,新一代通信网络应具有速率更快、容量更大和覆盖范围更广等特点。通过在通信网络中混合应用不同调制格式可以满足新一代通信网络的要求。面对未来通信网络中多种调制格式混用且多变的情况,正确识别信号调制格式可以为后续使用数字算法提升性能提供基础。机器学习因其在特征提取和分类能力上较传统方法具有明显优势,因此将机器学习技术应用于调制格式识别领域成为当下热点。文章介绍了几种应用于基于特征提取分类方案的机器学习方法,并对其应用做出了分析、比较与总结。 展开更多
关键词 机器学习 特征提取 调制格式识别 深度学习
在线阅读 下载PDF
基于DBN的频率与相位编码信号快速调制识别方法 被引量:4
14
作者 许程成 张剑云 +1 位作者 黄健航 谌诗娃 《现代雷达》 CSCD 北大核心 2018年第2期33-39,共7页
为提升低信噪比条件下雷达/通信频率、相位编码信号调制识别性能,降低特征提取复杂度,提出了基于深度信念网络DBN(Deep Belief Network,DBN)以及快速特征提取的调制识别方法。结合快速傅里叶累加算法FAM(FFTr Accumula—tion Met... 为提升低信噪比条件下雷达/通信频率、相位编码信号调制识别性能,降低特征提取复杂度,提出了基于深度信念网络DBN(Deep Belief Network,DBN)以及快速特征提取的调制识别方法。结合快速傅里叶累加算法FAM(FFTr Accumula—tion Method)算法,提出了将循环谱估计图像转化为有效可识别特征向量的提取算法;设计了用于编码信号调制识别的DBN网络训练与识别框架。仿真结果表明,文中方法较传统方法具有更低的特征提取与预处理复杂度,提取的特征在几种典型编码调制模式信号中具有明显区分,DBN训练识别框架对雷达/通信编码信号调制识别均具有可行性与有效性,在低信噪比条件下对无线电编码信号有更高的识别正确率。 展开更多
关键词 调制识别 特征提取 深度信念网络 循环谱 快速傅里叶累加算法 计算复杂度
在线阅读 下载PDF
面向表情识别的重影非对称残差注意力网络模型 被引量:2
15
作者 闫河 李梦雪 +1 位作者 张宇宁 刘建骐 《智能系统学报》 CSCD 北大核心 2023年第2期333-340,共8页
针对ResNet50中的Bottleneck经过1×1卷积降维后主干分支丢失部分特征信息而导致在表情识别中准确率不高的问题,本文通过引入Ghost模块和深度可分离卷积分别替换Bottleneck中的1×1卷积和3×3卷积,保留更多原始特征信息,提... 针对ResNet50中的Bottleneck经过1×1卷积降维后主干分支丢失部分特征信息而导致在表情识别中准确率不高的问题,本文通过引入Ghost模块和深度可分离卷积分别替换Bottleneck中的1×1卷积和3×3卷积,保留更多原始特征信息,提升主干分支的特征提取能力;利用Mish激活函数替换Bottleneck中的ReLU激活函数,提高了表情识别的准确率;在此基础上,通过在改进的Bottleneck之间添加非对称残差注意力模块(asymmetric residual attention block, ARABlock)来提升模型对重要信息的表示能力,从而提出一种面向表情识别的重影非对称残差注意力网络(ghost asymmetric residual attention network, GARAN)模型。对比实验结果表明,本文方法在FER2013和CK+表情数据集上具有较高的识别准确率。 展开更多
关键词 表情识别 特征提取 ResNet50 Ghost模块 Mish 非对称残差注意力 深度可分离卷积 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部