期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
动态环境下共融机器人深度强化学习导航算法 被引量:2
1
作者 顾金浩 况立群 +2 位作者 韩慧妍 曹亚明 焦世超 《计算机工程与应用》 北大核心 2025年第4期90-98,共9页
在过去的几十年里,移动服务机器人的导航算法得到了广泛研究,但智能体仍然缺乏人类在拥挤环境中展现出的复杂性和合作性。随着人机共融的应用不断拓展,机器人和人类共享工作空间的协作将愈发重要,因此下一代移动服务机器人需要符合社交... 在过去的几十年里,移动服务机器人的导航算法得到了广泛研究,但智能体仍然缺乏人类在拥挤环境中展现出的复杂性和合作性。随着人机共融的应用不断拓展,机器人和人类共享工作空间的协作将愈发重要,因此下一代移动服务机器人需要符合社交要求,才能被人类接受。为了提升多智能体在动态场景中的自主导航能力,针对多智能体导航中社会适应性低和寻找最优值函数问题,提出了一种动态环境下共融机器人深度强化学习避障算法。建立了更贴近人类行为的运动模型并将其添加到深度强化学习框架中,用于提高共融机器人的合作性;为了在行人物理安全的基础上提升其感知安全,重新制定了奖励函数;利用非线性深度神经网络代替传统的值函数,解决寻找最优值函数问题。仿真实验显示,相较于最新的深度强化学习导航方法,该方法在不增加导航时间的情况下实现了100%的导航成功率,且没有发生任何碰撞。结果表明,该方法使共融机器人最大限度地满足人类的社交原则,同时朝着目标前进,有效提高了行人的感知安全。 展开更多
关键词 服务机器人 避障算法 深度强化学习 最优值函数 奖励函数
在线阅读 下载PDF
基于激光雷达的室内机器人路径规划方法研究 被引量:4
2
作者 韩慧妍 韩方正 +2 位作者 韩燮 况立群 曹亚明 《激光与红外》 CAS CSCD 北大核心 2024年第7期1028-1036,共9页
自主移动机器人在室内环境中的导航取得了重大进展,然而地图构建精度较差且路径规划欠佳,限制了这类机器人的实际应用。为了解决这些问题,提出了一种基于引导搜索的路径规划算法,即引力双向快速搜索随机树算法(GBI-RRT),该算法采用目标... 自主移动机器人在室内环境中的导航取得了重大进展,然而地图构建精度较差且路径规划欠佳,限制了这类机器人的实际应用。为了解决这些问题,提出了一种基于引导搜索的路径规划算法,即引力双向快速搜索随机树算法(GBI-RRT),该算法采用目标偏差抽样,有效地引导节点走向目标,减少无效搜索。为了进一步提高导航效率,又提出了一种消除低质量节点,提高路径曲率的路径重组策略,为了验证上述方法的有效性,将其集成到一个基于ROS系统的移动机器人中,并在仿真和真实环境实验中进行了评估。结果表明,GBI-RRT在各种室内环境下的性能均优于现有算法。 展开更多
关键词 自主移动 地图构建 路径规划 偏差抽样
在线阅读 下载PDF
基于紧凑中心的多模态三维模型检索研究
3
作者 龙丽叶 焦世超 +2 位作者 郭磊 韩燮 况立群 《计算机工程》 北大核心 2025年第2期322-334,共13页
随着三维模型分类检索任务的不断发展,多模态特征融合已经成为提高模型性能和丰富形状表征的关键技术之一。现有基于多模态的三维模型检索方法侧重于直接融合多种全局特征,然后利用交叉熵损失拟合标签信息,将检索任务转化为分类任务,同... 随着三维模型分类检索任务的不断发展,多模态特征融合已经成为提高模型性能和丰富形状表征的关键技术之一。现有基于多模态的三维模型检索方法侧重于直接融合多种全局特征,然后利用交叉熵损失拟合标签信息,将检索任务转化为分类任务,同时忽略了复杂三维模型多模态之间的局部互补信息,导致检索性能不够理想。为了解决上述问题,提出一种基于紧凑中心损失的全局-局部特征互补融合方法。首先,利用预训练模型从点云数据和多视图数据中提取深度特征;然后,设计注意力感知融合模块,利用点云与多视图特征间的关系分数细化视图特征集并融合点云特征,以获得显著的局部互补信息;其次,引入多头注意力机制,在特征动态聚合模块中自适应地探索全局点云特征、全局视图特征以及局部互补特征之间的潜在模态表示,进一步融合互补特征并最小化冗余;最后,利用紧凑中心损失和交叉熵损失的联合约束,在最小化类内距离的同时最大化类间距离,生成具有高度区分性的特征描述符。在ModelNet40、ModelNet10数据集上的实验结果表明,所提方法取得了93.4%、94.8%的分类准确率(OA)以及92.5%、95.1%的平均精度均值(mAP)。 展开更多
关键词 多模态融合 三维模型 注意力 特征互补 损失函数
在线阅读 下载PDF
室内机器人动态SLAM技术 被引量:4
4
作者 韩慧妍 韩方正 +2 位作者 韩燮 况立群 曹亚明 《计算机工程与设计》 北大核心 2024年第2期530-539,共10页
随着计算机视觉、深度学习的发展,基于视觉的静态SLAM研究不断改进,然而大多数SLAM算法存在静态假定不成立和累计漂移。针对上述问题,设计动态BN-SLAM算法,利用深度图像的几何信息对原始掩模进行修正,修正掩膜用于移除运动物体及其影响... 随着计算机视觉、深度学习的发展,基于视觉的静态SLAM研究不断改进,然而大多数SLAM算法存在静态假定不成立和累计漂移。针对上述问题,设计动态BN-SLAM算法,利用深度图像的几何信息对原始掩模进行修正,修正掩膜用于移除运动物体及其影响。设计加权RANSAC方法,求解摄像机局部位姿。在TUM数据集上的实验结果表明,BN-SLAM的ATE、平移RPE和旋转RPE的平均RMSE值分别为95.46%、92.45%和90.88%,平均S.D.值分别为94.88%、94.76%和92.80%,跟踪轨迹点结果的平均率为98.80%。在真实环境的实验结果表明,BN-SLAM能够剔除运动的人造成的地图污染。 展开更多
关键词 计算机视觉 深度学习 静态假定 累计漂移 深度图像 原始掩模 修正掩膜
在线阅读 下载PDF
深度语义关联学习的基于图像视觉数据跨域检索 被引量:3
5
作者 焦世超 关日鹏 +2 位作者 况立群 熊风光 韩燮 《计算机工程》 CAS CSCD 北大核心 2024年第5期190-199,共10页
基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据,其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间,采用域适应算法或深度度量学习算法实现跨域特... 基于图像的视觉数据跨域检索任务旨在搜索与输入图像在语义上一致或外形上相似的跨域图像和三维模型数据,其面临的主要问题是处理跨域数据之间的模态异质性。现有方法通过构建公共特征空间,采用域适应算法或深度度量学习算法实现跨域特征的域对齐或语义对齐,其有效性仅在单一类型的跨域检索任务中进行了验证。提出一种基于深度语义关联学习的方法,以适用多种类型的基于图像的跨域视觉数据检索任务。首先,使用异构网络提取跨域数据的初始视觉特征;然后,通过构建公共特征空间实现初始特征映射,以便进行后续的域对齐和语义对齐;最后,通过域内鉴别性学习、域间一致性学习和跨域相关性学习,消除跨域数据特征之间的异质性,探索跨域数据特征之间的语义相关性,并为检索任务生成鲁棒且统一的特征表示。实验结果表明,该方法在TU-Berlin、IM2MN和MI3DOR数据集中的平均精度均值(mAP)分别达到0.448、0.689和0.874,明显优于对比方法。 展开更多
关键词 跨域检索 特征对齐 域对齐 草图 真实图像 三维模型 相关性学习
在线阅读 下载PDF
结合通道剪枝和通道注意力的轻量型车辆点云补全网络 被引量:1
6
作者 杨晓文 冯泊栋 +3 位作者 韩慧妍 况立群 韩燮 何黎刚 《计算机工程与应用》 北大核心 2025年第1期232-242,共11页
针对现有的点云补全网络多关注于补全的精度而忽视补全效率问题,提出了一种轻量型点云补全网络来准确、高效地修复自动驾驶中的不完整车辆点云。为了提高网络推理效率,采用一种高效的一次性通道剪枝技术提高网络的补全效率;在特征提取阶... 针对现有的点云补全网络多关注于补全的精度而忽视补全效率问题,提出了一种轻量型点云补全网络来准确、高效地修复自动驾驶中的不完整车辆点云。为了提高网络推理效率,采用一种高效的一次性通道剪枝技术提高网络的补全效率;在特征提取阶段,网络加入通道注意力模块,将加权特征与全局特征拼接,通过两层多维特征信息提取,得到最终的特征向量;将特征向量传入双解码器结构中,分别通过全连接层和多层感知机生成稠密的粗糙点云和输入点云偏差值;将粗糙点云与输入点云偏差值相加得到最终的精细化完整点云。在PCN数据集和KITTI数据集上进行实验,实验结果表明在补全缺失车辆信息的实时性上有着显著的提升,并且在补全精度上也有不错的表现。 展开更多
关键词 点云补全 通道剪枝 通道注意力 轻量型 深度学习
在线阅读 下载PDF
基于形状语法的城市场景建模
7
作者 熊风光 李文清 +3 位作者 朱新杰 谢帅康 宋宁栋 王廷凤 《计算机工程与设计》 北大核心 2025年第3期673-681,共9页
为提高虚拟城市场景建模的灵活性和高效性,提出一种基于形状语法的过程式城市场景建模方法。该方法作用于初始大小的网格图形,使初始网格经由一系列形状规则的递推过程和路径规划等,完成路网生成和道路分级规划;实施原创性设计策略,通... 为提高虚拟城市场景建模的灵活性和高效性,提出一种基于形状语法的过程式城市场景建模方法。该方法作用于初始大小的网格图形,使初始网格经由一系列形状规则的递推过程和路径规划等,完成路网生成和道路分级规划;实施原创性设计策略,通过定义不同模型生成的形状语法规则,过程式自动生成城市场景。实验结果表明,基于形状语法的过程式城市场景建模方法可以灵活、高效构建城市场景,具有一定研究意义。 展开更多
关键词 过程式建模 形状语法 网格细分 路网生成 路径规划 三维模型生成 城市规划
在线阅读 下载PDF
融合人群移动轨迹和时空-类别的下一个兴趣点推荐 被引量:1
8
作者 郭秉璇 杨晓文 +3 位作者 孙福盛 况立群 张元 韩慧妍 《计算机工程与应用》 北大核心 2025年第2期316-326,共11页
下一个兴趣点推荐(next POI recommendation)作为基于位置社交网络的主要应用之一,为用户和服务提供商带来了显著的实用价值。现有的POI推荐模型主要依赖于目标用户的历史签到数据进行推荐,没有充分利用其他用户移动轨迹数据的潜在价值... 下一个兴趣点推荐(next POI recommendation)作为基于位置社交网络的主要应用之一,为用户和服务提供商带来了显著的实用价值。现有的POI推荐模型主要依赖于目标用户的历史签到数据进行推荐,没有充分利用其他用户移动轨迹数据的潜在价值,也未有效提取和融合时空-类别信息的特征。为了解决上述问题,提出了一种融合人群移动轨迹和时空-类别的下一个兴趣点推荐模型(GGCN-STC)。依据用户的移动轨迹构建区域轨迹图,提出了门控图卷积神经网络对共同移动轨迹进行建模;将签到序列中的时空-类别信息进行多维度的特征融合;利用自注意力机制捕获用户偏好,为用户提供更准确的POI推荐。在两个真实数据集上进行实验比较与分析,结果表明该模型优于其他模型。 展开更多
关键词 兴趣点推荐 门控图卷积神经网络 自注意力机制 时空网络
在线阅读 下载PDF
基于自编码器的人群异常行为检测算法
9
作者 王玉 杨晓文 +3 位作者 孙福盛 况立群 韩慧妍 张元 《计算机工程与设计》 北大核心 2025年第3期779-787,共9页
为提高人群异常行为检测算法性能,以STEAL-Net为基础,提出一种融合全局时空特征的自编码器人群异常行为检测算法。在编码器进行特征提取时,将全局跨通道特征提取模块与三维卷积结合,减少全局上下文特征的缺失;将提取到的特征序列输入到... 为提高人群异常行为检测算法性能,以STEAL-Net为基础,提出一种融合全局时空特征的自编码器人群异常行为检测算法。在编码器进行特征提取时,将全局跨通道特征提取模块与三维卷积结合,减少全局上下文特征的缺失;将提取到的特征序列输入到全局时空信息增强模块,进一步对视频帧的全局时空特征进行有效提取;进入解码器对输入帧进行重构,利用重构误差大小对异常行为进行检测。该算法在公开数据集UCSD Ped1、UCSD Ped2和ShanghaiTech上与其它先进方法进行了AUC指标的比较,实验结果表明所提算法的有效性。 展开更多
关键词 人群异常行为检测 自编码器 全局上下文 全局时空特征 重构 全局跨通道特征提取模块 全局时空信息增强模块
在线阅读 下载PDF
基于激光雷达的多目标路径规划算法
10
作者 韩慧妍 郑心怡 +2 位作者 况立群 杨晓文 韩燮 《激光与红外》 北大核心 2025年第7期1029-1037,共9页
随着人工智能技术的发展和机器人技术的进步,路径规划问题受到越来越多的关注。强化学习由于无需训练数据、泛化能力强,被广泛应用于移动机器人目标路径规划,虽然取得了一些成果,仍存在一系列挑战,包括多目标路径规划算法较少、有效经... 随着人工智能技术的发展和机器人技术的进步,路径规划问题受到越来越多的关注。强化学习由于无需训练数据、泛化能力强,被广泛应用于移动机器人目标路径规划,虽然取得了一些成果,仍存在一系列挑战,包括多目标路径规划算法较少、有效经验利用率低、环境奖励稀疏和模型收敛困难,为了解决这些问题,本文首次将柔性动作-评价算法(Soft Actor-Critic,SAC)应用于多目标路径规划,并提出了一种基于优先经验回放和专家经验柔性动作评价的多目标路径规划方法。基于优先经验回放的策略提高了有效数据的采样效率。通过优化奖励函数使机器人在执行每个动作后都能从环境中得到及时合理的反馈,解决SAC算法易陷入局部最优的问题。基于专家经验进行模仿学习,提高强化学习的训练效率,提升模型收敛速度。最后,在ROS平台上进行多目标路径规划仿真,结果表明,相较于多目标SAC算法,本文提出的算法在包含障碍物的简单和复杂环境中都可以加速收敛,且能够生成更短、更平滑、无碰撞的路径。 展开更多
关键词 路径规划 多目标 优先经验回放 专家经验
在线阅读 下载PDF
基于注意力机制的传感器标定算法
11
作者 张志强 熊风光 +2 位作者 孔煜 申超凡 胡明月 《计算机工程与设计》 北大核心 2025年第5期1494-1502,共9页
针对传感器标定算法当中存在的特征提取不充分、跨模态特征关联不可靠的问题,提出一种基于注意力机制的传感器标定算法。融合多尺度特征信息,增强特征的语义信息;利用注意力模块进行不同模态间的特征关联,完成特征匹配;通过参数回归模... 针对传感器标定算法当中存在的特征提取不充分、跨模态特征关联不可靠的问题,提出一种基于注意力机制的传感器标定算法。融合多尺度特征信息,增强特征的语义信息;利用注意力模块进行不同模态间的特征关联,完成特征匹配;通过参数回归模块计算旋转和平移参数,获得预测的外部参数,代表初始外在参数和真实外在参数的误差。实验结果表明,提出的算法比RegNet等方法具有更好的标定性能和泛化能力,特别是平移预测的误差平均值相较于对比方法中最好的结果提升了2.03 cm的精度。 展开更多
关键词 三维点云 RGB图像 深度学习 外部标定 激光雷达 刚体变换 注意力机制
在线阅读 下载PDF
基于自注意力和曲率的点云生成对抗网络
12
作者 申超凡 熊风光 +2 位作者 孔煜 张志强 胡明月 《计算机工程与设计》 北大核心 2025年第7期1890-1897,共8页
为生成更精细的三维点云数据,提高模型的训练效率,研究生成对抗网络在三维领域的应用,提出一种基于自注意力和曲率的点云生成对抗网络。该模型能够更好捕捉点云数据的全局和局部特征,提高生成器生成真实点云数据的能力。通过对比实验验... 为生成更精细的三维点云数据,提高模型的训练效率,研究生成对抗网络在三维领域的应用,提出一种基于自注意力和曲率的点云生成对抗网络。该模型能够更好捕捉点云数据的全局和局部特征,提高生成器生成真实点云数据的能力。通过对比实验验证了提出方法的有效性,相比目前最优的几个GAN模型,JSD、MMD和COV这3类指标均得到了改善。实验结果表明,所提方法在点云生成任务中取得了明显改进,为点云数据生成领域的研究和应用提供了一种思路和方法。 展开更多
关键词 三维点云 深度学习 生成对抗网络 生成模型 注意力机制 曲率 概率分布
在线阅读 下载PDF
基于深度位置感知Transformer的低重叠点云配准
13
作者 孔煜 熊风光 +2 位作者 张志强 申超凡 胡明月 《计算机科学》 北大核心 2025年第5期199-211,共13页
针对特征提取阶段忽视局部几何嵌入的融合,特征交互阶段低重叠点云对之间的位置感知信息呈现弱相关性导致难以提取更富有表现力的特征,以及对应生成阶段出现部分错误对应导致求解的变换矩阵存在偏差等问题,提出了一种基于深度位置感知Tr... 针对特征提取阶段忽视局部几何嵌入的融合,特征交互阶段低重叠点云对之间的位置感知信息呈现弱相关性导致难以提取更富有表现力的特征,以及对应生成阶段出现部分错误对应导致求解的变换矩阵存在偏差等问题,提出了一种基于深度位置感知Transformer(DeepPAT)的三维点云低重叠配准方法。首先,设计了融合局部几何信息的局部特征提取网络,用于提取点云多层次特征;然后,设计了基于深度位置感知的Transformer(PAT)模块,通过学习点云自身和跨帧的几何和深度空间位置信息,提取低重叠率的源点云和目标点云的相关特征和重叠信息,以便进行低重叠特征匹配;最后,设计了由特征相似性项调节的极大团算法来减轻长度一致性所带来的空间模糊性,从而过滤离群点。其可作为一种即插即用的估计模块代替RANSAC等传统鲁棒估计器。在室内3DMatch数据集和合成ModelNet数据集上进行评估,实验结果表明:在测试ModelNet数据集的旋转和平移均方根误差方面,DeepPAT分别将误差降低至3.994和0.005;在测试3DMatch和3DLoMatch基准的配准召回率方面,DeepPAT分别比现有方法高出至少4.3%和3.6%。 展开更多
关键词 低重叠率 极大团 局部特征提取 深度位置感知 局部到全局匹配
在线阅读 下载PDF
基于YOLOv7-RSobb的遥感图像定向包围框目标检测
14
作者 梁琦 杨晓文 +1 位作者 巩青歌 曹亚明 《火力与指挥控制》 北大核心 2025年第4期141-149,共9页
针对遥感图像中水平包围框检测对于长宽比例较大的目标容易引入大量背景噪声,以及无法表现目标方向信息的问题,提出了YOLOv7-RSobb算法。在YOLOv7的基础上实现了定向包围框目标检测,解决了PoA和EoE问题,并提出了GS-ELAN模块,最后,使用Wi... 针对遥感图像中水平包围框检测对于长宽比例较大的目标容易引入大量背景噪声,以及无法表现目标方向信息的问题,提出了YOLOv7-RSobb算法。在YOLOv7的基础上实现了定向包围框目标检测,解决了PoA和EoE问题,并提出了GS-ELAN模块,最后,使用Wise-IoU损失函数来提高mAP。结果表明,该算法在DOTA和DIOR数据集上的mAP达到了73.4%和70.3%,相较于其他主流算法有了明显提升。 展开更多
关键词 遥感图像 目标检测 环形平滑标签 YOLOv7-RSobb GS-ELAN Wise-IoU
在线阅读 下载PDF
基于改进特征融合和区域生成网络的Mask R-CNN的管件分拣研究 被引量:1
15
作者 韩慧妍 吴伟州 +1 位作者 王文俊 韩燮 《应用科学学报》 CAS CSCD 北大核心 2023年第5期840-854,共15页
针对管件分割任务中各类管件区分难度大,光线和阴影对分割精度存在干扰等问题,提出了一种改进的掩膜区域卷积神经网络(mask region-convolutional neural network,Mask R-CNN)的管件分拣算法。通过增加低层特征图以改进特征融合网络,提... 针对管件分割任务中各类管件区分难度大,光线和阴影对分割精度存在干扰等问题,提出了一种改进的掩膜区域卷积神经网络(mask region-convolutional neural network,Mask R-CNN)的管件分拣算法。通过增加低层特征图以改进特征融合网络,提高小型管件的识别率;根据管件尺寸比例改进区域生长网络的生成框,以加快模型收敛速度;增加通道和空间注意力模块,提升管件识别精度及掩膜效果。将改进后的Mask R-CNN用于四类管件的分拣任务,实验结果表明,改进后Mask R-CNN的掩膜检测平均精度均值(mean average precision, mAP)和平均召回率(mean recall, mRecall)值分别提高了1.5%和1.7%,对管件位置、类型和尺寸的判别能力更强,能够满足实际生产中机器人分拣管件的精度要求。 展开更多
关键词 管件分拣 低层特征 区域生成网络 混合注意力机制 实例分割
在线阅读 下载PDF
融合CNN-BiGRU和注意力机制的网络入侵检测模型 被引量:15
16
作者 杨晓文 张健 +1 位作者 况立群 庞敏 《信息安全研究》 CSCD 北大核心 2024年第3期202-208,共7页
为提高网络入侵检测模型特征提取能力和分类准确率,提出了一种融合双向门控循环单元(CNN-BiGRU)和注意力机制的网络入侵检测模型.使用CNN有效提取流量数据集中的非线性特征;双向门控循环单元(BiGRU)提取数据集中的时序特征,最后融合注... 为提高网络入侵检测模型特征提取能力和分类准确率,提出了一种融合双向门控循环单元(CNN-BiGRU)和注意力机制的网络入侵检测模型.使用CNN有效提取流量数据集中的非线性特征;双向门控循环单元(BiGRU)提取数据集中的时序特征,最后融合注意力机制对不同类型流量数据通过加权的方式进行重要程度的区分,从而整体提高该模型特征提取与分类的性能.实验结果表明:其整体精确率比双向长短期记忆网络(BiLSTM)模型提升了2.25%.K折交叉验证结果表明:该模型泛化性能良好,避免了过拟合现象的发生,印证了该模型的有效性与合理性. 展开更多
关键词 网络入侵检测 卷积神经网络 双向门控循环单元 注意力机制 深度学习
在线阅读 下载PDF
基于共形几何的面部模型插值构建算法
17
作者 庞敏 张元 +2 位作者 熊风光 焦世超 霍昕恬 《计算机工程与设计》 北大核心 2024年第3期874-881,共8页
针对传统三维模型构建方法难以获取连续维度的高质量面部模型问题,提出一种以不同表情的多面部模型为数据源基于共形几何的面部模型插值构建技术。利用准共形映射算法将面部模型降维到二维平面;提出一种插值算法对多模型形状特征进行线... 针对传统三维模型构建方法难以获取连续维度的高质量面部模型问题,提出一种以不同表情的多面部模型为数据源基于共形几何的面部模型插值构建技术。利用准共形映射算法将面部模型降维到二维平面;提出一种插值算法对多模型形状特征进行线性插值,为构建过渡模型定义几何约束,同时提出一种自适应模型选择算法在数据源中自适应选择基础模型;通过几何约束引导准共形迭代改变基础模型形状;将变化后的二维模型转化到三维空间,构建具有过渡表情的三维面部模型。实验结果表明,该算法的有效性和运行效率都得到大幅提高。 展开更多
关键词 三维面部模型 建模 插值 降维 几何约束 共形几何 准共形迭代
在线阅读 下载PDF
顾及多尺度监督的点云语义分割 被引量:2
18
作者 文阳晖 杨晓文 +3 位作者 张元 韩燮 况立群 薛红新 《激光与红外》 CAS CSCD 北大核心 2024年第2期185-192,共8页
针对复杂场景点云分割精度不高、神经网络隐藏单元缺乏直接监督,难以提取语义明确的点云特征等问题,提出了一种将多尺度监督和SCF-Net相结合的点云语义分割网络。首先构建了一个类别信息生成模块,记录编码器中隐藏单元感受野内的类别,... 针对复杂场景点云分割精度不高、神经网络隐藏单元缺乏直接监督,难以提取语义明确的点云特征等问题,提出了一种将多尺度监督和SCF-Net相结合的点云语义分割网络。首先构建了一个类别信息生成模块,记录编码器中隐藏单元感受野内的类别,用于解码器中辅助分类器的监督学习。其次将解码阶段的点云类别预测任务分解成一系列点云感受野类别预测任务,通过对解码器中每一层添加辅助分类器,预测当前阶段点云感受野类别,编码阶段生成的类别信息作为标签监督网络学习。模型从粗到细地推理点云感受野类别,最终预测得到点云语义标签。实验结果表明,该方法能够有效提取点云关键信息,提高语义分割精度。 展开更多
关键词 三维点云 语义分割 多尺度监督 深度学习 SCF-Net
在线阅读 下载PDF
基于YOLOv8L遥感图像旋转目标检测 被引量:2
19
作者 韩慧妍 张秀权 +2 位作者 况立群 韩燮 杨晓文 《激光与红外》 CAS CSCD 北大核心 2024年第9期1462-1468,共7页
针对遥感图像复杂背景下的目标(如船舶、飞机等)具有朝向任意、尺度变化较大、数量多、目标排列密集等特点,提出一种基于改进YOLOv8L的旋转目标检测算法,用带有角度的旋转框能够更加精确定位目标。首先,在网络Head部分增加解耦角度预测... 针对遥感图像复杂背景下的目标(如船舶、飞机等)具有朝向任意、尺度变化较大、数量多、目标排列密集等特点,提出一种基于改进YOLOv8L的旋转目标检测算法,用带有角度的旋转框能够更加精确定位目标。首先,在网络Head部分增加解耦角度预测头,预测目标的角度信息;其次,融合坐标注意力机制模块提高模型抑制噪声的能力;最后,在Neck部分引入自适应空间特征融合模块,抑制不同尺度特征图之间融合特征信息时的不一致性,保留有效的信息并进行融合。实验结果表明,所提算法在DOTA数据集上的检测精度达到了73.85%,较原有YOLOv8L模型提升了3.53%。 展开更多
关键词 旋转目标检测 注意力机制 解耦预测头 YOLO
在线阅读 下载PDF
基于全局双线性注意力的红外视频行为识别 被引量:1
20
作者 欧阳楠楠 况立群 +3 位作者 谢剑斌 韩慧妍 曹亚明 王飞 《激光与红外》 CAS CSCD 北大核心 2024年第3期431-439,共9页
针对红外视频缺少纹理细节特征以致在人体行为识别中难以兼顾计算复杂度与识别准确率的问题,提出一种基于全局双线性注意力的红外视频行为识别方法。为高效计算红外视频中的人体行为,设计基于两级检测网络的关节点提取模块来获得人体关... 针对红外视频缺少纹理细节特征以致在人体行为识别中难以兼顾计算复杂度与识别准确率的问题,提出一种基于全局双线性注意力的红外视频行为识别方法。为高效计算红外视频中的人体行为,设计基于两级检测网络的关节点提取模块来获得人体关节点信息,创新性地将所形成的关节点三维热图作为红外视频人体行为识别网络的输入特征;为了在轻量化计算的基础上进一步提升识别准确率,提出一种全局双线性注意力的三维卷积网络,从空间和通道两个维度提升注意力的建模能力,捕获全局结构信息。在InfAR和IITR IAR数据集上的实验结果表明,该方法在红外视频行为识别中的有效性。 展开更多
关键词 红外视频 注意力 关节点 行为识别
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部