-
题名未知环境下改进DDQN的无人机探索航迹规划研究
被引量:4
- 1
-
-
作者
唐嘉宁
杨昕
周思达
李罗宇
安城安
-
机构
云南民族大学电气信息工程学院
-
出处
《电光与控制》
CSCD
北大核心
2023年第4期23-27,33,共6页
-
基金
国家自然科学基金(61963038,62063035)。
-
文摘
对未知环境的探索,如搜救、追逃等场景,无人机需要一边探索(感知)环境一边完成当前的航迹规划(动作选择)。针对上述场景,为了提高无人机对未知环境的探索范围,提出了结合长短期记忆的改进深度双Q网络探索航迹规划方法:搭建仿真地图,以无人机视野内的环境信息作为输入,引入长短期记忆网络,输出动作方向的选择;设置探索经验样本优先级,提高训练效率;加入飞行动力学约束,设计合理的状态、动作空间及单步奖励函数。运用所提算法,无人机可以自主规划出一条无碰撞且对环境探索范围大的航迹。仿真实验结果表明:在未知环境下,所提算法得到的探索面积比、单步探索平均奖励值等指标均优于传统的DDQN算法。
-
关键词
无人机
长短期记忆网络
深度双Q网络
未知环境探索
航迹规划
-
Keywords
UAV
Long Short-Term Memory(LSTM)network
Deep Double Q Network(DDQN)
unknown environment exploration
trajectory planning
-
分类号
V249
[航空宇航科学与技术—飞行器设计]
-
-
题名未知环境中无人机自适应边界快速检测算法
被引量:3
- 2
-
-
作者
唐嘉宁
谢翠娟
赵一帆
李孟霜
彭志祥
-
机构
云南民族大学电气信息工程学院
云南民族大学无人自主系统研究院
-
出处
《重庆理工大学学报(自然科学)》
北大核心
2023年第9期180-188,共9页
-
基金
国家自然科学基金项目(61963038)。
-
文摘
边界感知检测是无人机实现自主探索的重要组成部分之一。为了提高在复杂多样的地下狭窄环境中自主探索过程的边界检测效率,提出一种未知环境中的无人机自适应边界快速检测算法(ADPlanner)。通过雷达感知地下隧道未知环境,自适应地调整地下隧道或矿洞环境的局部采样空间,根据环境结构大大提高采样率(添加到RRG中的采样点与采样次数的比值);提出重采样率,以减小相邻时刻自适应采样框的采样点冗余度,进而通过重要性采样策略解决GBPlanner重复区域的过采样问题,实现增量检测。仿真实验表明:在2个不同的未知场景中,与GBPlanner相比,ADPlanner边界检测采样的运行时间减少了20.27%~38.33%,路径长度缩短了11.24%~18.86%,总探索时间缩短了27.38%~38.38%,显著提高了无人机在未知环境下的探索效率。
-
关键词
未知环境探索
自适应采样框
重要性采样
路径规划
SLAM
-
Keywords
unkonow environment exploration
adaptive sampling box
importance sampling
path planning
SLAM
-
分类号
V249
[航空宇航科学与技术—飞行器设计]
-
-
题名基于改进多智能体PPO的多无人机协同探索方法
被引量:2
- 3
-
-
作者
安城安
周思达
-
机构
云南民族大学电气信息工程学院
-
出处
《电光与控制》
CSCD
北大核心
2024年第1期51-56,共6页
-
基金
国家自然科学基金(61963038)。
-
文摘
采用多无人机对未知环境进行探索,可以提高探索任务的鲁棒性和执行效率。不同于启发式方法,多智能体深度强化学习方法可以省去人为制定规则的过程,将无人机作为智能体,通过与环境互动,自主习得更加有效的“规则”。搭建了多无人机多线程仿真环境,为多无人机协同训练提供环境,提出一种适应多线程环境的结合长短时循环神经网络(记忆)的共享多智能体近端策略优化(LSTM-MAPPO)方法,并在合作型LSTM-MAPPO方法的基础上增加了全局边界信息以增大每幕探索面积。数值实验结果表明:与现有的多智能体深度确定性策略梯度(MADDPG)方法相比,所提方法在训练后期连续动作下也能稳定收敛;相较于现有的LSTM-MAPPO方法,其最终获得的奖励稳定高于5000;对3种不同的仿真地图,训练完的网络在测试时能实现70%以上的稳定探索面积。
-
关键词
多无人机协同
多智能体深度强化学习
未知环境探索
航迹规划
多线程技术
长短时循环神经网络
-
Keywords
multi-UAV cooperation
multi-agent deep reinforcement learning
exploration of unknown environment
path planning
multi-thread technology
long and short term memory neural network
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
-
-
题名煤矿搜救机器人未知环境高效自主探索方法
- 4
-
-
作者
胡而已
李猛钢
李杭
周益
由韶泽
唐超权
-
机构
应急管理部信息研究院
-
出处
《中国煤炭》
2025年第8期92-103,共12页
-
基金
国家自然科学基金项目(52274159,52304183)
中国博士后科学基金(2022M723392)
江苏省产业前瞻与关键核心技术重点项目(BE2023008-4)。
-
文摘
为了实现对煤矿井下未知环境快速且完备地探索,进而快速开展煤矿灾后等未知环境的探测与救援任务,保证搜救机器人的灾后生存与返航能力,提出一种双阶段视点混合式探索策略(DSVP^(*))。针对传统双阶段视点方法(DSVP)在煤矿颠簸路面、多硐室子空间等特殊场景中存在的路径规划缺陷,重点突破点云地图分割与全局探索机制两大关键技术:基于平面拟合RRT^(*)(PR RRT^(*))的局部路径优化方法,通过点云平面特征提取实现地形适应性路径规划;构建具有引导性的全局路径生成机制,利用环境结构特征提升多分支巷道探索效率。通过仿真环境对比测试表明,DSVP^(*)相较DSVP算法探索效率提升32%,且在多轮对比实验中均达到100%环境覆盖率,显著优于DSVP、NBVP、GBP、MBP等传统方法。在井下巷道复杂地形区域进行了现场试验,结果表明,相比DSVP方法,DSVP^(*)可以更加完整地探索巷道区域,证明了提出的DSVP^(*)在煤矿搜救机器人的自主探索效率与完备性等方面具有更高的工程应用价值。
-
关键词
煤矿搜救机器人
未知环境探索
自主探索
多阶段视点
旅行商
-
Keywords
coal mine search and rescue robot
unknown environment exploration
autonomous exploration
multi-stage viewpoint
traveler issues
-
分类号
TD774
[矿业工程]
TD67
[矿业工程—矿井通风与安全]
TP525
[自动化与计算机技术]
-
-
题名辐射场表面物点引导的主动视图选择
- 5
-
-
作者
谢文想
许威威
-
机构
浙江大学计算机科学与技术学院
-
出处
《图学学报》
北大核心
2025年第1期179-187,共9页
-
基金
浙江省“尖兵”“领雁”研发攻关计划(2023C01181)。
-
文摘
神经辐射场(NeRF)的出现显著提高了新视图渲染和3D重建的质量,但其数据收集过程仍然依赖于人工经验,这限制了在未知环境探索和规划等任务上的应用,因此,如何有效选择最具信息增益的视图变得至关重要,为此提出了一种新的主动视图选择策略。首先,通过体渲染权重获取训练光线投射到场景表面附近的三维点,然后计算每个三维点对于候选视图的可见性,并使用光度置信度加权来衡量候选视图,最终选择可见三维点较少且置信度低的候选视图作为新的训练视图。在Blender数据集上的实验表明,与现有的方法相比,该方法在下一最佳视图和下一批最佳视图选择上分别提高了3.88 dB和5.88 dB的PSNR质量,同时视图选择速度提高近30倍。
-
关键词
神经渲染
神经辐射场
主动视图选择
场景感知
未知环境探索
-
Keywords
neural rendering
neural radiance field
active view selection
scene perception
unknown environment exploration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-