期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向多目标协同搜索的多无人船模糊满意强化学习方法
1
作者
胡超芳
朱琦
《天津大学学报(自然科学与工程技术版)》
北大核心
2025年第11期1132-1144,共13页
无人船因其高效率、低成本、强抗风险的特点,被广泛应用于各种复杂环境中执行海洋任务.针对多无人船在未知水域内的多目标协同搜索问题,提出了一种基于模糊满意多指标优化和双经验回放池的改进强化学习方法.首先构建了包含环境认知度和...
无人船因其高效率、低成本、强抗风险的特点,被广泛应用于各种复杂环境中执行海洋任务.针对多无人船在未知水域内的多目标协同搜索问题,提出了一种基于模糊满意多指标优化和双经验回放池的改进强化学习方法.首先构建了包含环境认知度和目标存在概率两个信息指标的二维栅格环境地图.其次针对单经验回放池随机采样数据训练效率低的问题,提出使用双经验回放池分类存储数据,为提高初期训练速度和后期稳定性,按照时变比例分别调用数据改进训练.此外,为实现对目标的快速搜索,同时保证搜索区域的覆盖度和无人船间的安全避撞,提出了目标存在概率变化量、环境搜索覆盖度和无人船分布距离3个奖励函数.为满足3个奖励函数重要性等级要求,使用基于松弛优先级满意度的模糊多指标优化方法对奖励函数进行重新建模,从而形成了改进模糊满意D3QN算法.最后,对所提算法的有效性和不同数量目标搜索任务的适用性进行仿真验证,证实了算法可以满足设计要求.同时,考虑到无人船实际底层控制误差对上层搜索算法的影响,将所提模糊满意强化学习算法用做上层规划与下层线性自抗扰控制结合,进行了多目标协同搜索的应用仿真验证,并与其他强化学习方法进行了对比.结果表明:使用所提算法不但可以对环境内的多个未知目标实现快速有效搜索,而且可以有效适应实际控制误差的存在,所提算法在搜索速度、环境搜索覆盖度和无人船分布性上均优于对比算法.
展开更多
关键词
无人船
协同搜索
强化学习
模糊满意优化
线性自抗扰控制
在线阅读
下载PDF
职称材料
题名
面向多目标协同搜索的多无人船模糊满意强化学习方法
1
作者
胡超芳
朱琦
机构
天津大学电气自动化与信息工程学院
出处
《天津大学学报(自然科学与工程技术版)》
北大核心
2025年第11期1132-1144,共13页
基金
天津市自然科学基金重点项目(23JCZDJC01140).
文摘
无人船因其高效率、低成本、强抗风险的特点,被广泛应用于各种复杂环境中执行海洋任务.针对多无人船在未知水域内的多目标协同搜索问题,提出了一种基于模糊满意多指标优化和双经验回放池的改进强化学习方法.首先构建了包含环境认知度和目标存在概率两个信息指标的二维栅格环境地图.其次针对单经验回放池随机采样数据训练效率低的问题,提出使用双经验回放池分类存储数据,为提高初期训练速度和后期稳定性,按照时变比例分别调用数据改进训练.此外,为实现对目标的快速搜索,同时保证搜索区域的覆盖度和无人船间的安全避撞,提出了目标存在概率变化量、环境搜索覆盖度和无人船分布距离3个奖励函数.为满足3个奖励函数重要性等级要求,使用基于松弛优先级满意度的模糊多指标优化方法对奖励函数进行重新建模,从而形成了改进模糊满意D3QN算法.最后,对所提算法的有效性和不同数量目标搜索任务的适用性进行仿真验证,证实了算法可以满足设计要求.同时,考虑到无人船实际底层控制误差对上层搜索算法的影响,将所提模糊满意强化学习算法用做上层规划与下层线性自抗扰控制结合,进行了多目标协同搜索的应用仿真验证,并与其他强化学习方法进行了对比.结果表明:使用所提算法不但可以对环境内的多个未知目标实现快速有效搜索,而且可以有效适应实际控制误差的存在,所提算法在搜索速度、环境搜索覆盖度和无人船分布性上均优于对比算法.
关键词
无人船
协同搜索
强化学习
模糊满意优化
线性自抗扰控制
Keywords
unmanned surface vessel(USV)
collaborative search
reinforcement learning
fuzzy satisfactory optimization
linear active disturbance rejection control
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
U664.82 [交通运输工程—船舶及航道工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向多目标协同搜索的多无人船模糊满意强化学习方法
胡超芳
朱琦
《天津大学学报(自然科学与工程技术版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部