期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于stacking融合机制的自动驾驶伦理决策模型 被引量:1
1
作者 刘国满 盛敬 罗玉峰 《计算机应用研究》 北大核心 2025年第2期462-468,共7页
虽然自动驾驶技术在线路规划和驾驶控制方面取得较大进展,但遇到伦理困境时,当前自动驾驶汽车仍然很难作出确定、合理的决策,导致人们对自动驾驶汽车安全驾驶产生怀疑和担忧。所以有必要研究自动驾驶伦理决策模型和机制,使得自动驾驶汽... 虽然自动驾驶技术在线路规划和驾驶控制方面取得较大进展,但遇到伦理困境时,当前自动驾驶汽车仍然很难作出确定、合理的决策,导致人们对自动驾驶汽车安全驾驶产生怀疑和担忧。所以有必要研究自动驾驶伦理决策模型和机制,使得自动驾驶汽车在伦理困境下能够作出合理决策。针对以上问题,设计了基于stacking融合机制的伦理决策模型,对机器学习和深度学习进行深度融合。一方面将基于特征依赖关系的朴素贝叶斯模型(ACNB)、加权平均一阶贝叶斯模型(WADOE)和自适应模糊模型(AFD)作为stacking融合机制上基学习器。依据先前准确率,设定各自模型权重,再运用加权平均法,计算决策结果。然后将该决策结果作为元学习器训练集,对元学习器进行训练,构建stacking融合模型。最后,运用验证集分别对深度学习模型和stacking融合模型进行验证,依据验证中平均损失率和准确率以及测试中正确率,评价和比较深度学习模型和stacking融合机制决策效果。结果表明,深度学习模型平均损失率最小为0.64,最大平均准确率为0.7,最高正确率为0.61。stacking融合机制平均损失率最小为0.35,最大平均准确率为0.90,最高正确率为0.75,说明stacking融合机制相对于深度学习模型,决策结果准确率和正确率方面有了较大改进。 展开更多
关键词 自动驾驶汽车 伦理决策 stacking融合机制 深度学习
在线阅读 下载PDF
电车难题与自动驾驶系统算法设计中的伦理考量 被引量:7
2
作者 郑戈 《浙江社会科学》 CSSCI 北大核心 2022年第12期37-47,67,156,共13页
自动驾驶汽车是人工智能技术得到全面、综合应用的产业领域,涉及到算法自动化决策与人的自主性和尊严之间的潜在冲突。由于法律本身的回应性和救济性特征,导致它无法提前介入到算法设计过程之中,因而无法为算法设计提供向善的指引。我... 自动驾驶汽车是人工智能技术得到全面、综合应用的产业领域,涉及到算法自动化决策与人的自主性和尊严之间的潜在冲突。由于法律本身的回应性和救济性特征,导致它无法提前介入到算法设计过程之中,因而无法为算法设计提供向善的指引。我国虽然越来越重视人工智能伦理问题,并为此设立了相关机构,制定了相关规则,但关于人工智能伦理的讨论却停留在科技向善、以人为本等抽象原则的层面,没有形成有针对性的自动驾驶汽车算法伦理。本文通过对德国交通与数字基础设施部伦理委员会报告、伦理学中的电车难题讨论和道德心理学领域的“道德机器试验”的介绍和分析,讨论了为自动驾驶汽车装上伦理方向盘的必要性和可能的推进方式。 展开更多
关键词 自动驾驶汽车算法伦理 电车难题 道德机器试验 伦理委员会 伦理原则
在线阅读 下载PDF
人工智能应用“责任鸿沟”的造世伦理跨越——以自动驾驶汽车为典型案例 被引量:12
3
作者 王天恩 《哲学分析》 CSSCI 2022年第1期15-30,196,共17页
以自动驾驶汽车为典型,人工智能应用的“责任鸿沟”成了亟待解决的新问题。责任鸿沟实质上是机器智能体在自主性不断增强但又尚未获得责任主体地位阶段的一种责任无着落现象。随着人工智能越来越普遍的应用,它所带来的责任鸿沟是实践领... 以自动驾驶汽车为典型,人工智能应用的“责任鸿沟”成了亟待解决的新问题。责任鸿沟实质上是机器智能体在自主性不断增强但又尚未获得责任主体地位阶段的一种责任无着落现象。随着人工智能越来越普遍的应用,它所带来的责任鸿沟是实践领域亟待取得突破的理论课题。人工智能的应用将给人类带来目前所能想象到的最大红利,而责任鸿沟则可能构成人工智能应用的瓶颈。在期待人工智能发展带来巨大红利的同时,应对随之而来的归责困境,已是当务之急。跨越人工智能应用的责任鸿沟,关系到人工智能的发展和应用,从而关系到人工智能发展前所未有红利的顺利兑现。人工智能应用中的责任鸿沟,在传统范式中不可能获得合理应对的理论和方法;必须在规则和规律一体化的造世伦理层次,这一鸿沟才可能真正意义上被跨越。造世伦理最基本的特征是整体性、类特性和共同性。以自动驾驶汽车为典型案例,相关责任和义务主要涉及智能设备的设计、使用责任和类群受益者伦理义务两类。如果自动驾驶汽车所发生的事故没有人事行为责任主体,只存在受益者义务问题,相关损失应由自动驾驶汽车受益者以义务的方式承担。人工智能应用责任鸿沟的造世伦理跨越,将使人工智能的应用和相应红利的兑现构成良性循环。 展开更多
关键词 人工智能 责任鸿沟 造世伦理 自动驾驶汽车
在线阅读 下载PDF
自动驾驶汽车事故的道德算法由谁来决定 被引量:15
4
作者 孙保学 《伦理学研究》 CSSCI 北大核心 2018年第2期97-101,共5页
自动驾驶汽车在上路前需要预置某种应对突发事故的道德决策算法,权衡不同对象的生存值,选择最佳的碰撞方案。那么,谁来决定自动驾驶汽车事故的道德算法?目前,学术界已经提出两种相互竞争的解决方案:强制的伦理设定和个人的伦理设定。前... 自动驾驶汽车在上路前需要预置某种应对突发事故的道德决策算法,权衡不同对象的生存值,选择最佳的碰撞方案。那么,谁来决定自动驾驶汽车事故的道德算法?目前,学术界已经提出两种相互竞争的解决方案:强制的伦理设定和个人的伦理设定。前者主张由全社会集体来决定事故算法的伦理设定;后者认为每一位司机或乘客都有权对自己所乘坐的汽车进行伦理设定。按照哥格尔和缪勒的分析,个人的伦理设定很可能导致"囚徒困境",最终造成交通事故不降反升的局面。他们认为,解决"囚徒困境"的唯一办法是采用强制的伦理设定。不过,这种方案同样面临种种困难。强制的伦理设定需要适度改进,加入情境归责的考虑才是更有前景的一种解决方案。 展开更多
关键词 自动驾驶汽车 道德算法 电车难题 道德决策 情境归责
在线阅读 下载PDF
基于UTMD的汽车自动驾驶的路径规划寻优算法 被引量:3
5
作者 李学鋆 《汽车安全与节能学报》 CAS CSCD 2018年第4期449-455,共7页
为在汽车自动驾驶中路径规划中能兼顾运算的实时性和可靠性,设计了一种智能仿生算法的路径寻优算法。该算法基于超声靶向微泡破坏(UTMD)算法的原理。迭代运算分为靶标圈定、微泡迭代、微小核糖核酸(miRNAs)迭代。圈定靶标,以便有效减小... 为在汽车自动驾驶中路径规划中能兼顾运算的实时性和可靠性,设计了一种智能仿生算法的路径寻优算法。该算法基于超声靶向微泡破坏(UTMD)算法的原理。迭代运算分为靶标圈定、微泡迭代、微小核糖核酸(miRNAs)迭代。圈定靶标,以便有效减小路径搜索范围。利用非线性函数Rastrigin对该算法进行验证。分析了迭代次数的设定方式,并采用程序自检的方式进行自行跳转。将该算法运用到二维路径规划中,并在Matlab中进行模拟。结果表明:与Dijkstra算法相比,该UTMD算法所规划的路径长度缩减4.52%。因此,该算法可有效地应用于汽车自动驾驶。 展开更多
关键词 自动驾驶汽车 路径规划 超声靶向微泡破坏(UTMD)算法 算法设计 靶标圈定 微小核糖核酸(miRNAs)
在线阅读 下载PDF
智能型自动驾驶系统的多源信息融合算法 被引量:6
6
作者 易正俊 黄翰敏 +1 位作者 黄席樾 廖传锦 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第2期41-44,59,共5页
利用模糊积分方法融合高速公路上智能自动驾驶的多源信息 ,确定汽车应采用的安全运行模式 ,使之经过专家系统的知识推理 ,调整汽车运行中的可控参数值 ,为建立智能型自动驾驶系统奠定了基础 ,并为具体实现智能型自动驾驶系统创造了重要... 利用模糊积分方法融合高速公路上智能自动驾驶的多源信息 ,确定汽车应采用的安全运行模式 ,使之经过专家系统的知识推理 ,调整汽车运行中的可控参数值 ,为建立智能型自动驾驶系统奠定了基础 ,并为具体实现智能型自动驾驶系统创造了重要条件 ,进而避免交通事故发生 ,提高道路的通行能力。 展开更多
关键词 智能型自动驾驶系统 算法 多源信息融合 模糊积分 高速公路 机动车 汽车驾驶 交通管理
在线阅读 下载PDF
多传感器融合的自动驾驶汽车制动主动控制 被引量:8
7
作者 李明杰 刘小飞 张跃进 《机械设计与制造》 北大核心 2023年第5期170-173,177,共5页
针对目前方法进行汽车制动主动控制时,存在控制时间长、丢包率高以及控制的误差大的问题,提出多传感器融合的自动驾驶汽车制动主动控制。该方法首先建立了数据的支撑裕矩阵,通过多传感器融合算法对汽车的传感器监测信息进行融合处理。... 针对目前方法进行汽车制动主动控制时,存在控制时间长、丢包率高以及控制的误差大的问题,提出多传感器融合的自动驾驶汽车制动主动控制。该方法首先建立了数据的支撑裕矩阵,通过多传感器融合算法对汽车的传感器监测信息进行融合处理。依据融合后的信息设计控制器,使用自适应遗传算法优化控制器参数。最后将监测信息输入优化的控制器中实现汽车制动主动控制。仿真测试结果表明,运用该方法主动控制自动驾驶汽车进行制动的时间较短且丢包率较低。 展开更多
关键词 多传感器 融合算法 自动驾驶汽车 制动主动控制
在线阅读 下载PDF
复杂环境下智能汽车自动驾驶系统研究 被引量:14
8
作者 李盛福 《机械设计与制造》 北大核心 2019年第5期199-203,207,共6页
为了提高智汽车的驾驶安全性,研究了智能汽车自动驾驶系统,包括路径规划和跟踪两个方面。对于路径规划,在传统RRT算法基础上,将路径转角引入度量函数中,实现了对距离和平滑性的综合度量;将目标偏向策略和相向扩展策略引入到扩展方法中,... 为了提高智汽车的驾驶安全性,研究了智能汽车自动驾驶系统,包括路径规划和跟踪两个方面。对于路径规划,在传统RRT算法基础上,将路径转角引入度量函数中,实现了对距离和平滑性的综合度量;将目标偏向策略和相向扩展策略引入到扩展方法中,将随机扩展改进为启发扩展,从而提出了CE-RRT算法,经仿真验证,CE-RRT算法不仅提高了路径规划成功率,而且缩短了规划时间。对于路径跟踪,建立了车辆路径跟踪的线性时变误差模型,设计了线性时变模型预测控制器,通过仿真验证,控制器可以实现对直线路径的完全跟踪,对圆形路径也有很高的跟踪精度。 展开更多
关键词 智能汽车 自动驾驶系统 CE-RRT算法 目标偏向策略 相向扩展策略 线性时变模型预测控制器
在线阅读 下载PDF
基于双估计强化学习结合前向预测控制的自动驾驶运动控制研究 被引量:3
9
作者 杜国栋 邹渊 +2 位作者 张旭东 孙文景 孙巍 《汽车工程》 EI CSCD 北大核心 2024年第4期564-576,共13页
运动控制研究是实现自动驾驶目标的重要组成部分,针对传统强化学习算法在求解中因单步决策局限而导致控制序列次优的问题,提出了一种基于双估计强化学习算法及前向预测控制方法结合的运动控制框架(DEQL-FPC)。在该框架中引入双估计器以... 运动控制研究是实现自动驾驶目标的重要组成部分,针对传统强化学习算法在求解中因单步决策局限而导致控制序列次优的问题,提出了一种基于双估计强化学习算法及前向预测控制方法结合的运动控制框架(DEQL-FPC)。在该框架中引入双估计器以解决传统强化学习方法动作值过估计问题并提高训练优化的速度,设计前向预测多步决策方法替代传统强化学习的单步决策,以有效提高全局控制策略的性能。通过虚拟驾驶环境仿真,证明了该控制框架应用在自动驾驶汽车的路径跟踪以及安全避障的优越性,保证了运动控制中的精确性、安全性、快速性以及舒适性。 展开更多
关键词 自动驾驶汽车 运动控制优化 双估计强化学习算法 前向预测控制方法
在线阅读 下载PDF
自动驾驶汽车产品缺陷的认定困境与因应 被引量:27
10
作者 郑志峰 《浙江社会科学》 CSSCI 北大核心 2022年第12期48-58,156,157,共13页
相较于机动车交通事故责任,产品责任在解决自动驾驶汽车责任分担方面更具共识与优势,既高度契合自动驾驶汽车的事故特点,又可以直接督促生产者一方提高产品安全性能,并且能够更好地救济受害人和分散风险。自动驾驶汽车产品缺陷的认定面... 相较于机动车交通事故责任,产品责任在解决自动驾驶汽车责任分担方面更具共识与优势,既高度契合自动驾驶汽车的事故特点,又可以直接督促生产者一方提高产品安全性能,并且能够更好地救济受害人和分散风险。自动驾驶汽车产品缺陷的认定面临技术与法律层面的诸多障碍,当前并无成熟的技术标准可供适用,而消费者期待标准与风险效用标准也各自存在适用困境。理性算法标准将注意义务对准自动驾驶系统本身,充分挖掘产品设计缺陷背后的过失属性,契合自动驾驶汽车的技术特征,增加了受害人救济的可能,同时也稀释了产品缺陷的负面评价,可以很好地缓解设计缺陷的认定难题。理性算法标准的适用需要区分不同阶段的自动驾驶汽车、不同类型的危险,同时应从功能安全、预期功能安全以及网络和数据安全三方面更新技术标准,完善生产者一方的警示义务与跟踪观察义务。 展开更多
关键词 自动驾驶汽车 产品责任 设计缺陷 理性算法标准 技术标准
在线阅读 下载PDF
人工和自动混合驾驶环境下的最优道路拥堵收费模型 被引量:1
11
作者 李浩 康柳江 +2 位作者 罗斯达 孙会君 吴建军 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期747-756,共10页
为了得到自动驾驶汽车(CAV)与人工驾驶汽车(HDV)并存条件下最优道路收费方案,针对CAV在道路上的通行能力,特别是对道路容量产生的影响进行量化分析,获得道路容量与HDV流量和CAV流量之间的非线性关系。然后,对传统的美国公路局路阻函数... 为了得到自动驾驶汽车(CAV)与人工驾驶汽车(HDV)并存条件下最优道路收费方案,针对CAV在道路上的通行能力,特别是对道路容量产生的影响进行量化分析,获得道路容量与HDV流量和CAV流量之间的非线性关系。然后,对传统的美国公路局路阻函数进行改进,并基于改进后的路阻函数,建立系统最优(systemoptimal,SO)流量分配模型,对不同CAV占比条件下和不同HDV与CAV安全车距比值条件下的交通流进行系统最优分配。采用Frank-Wolfe算法,对SO模型进行求解,并考虑因HDV而产生的额外道路出行成本对不同条件下系统最优分配结果的差异性进行比较。基于最优收费理论,针对不同规模道路网制定相应的收费方案。最后,将模型与算法应用到Nguyen-Dupuis交通网络中。结果表明,在HDV与CAV并存条件下,以系统最优分配结果下的边际成本进行收费是道路交通系统最优拥堵收费方案,可作为HDV与CAV并存条件下道路收费方案设计的依据。 展开更多
关键词 自动驾驶汽车 道路网络 美国公路局路阻函数 系统最优分配 Frank-Wolfe算法 拥堵收费
在线阅读 下载PDF
基于多尺度混合注意力机制卷积神经网络的伦理决策模型设计 被引量:2
12
作者 刘国满 罗玉峰 +1 位作者 盛敬 陶珍 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第12期92-97,共6页
针对目前自动驾驶汽车伦理困境下很难做出确定、合理的决策,阻碍了自动驾驶技术的问题,设计了一种基于多尺度混合注意力机制卷积神经网络的自动驾驶汽车伦理决策模型。首先,依据卷积神经网络结构和功能以及伦理困境特点,设计卷积神经网... 针对目前自动驾驶汽车伦理困境下很难做出确定、合理的决策,阻碍了自动驾驶技术的问题,设计了一种基于多尺度混合注意力机制卷积神经网络的自动驾驶汽车伦理决策模型。首先,依据卷积神经网络结构和功能以及伦理困境特点,设计卷积神经网络训练模型和参数,运用训练集中伦理困境对该训练模型进行训练,构建多尺度混合注意力机制卷积神经网络模型;然后,运用测试集中伦理困境对该卷积神经网络模型进行测试和验证。结果表明:多尺度卷积神经网络模型相对于传统卷积神经网络,准确率方面有了较大改进,加入注意力机制卷积神经网络模型相对于未加入模型,稳定性得到加强;多尺度混合注意力机制卷积神经网络模型的准确率和稳定性都较高,最高准确率达到了89%。 展开更多
关键词 交通工程 自动驾驶汽车 伦理决策 注意力机制 卷积神经网络
在线阅读 下载PDF
BEV特征下激光雷达和单目相机融合的目标检测算法研究 被引量:2
13
作者 李文礼 喻飞 +2 位作者 石晓辉 唐远航 杨果 《计算机工程与应用》 CSCD 北大核心 2024年第11期182-193,共12页
为提高自动驾驶汽车对周围目标物的检测精度,提出了一种激光雷达和单目图像数据在鸟瞰图特征上融合的目标物检测算法(monocular-bird’s eye view fusion,Mono-BEVFusion)。为构建相机BEV特征,搭建了简单高效的深度预测网络预测相机特... 为提高自动驾驶汽车对周围目标物的检测精度,提出了一种激光雷达和单目图像数据在鸟瞰图特征上融合的目标物检测算法(monocular-bird’s eye view fusion,Mono-BEVFusion)。为构建相机BEV特征,搭建了简单高效的深度预测网络预测相机特征的深度,基于显式监督的方法用深度真值对其进行监督。构建激光雷达BEV特征时,将激光点云体素化为柱状网格转化到BEV特征下,设计BEV特征融合网络将激光点云BEV特征和相机BEV特征融合,将融合特征输入到目标检测框架得到目标物(汽车、行人和骑行人)检测结果。利用KITTI数据集和实车路采数据对Mono-BEVFusion融合算法进行评估,实验结果表明该算法相较于现有融合算法综合平均精度提升了2.90个百分点,其中汽车类和行人类单项检测精度分别提升3.38个百分点和4.13个百分点。Mono-BEVFusion融合算法对遮挡目标或者距离较远的目标有较稳定的检测效果,能够有效避免单传感器的漏检现象,具有较好的实际应用价值。 展开更多
关键词 自动驾驶汽车 目标物检测算法 深度预测 BEV特征融合 KITTI数据集
在线阅读 下载PDF
智能汽车决策中的驾驶行为语义解析关键技术 被引量:6
14
作者 李国法 陈耀昱 +3 位作者 吕辰 陶达 曹东璞 成波 《汽车安全与节能学报》 CAS CSCD 2019年第4期391-412,共22页
实现对驾驶行为语义的精准解析是进一步提升自动驾驶汽车智能化水平的核心技术之一。该文总结了驾驶行为研究的体系架构;回顾了驾驶行为语义解析发展的4个阶段,包括跟驰及换道模型建立、驾驶模式离线辨识、驾驶模式及意图在线监测、基... 实现对驾驶行为语义的精准解析是进一步提升自动驾驶汽车智能化水平的核心技术之一。该文总结了驾驶行为研究的体系架构;回顾了驾驶行为语义解析发展的4个阶段,包括跟驰及换道模型建立、驾驶模式离线辨识、驾驶模式及意图在线监测、基于无监督学习的语义解析;介绍了4项驾驶行为语义解析关键技术(驾驶模式辨识及预测、驾驶行为智能决策、驾驶风格辨识、驾驶行为语义分割)在国内外的研究现状;介绍了可应用于智能汽车技术研发的语义解析学习算法,包括Bayes网络、隐Markov模型、深度神经网络、强化学习等;讨论了驾驶行为语义解析技术在智能驾驶中驾驶辅助、智能决策、路径规划等方面的应用。 展开更多
关键词 自动驾驶 智能汽车 驾驶行为 语义解析 学习算法 拟人化决策 驾驶辅助 路径规划
在线阅读 下载PDF
强化学习算法 20分钟教会车辆车道保持
15
《农业装备与车辆工程》 2018年第7期81-81,共1页
英国Wayve公司的研究人员在20 min内“教”会一辆自动驾驶汽车保持在自己的车道上行驶。Wayve公司研发团队的“强化学习”算法与人类安全驾驶员一起,在15~20 min内教会了自动驾驶汽车如何保持在车道内行驶。之前,DeepMind Technologies... 英国Wayve公司的研究人员在20 min内“教”会一辆自动驾驶汽车保持在自己的车道上行驶。Wayve公司研发团队的“强化学习”算法与人类安全驾驶员一起,在15~20 min内教会了自动驾驶汽车如何保持在车道内行驶。之前,DeepMind Technologies公司就通过展示强化学习人工智能如何学习玩围棋或象棋等游戏,证明了其高效性。Wayve团队发布了一个视频,展示了汽车学习的实际情况,并指出这是“首个在自动驾驶汽车上进行强化学习的例子。” 展开更多
关键词 强化学习算法 车道保持 自动驾驶汽车 车辆 研究人员 人类安全 研发团队 人工智能
在线阅读 下载PDF
基于深度强化学习的自主换道控制模型
16
作者 孙腾超 陈焕明 《农业装备与车辆工程》 2024年第4期30-34,共5页
为解决自动驾驶汽车快速安全换道问题,提出并改进了一种基于深度强化学习的自主换道控制模型。首先建立车辆动力学运动模型,其次使用深度确定性策略梯度(DDPG)算法更新模型,最后通过MATLAB/CarSim对学习到的控制策略进行联合仿真验证。... 为解决自动驾驶汽车快速安全换道问题,提出并改进了一种基于深度强化学习的自主换道控制模型。首先建立车辆动力学运动模型,其次使用深度确定性策略梯度(DDPG)算法更新模型,最后通过MATLAB/CarSim对学习到的控制策略进行联合仿真验证。为了使模型更真实可靠,提出将CarSim融入智能体的训练,同时为解决传统模型在换道后期控制效果不理想问题,提出一种基于采样时间的方向盘转角输出模型。结果表明:在60、80 km/h车速下,提出的模型从换道开始到稳定行驶的过程相比于改进前更平顺、快速,验证了模型能够实现一般车速下的自主换道控制,为车辆的自主换道研究提供一定的参考。 展开更多
关键词 自动驾驶汽车 自主换道模型 深度强化学习 轨迹规划跟踪 深度确定性策略梯度算法
在线阅读 下载PDF
基于深度强化学习的个性化跟车控制模型
17
作者 孙腾超 陈焕明 《农业装备与车辆工程》 2024年第5期87-91,共5页
为解决自动驾驶汽车跟车控制问题,提出并改进了一种基于深度强化学习的个性化跟车控制模型。建立车辆安全时距模型,将其融入车辆运动学模型中;使用深度确定性策略梯度(DDPG)算法训练模型;通过MATLAB和CarSim软件对学习到的控制策略进行... 为解决自动驾驶汽车跟车控制问题,提出并改进了一种基于深度强化学习的个性化跟车控制模型。建立车辆安全时距模型,将其融入车辆运动学模型中;使用深度确定性策略梯度(DDPG)算法训练模型;通过MATLAB和CarSim软件对学习到的控制策略进行联合仿真验证。为使训练结果更加真实可靠,提出将CarSim软件融入到智能体的训练过程;将个性化模块引入模型,使模型可以通过改变参数得到不同的驾驶风格。实验结果表明:在一般车速下,该模型能实现在前车加速或减速情况下控制车辆以一定车速安全行驶,并能够通过改变训练参数实现个性化控制,对自动驾驶车辆跟车过程的研究有一定指导意义。 展开更多
关键词 自动驾驶汽车 个性化跟车模型 深度强化学习 深度确定性策略梯度(DDPG)算法
在线阅读 下载PDF
基于深度强化学习的高速公路换道跟踪控制模型 被引量:9
18
作者 李文礼 邱凡珂 +2 位作者 廖达明 任勇鹏 易帆 《汽车安全与节能学报》 CAS CSCD 北大核心 2022年第4期750-759,共10页
为解决自动驾驶汽车在高速公路安全换道问题,提出了一种基于深度强化学习算法的换道跟踪控制模型,并进行了仿真实验。采用五次多项式方法,建立车辆换道路径模型,并给出跟踪误差函数;将车辆三自由度动力学模型与深度强化学习框架相融合,... 为解决自动驾驶汽车在高速公路安全换道问题,提出了一种基于深度强化学习算法的换道跟踪控制模型,并进行了仿真实验。采用五次多项式方法,建立车辆换道路径模型,并给出跟踪误差函数;将车辆三自由度动力学模型与深度强化学习框架相融合,搭建换道路径跟踪控制模型;通过深度确定性策略梯度(DDPG)算法来更新该模型;学习得到换道路径跟踪的最佳转向角,来控制车辆完成换道过程。结果表明:在100 km/h车速条件下,本方法控制的横向位置误差绝对值的最大值接近0,角偏差绝对值最大值为10 mrad;所提出的方法相比传统的模型预测控制方法而言,轨迹跟踪的横向位置误差和角误差更小。因而,该模型能够实现高速环境下的自主换道过程,这对保证交通安全和缓解交通有意义。 展开更多
关键词 自动驾驶汽车 换道模型 路径跟踪 深度强化学习 五次多项式 深度确定性策略梯度(DDPG)算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部