期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于二阶价值梯度模型强化学习的工业过程控制方法
被引量:
1
1
作者
张博
潘福成
+1 位作者
周晓锋
李帅
《计算机应用研究》
CSCD
北大核心
2024年第8期2434-2440,共7页
为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学...
为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学习迭代效率更高;其次,通过采用新的状态采样策略,可以更高效地利用模型进行策略学习。最后,通过在OpenAI的Gym公共实验环境和两个工业场景的仿真环境的实验表明:基于二阶价值梯度模型对比传统的基于最大似然估计模型,环境模型预测误差显著降低;基于二阶价值梯度模型的强化学习方法学习效率优于现有的基于模型的策略优化方法,具备更好的控制性能,并减小了控制过程中的振荡现象。可见该方法能有效地提升训练效率,同时提高工业过程控制的稳定性和准确性。
展开更多
关键词
工业过程控制
模型强化学习
二阶
价值梯度
状态
价值
函数
状态采样策略
在线阅读
下载PDF
职称材料
价值梯度与感受层次:谈舍勒的感受-情感学说
2
作者
汪震
庄威
《湖北大学学报(哲学社会科学版)》
CSSCI
北大核心
2024年第5期30-37,共8页
感受在舍勒的现象学和他的质料价值伦理学中具有一种基础性的理论地位,情感具有感受的层次,或感受之于情感有一种奠基关系,感受的分层对应着舍勒质料伦理学的价值梯度级序。舍勒对感受的分析本身具有独立、独创的现象学价值,在感受的基...
感受在舍勒的现象学和他的质料价值伦理学中具有一种基础性的理论地位,情感具有感受的层次,或感受之于情感有一种奠基关系,感受的分层对应着舍勒质料伦理学的价值梯度级序。舍勒对感受的分析本身具有独立、独创的现象学价值,在感受的基础上他已经给出了一个迄今相当完整的情感—价值学说,与心灵哲学和当代心理学主流对感受的看法形成反差,倒是与东方思想(如佛教)有某种亲缘性。总的来看,他的感受—情感学说是认识论、存在论和价值论的统一体,理论和应用潜能巨大。
展开更多
关键词
舍勒
感受
情感
价值梯度
感受层次
在线阅读
下载PDF
职称材料
循环经济产业链形成的价值规律和政府角色
被引量:
7
3
作者
杨忠直
孙皓辰
《生态经济》
北大核心
2011年第8期32-37,共6页
首先给出了经济系统物质流动的价值增值定律,物流方向选择的价值梯度公理和确定物流最佳数量的价值最大化定理,以此作为循环经济系统正向物流和逆向物流规划的理论依据。然后分析了循环经济系统物质流动价值增值过程,定义了循环物流价...
首先给出了经济系统物质流动的价值增值定律,物流方向选择的价值梯度公理和确定物流最佳数量的价值最大化定理,以此作为循环经济系统正向物流和逆向物流规划的理论依据。然后分析了循环经济系统物质流动价值增值过程,定义了循环物流价值增值倍数,发现循环经济系统的物流价值增值倍数是循环经济的核心所在。接着在生产者责任延伸的框架下,探讨了企业循环经济系统的物质循环分配的利润最大化原理和社会循环经济系统物质等价交换原理。最后讨论了政府的行政、政策等职能对循环经济系统的逆向物流市场形成和有效运行的作用。文章的研究结论对于推进循环经济物流系统和循环经济产业价值链的建设有一定的理论指导意义。
展开更多
关键词
循环物流
价位势
价值
增值定律
价值梯度
公理
价值
增值倍数
在线阅读
下载PDF
职称材料
论道德单元
被引量:
3
4
作者
吕耀怀
《江汉论坛》
CSSCI
北大核心
1995年第2期49-54,共6页
道德单元有标量与矢量之分,是微观伦理学的研究对象之一。纯粹的道德单元属于道德标量,不具有明确的价值向性,故可以为不同的道德体系所吸纳。一定的价值取向系统赋予道德单元以价值向性,从而使道德标量演化为价值矢量,构成复合的道德...
道德单元有标量与矢量之分,是微观伦理学的研究对象之一。纯粹的道德单元属于道德标量,不具有明确的价值向性,故可以为不同的道德体系所吸纳。一定的价值取向系统赋予道德单元以价值向性,从而使道德标量演化为价值矢量,构成复合的道德单元。复合的道德单元与不同层次的价值对象相联结,形成不同梯度的价值。对于复合的道德单元的价值梯度分析,可以为道德冲突、道德错误等问题的研究开辟新的思维途径。
展开更多
关键词
价值
取向
值对象
道德体系
道德错误
元伦理学
价值梯度
道德
价值
道德意识
道德冲突
基本涵义
在线阅读
下载PDF
职称材料
题名
基于二阶价值梯度模型强化学习的工业过程控制方法
被引量:
1
1
作者
张博
潘福成
周晓锋
李帅
机构
中国科学院网络化控制系统重点实验室
中国科学院沈阳自动化研究所
中国科学院机器人与智能制造创新研究院
中国科学院大学
出处
《计算机应用研究》
CSCD
北大核心
2024年第8期2434-2440,共7页
基金
中国科学院沈阳自动化研究所基础研究计划资助项目(2022000346)。
文摘
为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数逼近能力和更高的鲁棒性,学习迭代效率更高;其次,通过采用新的状态采样策略,可以更高效地利用模型进行策略学习。最后,通过在OpenAI的Gym公共实验环境和两个工业场景的仿真环境的实验表明:基于二阶价值梯度模型对比传统的基于最大似然估计模型,环境模型预测误差显著降低;基于二阶价值梯度模型的强化学习方法学习效率优于现有的基于模型的策略优化方法,具备更好的控制性能,并减小了控制过程中的振荡现象。可见该方法能有效地提升训练效率,同时提高工业过程控制的稳定性和准确性。
关键词
工业过程控制
模型强化学习
二阶
价值梯度
状态
价值
函数
状态采样策略
Keywords
industrial process control
model-based reinforcement learning
second-order value gradient
state value function
state sampling strategy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
价值梯度与感受层次:谈舍勒的感受-情感学说
2
作者
汪震
庄威
机构
湖北大学哲学学院
出处
《湖北大学学报(哲学社会科学版)》
CSSCI
北大核心
2024年第5期30-37,共8页
文摘
感受在舍勒的现象学和他的质料价值伦理学中具有一种基础性的理论地位,情感具有感受的层次,或感受之于情感有一种奠基关系,感受的分层对应着舍勒质料伦理学的价值梯度级序。舍勒对感受的分析本身具有独立、独创的现象学价值,在感受的基础上他已经给出了一个迄今相当完整的情感—价值学说,与心灵哲学和当代心理学主流对感受的看法形成反差,倒是与东方思想(如佛教)有某种亲缘性。总的来看,他的感受—情感学说是认识论、存在论和价值论的统一体,理论和应用潜能巨大。
关键词
舍勒
感受
情感
价值梯度
感受层次
分类号
B82-0 [哲学宗教—伦理学]
在线阅读
下载PDF
职称材料
题名
循环经济产业链形成的价值规律和政府角色
被引量:
7
3
作者
杨忠直
孙皓辰
机构
上海交通大学安泰经济与管理学院
天津大学管理学院
出处
《生态经济》
北大核心
2011年第8期32-37,共6页
基金
国家社会科学基金项目(06BJY045)
文摘
首先给出了经济系统物质流动的价值增值定律,物流方向选择的价值梯度公理和确定物流最佳数量的价值最大化定理,以此作为循环经济系统正向物流和逆向物流规划的理论依据。然后分析了循环经济系统物质流动价值增值过程,定义了循环物流价值增值倍数,发现循环经济系统的物流价值增值倍数是循环经济的核心所在。接着在生产者责任延伸的框架下,探讨了企业循环经济系统的物质循环分配的利润最大化原理和社会循环经济系统物质等价交换原理。最后讨论了政府的行政、政策等职能对循环经济系统的逆向物流市场形成和有效运行的作用。文章的研究结论对于推进循环经济物流系统和循环经济产业价值链的建设有一定的理论指导意义。
关键词
循环物流
价位势
价值
增值定律
价值梯度
公理
价值
增值倍数
Keywords
circular logistics
value potential
value increment law
value gradient axiom
value increment multiplier
分类号
F062.2 [经济管理—政治经济学]
在线阅读
下载PDF
职称材料
题名
论道德单元
被引量:
3
4
作者
吕耀怀
机构
长沙工业高等专科学校
出处
《江汉论坛》
CSSCI
北大核心
1995年第2期49-54,共6页
文摘
道德单元有标量与矢量之分,是微观伦理学的研究对象之一。纯粹的道德单元属于道德标量,不具有明确的价值向性,故可以为不同的道德体系所吸纳。一定的价值取向系统赋予道德单元以价值向性,从而使道德标量演化为价值矢量,构成复合的道德单元。复合的道德单元与不同层次的价值对象相联结,形成不同梯度的价值。对于复合的道德单元的价值梯度分析,可以为道德冲突、道德错误等问题的研究开辟新的思维途径。
关键词
价值
取向
值对象
道德体系
道德错误
元伦理学
价值梯度
道德
价值
道德意识
道德冲突
基本涵义
分类号
B82 [哲学宗教—伦理学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于二阶价值梯度模型强化学习的工业过程控制方法
张博
潘福成
周晓锋
李帅
《计算机应用研究》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
2
价值梯度与感受层次:谈舍勒的感受-情感学说
汪震
庄威
《湖北大学学报(哲学社会科学版)》
CSSCI
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
循环经济产业链形成的价值规律和政府角色
杨忠直
孙皓辰
《生态经济》
北大核心
2011
7
在线阅读
下载PDF
职称材料
4
论道德单元
吕耀怀
《江汉论坛》
CSSCI
北大核心
1995
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部