期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于目标系统理论的消费者连续决策研究 被引量:1
1
作者 杜伟宇 许伟清 陈海霞 《商业时代》 北大核心 2014年第32期52-54,共3页
长期以来,单次消费决策研究在消费者决策领域占据主导地位。随着研究的深入,越来越多的学者开始关注消费者多次选择和决策的动态过程,这种过程可能发生于前后两次购买的产品属于相同类别或者满足相似目标,也可能发生在两次购买的产品在... 长期以来,单次消费决策研究在消费者决策领域占据主导地位。随着研究的深入,越来越多的学者开始关注消费者多次选择和决策的动态过程,这种过程可能发生于前后两次购买的产品属于相同类别或者满足相似目标,也可能发生在两次购买的产品在品类或目标上没有必然联系的情况下。本文对消费者连续决策的情境进行划分,结合目标系统理论,对所取得研究成果进行梳理,总结出连续决策的影响因素,并指出未来的研究方向。 展开更多
关键词 连续决策 目标系统理论 凸显策略 均衡策略
在线阅读 下载PDF
基于连续时间半马尔可夫决策过程的Option算法 被引量:3
2
作者 唐昊 张晓艳 +1 位作者 韩江洪 周雷 《计算机学报》 EI CSCD 北大核心 2014年第9期2027-2037,共11页
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过... 针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可有效加速策略学习过程.其中,Option方法可将系统目标任务分解成多个子目标任务来学习和执行,层次化结构清晰,是具有代表性的HRL方法之一.传统的Option算法主要是建立在离散时间半马尔可夫决策过程(Semi-Markov Decision Processes,SMDP)和折扣性能准则基础上,无法直接用于解决连续时间无穷任务问题.因此本文在连续时间SMDP框架及其性能势理论下,结合现有的Option算法思想,运用连续时间SMDP的相关学习公式,建立一种适用于平均或折扣性能准则的连续时间统一Option分层强化学习模型,并给出相应的在线学习优化算法.最后通过机器人垃圾收集系统为仿真实例,说明了这种HRL算法在解决连续时间无穷任务优化控制问题方面的有效性,同时也说明其与连续时间模拟退火Q学习相比,具有节约存储空间、优化精度高和优化速度快的优势. 展开更多
关键词 连续时间半Markov决策过程 分层强化学习 Q学习
在线阅读 下载PDF
一种基于连续不确定决策表的概念近似方法
3
作者 花文健 刘作良 韩兵 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2005年第1期38-43,共6页
复杂决策表通常具有连续定量的属性,存在部分未知值或存在描述一个对象的属性有多个可能值的情况,或者 3种情况并存,称为连续不确定决策表。通过分析发现,连续不确定决策表可视为一种多值表元决策表。利用Fuzzy集理论可将多值表元决策... 复杂决策表通常具有连续定量的属性,存在部分未知值或存在描述一个对象的属性有多个可能值的情况,或者 3种情况并存,称为连续不确定决策表。通过分析发现,连续不确定决策表可视为一种多值表元决策表。利用Fuzzy集理论可将多值表元决策表转化为带有隶属度的单一表元决策表;基于此,给出了扩展信息表和决策表的定义,提出了对多值表元决策表中决策概念下近似及边界的计算方法。 展开更多
关键词 连续不确定决策系统 扩展Rough集 概念近似
在线阅读 下载PDF
连续不确定决策系统及其扩展Rough集分析
4
作者 花文健 刘作良 《计算机应用研究》 CSCD 北大核心 2005年第6期47-51,共5页
连续不确定决策表可视为一种多值表元决策表。利用Fuzzy集理论可将多值表元决策表转换为带有隶属度的单一表元决策表;并在此基础上,给出了扩展信息表和决策表的定义,提出了对多值表元决策表中决策概念下近似及边界的计算方法,为利用规... 连续不确定决策表可视为一种多值表元决策表。利用Fuzzy集理论可将多值表元决策表转换为带有隶属度的单一表元决策表;并在此基础上,给出了扩展信息表和决策表的定义,提出了对多值表元决策表中决策概念下近似及边界的计算方法,为利用规则推导算法产生知识提供了确定的输入。 展开更多
关键词 连续不确定决策系统 扩展Rough集方法 指挥决策支持
在线阅读 下载PDF
连续值域决策表的属性约简算法
5
作者 刘文军 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第B06期13-16,共4页
结合模糊聚类技术与粗糙集理论,首先给出了一种求连续属性重要性的方法,然后由粗糙集中属性约简思想,给出连续值域决策表的属性约简算法,最后通过实例说明该算法的有效性。
关键词 连续值域决策 粗糙集 模糊集
在线阅读 下载PDF
连续时间部分可观Markov决策过程的策略梯度估计 被引量:1
6
作者 唐波 李衍杰 殷保群 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第7期805-808,共4页
针对连续时间部分可观Markov决策过程(CTPOMDP)的优化问题,本文提出一种策略梯度估计方法.运用一致化方法,将离散时间部分可观Markov决策过程(DTPOMDP)的梯度估计算法推广到连续时间模型,研究了算法的收敛性和误差估计问题,并用一个数... 针对连续时间部分可观Markov决策过程(CTPOMDP)的优化问题,本文提出一种策略梯度估计方法.运用一致化方法,将离散时间部分可观Markov决策过程(DTPOMDP)的梯度估计算法推广到连续时间模型,研究了算法的收敛性和误差估计问题,并用一个数值例子来说明该算法的应用. 展开更多
关键词 连续时间部分可观Markov决策过程 策略梯度估计 一致化 误差界
在线阅读 下载PDF
组织学习影响科技型企业连续并购决策的实证分析 被引量:6
7
作者 于鸿鹰 何青松 +1 位作者 何宗明 杨诗韵 《科技进步与对策》 CSSCI 北大核心 2018年第11期103-108,共6页
并购是科技型企业的重要成长方式,并购中的组织学习对科技型企业提高并购绩效至关重要。利用生存回归方法,分析科技型企业并购经验惯例和并购绩效反馈对连续并购决策的影响,探究并购中组织学习机制。研究结果显示,并购次数多、并购绩效... 并购是科技型企业的重要成长方式,并购中的组织学习对科技型企业提高并购绩效至关重要。利用生存回归方法,分析科技型企业并购经验惯例和并购绩效反馈对连续并购决策的影响,探究并购中组织学习机制。研究结果显示,并购次数多、并购绩效反馈好,则企业作出连续并购决策的概率大,好的并购绩效反馈会强化并购次数对连续并购决策的影响。 展开更多
关键词 科技型企业 组织学习 连续并购决策
在线阅读 下载PDF
基于区间二型模糊粗糙集的连续属性约简算法 被引量:5
8
作者 李冬梅 李涛 赵涛 《计算机应用研究》 CSCD 北大核心 2015年第5期1379-1382,共4页
一型模糊粗糙集可以直接处理连续属性集,但不能处理高度不确定性数据,而区间二型模糊集可以增强系统处理不确定性的能力。为了提高处理噪声数据的精确度,在一型模糊粗糙集的基础上,定义区间二型模糊粗糙集。基于区间二型模糊粗糙集模型... 一型模糊粗糙集可以直接处理连续属性集,但不能处理高度不确定性数据,而区间二型模糊集可以增强系统处理不确定性的能力。为了提高处理噪声数据的精确度,在一型模糊粗糙集的基础上,定义区间二型模糊粗糙集。基于区间二型模糊粗糙集模型研究了连续域决策信息系统的属性约简,通过紧计算域给出了新的约简算法。由于拒绝变量集合的存在,提出的约简算法可在有限时间内收敛,并且得到了更加合理的结果。数值仿真验证了约简算法的可行性与有效性。 展开更多
关键词 粗糙集 区间二型模糊集 连续决策信息系统 属性约简
在线阅读 下载PDF
随机模型检测连续时间Markov过程 被引量:2
9
作者 钮俊 曾国荪 +1 位作者 吕新荣 徐畅 《计算机科学》 CSCD 北大核心 2011年第9期112-115,125,共5页
功能正确和性能可满足是复杂系统可信要求非常重要的两个方面。从定性验证和定量分析相结合的角度,对复杂并发系统进行功能验证和性能分析,统一地评估系统是否可信。连续时间Markov决策过程CTMDP(Continu-ous-time Markov decision proc... 功能正确和性能可满足是复杂系统可信要求非常重要的两个方面。从定性验证和定量分析相结合的角度,对复杂并发系统进行功能验证和性能分析,统一地评估系统是否可信。连续时间Markov决策过程CTMDP(Continu-ous-time Markov decision process)能够统一刻画复杂系统的概率选择、随机时间及不确定性等重要特征。提出用CT-MDP作为系统定性验证和定量分析模型,将复杂系统的功能验证和性能分析转化为CTMDP中的可达概率求解,并证明验证过程的正确性,最终借助模型检测器MRMC(Markov Reward Model Checker)实现模型检测。理论分析表明,提出的针对CTMDP模型的验证需求是必要的,验证思路和方法具有可行性。 展开更多
关键词 功能性能 连续时间Markov决策过程 模型检测 可信验证 可达概率
在线阅读 下载PDF
不完备决策表的线性分段插补完备化方法 被引量:2
10
作者 高赟 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z2期1140-1143,共4页
由连续量变量系统得出的决策表通常是不完备的,不完备的决策表是不能用来决策的,所以对其必须进行完备化处理。针对这一问题,提出了线性分段插补的完备化方法。对补入决策值的检验结果表明,该方法是可行的。
关键词 粗糙集理论 连续决策 完备化 决策值插补
在线阅读 下载PDF
基于宽松下近似的模糊决策树归纳算法 被引量:1
11
作者 张群峰 《河北大学学报(自然科学版)》 CAS 北大核心 2016年第3期225-228,共4页
利用模糊相似关系对连续型决策表进行模糊化,进而运用宽松下近似定义启发式作为选择扩展属性的标准,从模糊决策表学习模糊决策树.
关键词 连续决策 宽松下近似 模糊决策
在线阅读 下载PDF
一种扩展的使用控制模型及其实施模型 被引量:1
12
作者 于颖超 徐宁 李立新 《计算机应用研究》 CSCD 北大核心 2009年第8期3044-3046,3049,共4页
指出了原有UCON模型缺乏对特定使用会话中资源使用之后的行为处理能力、过度简化了使用会话的概念以及缺乏一种综合考虑其决策连续性和属性可变性特征的实施机制这几个方面的问题。针对上述问题,给出了一个完整的职责模型,扩展了原有的U... 指出了原有UCON模型缺乏对特定使用会话中资源使用之后的行为处理能力、过度简化了使用会话的概念以及缺乏一种综合考虑其决策连续性和属性可变性特征的实施机制这几个方面的问题。针对上述问题,给出了一个完整的职责模型,扩展了原有的UCON,并提出了一种通用的使用控制实施模型。 展开更多
关键词 使用控制 决策连续 事后职责 职责模型 实施模型
在线阅读 下载PDF
一种基于灰色绝对关联度的变精度粗糙集模型 被引量:5
13
作者 王磊 王金山 沈浮 《重庆理工大学学报(自然科学)》 CAS 2012年第5期123-126,共4页
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于... 应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失,同时经典粗糙集模型也无法处理不精确分类。针对以上问题,建立了基于灰色绝对关联度的变精度粗糙集模型,研究了模型的部分性质和定理,提出了基于重要度的约简算法对模型进行属性约简。通过实例说明了模型建立和约简的具体过程。 展开更多
关键词 连续值属性决策 变精度粗糙集模型 灰色绝对关联度 属性约简 重要度
在线阅读 下载PDF
社会比较对象对后悔情绪波动性的影响:一项静息态fMRI研究 被引量:1
14
作者 孙裕斌 刘志远 +2 位作者 陈静 杨光 郭秀艳 《磁共振成像》 CAS 2019年第11期801-806,共6页
目的采用连续风险决策任务范式,通过功能核磁共振技术来探究在静息状态下脑区之间功能连接对于不同社会比较对象所引起的后悔情绪波动性的影响。材料与方法共有38名健康大学生被试参与本研究。实验中,被试需要假想有两个不同的对手(亲... 目的采用连续风险决策任务范式,通过功能核磁共振技术来探究在静息状态下脑区之间功能连接对于不同社会比较对象所引起的后悔情绪波动性的影响。材料与方法共有38名健康大学生被试参与本研究。实验中,被试需要假想有两个不同的对手(亲密好友与陌生人),他们会和自己同时完成连续风险决策任务,双方的结果会同时呈现在一起,被试根据双方结果进行情绪评分。所采集到的静息态数据通过功能磁共振静息态数据处理助手(data processing assistant for resting-state fMRI,DPARSF)来处理并计算脑岛(insula)与眶额叶皮层(orbital frontal cortex)等其他脑区的功能连接值,最后进一步将功能连接值与情绪评分指标(情绪波动性)及社会比较量表进行相关分析。结果在收益情境下,个体的结果比陌生人差时,脑岛与眶额叶皮层的功能连接与被试的情绪波动性呈负相关(r=-0.399,P<0.05),该功能连接也与个体的社会比较能力呈负相关(r=-0.472,P<0.01)。结论个体在静息状态下,脑岛与眶额叶皮层的功能连接与个体在面对陌生人时的情绪波动性及社会比较能力有关。 展开更多
关键词 连续风险决策 社会比较 磁共振成像 功能连接 情绪波动性 静息态研究
在线阅读 下载PDF
受控排队系统的平均最优与约束平均最优 被引量:1
15
作者 张兰兰 郭先平 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第2期139-144,共6页
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与... 根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略. 展开更多
关键词 连续时间马尔可夫决策过程 平均准则 受控排队系统 平均最优平稳策略 约束平均最优策略
在线阅读 下载PDF
事件驱动Q学习在呼叫接入控制中的应用
16
作者 任付彪 周雷 +1 位作者 马学森 魏振春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第1期76-79,共4页
文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CT-MDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学... 文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CT-MDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学习具有收敛速度快、存储空间小的优势;根据实验结果分析了在最优策略下业务拒绝率与业务特征的关系。 展开更多
关键词 连续时间Markov决策过程 事件驱动Q学习 呼叫接入控制
在线阅读 下载PDF
Polish空间上的折扣马氏过程量子化策略的渐近优化
17
作者 吴晓 孔荫莹 郭圳滨 《数学物理学报(A辑)》 CSCD 北大核心 2022年第2期594-604,共11页
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对... 该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果. 展开更多
关键词 连续时间马尔可夫决策过程 依赖状态折扣因子 折扣准则 量子化平稳策略 渐近最优性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部