期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
用户偏好提取MDP建模研究
被引量:
2
1
作者
黄海清
张平
张曦文
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2006年第6期81-85,共5页
将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问...
将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问题提供了新的研究思路。仿真结果表明所构建的MDP模型能够在多状态条件下学习用户偏好,根据用户需求智能选择业务。
展开更多
关键词
效用理论
用户偏好
马尔可夫判决过程
强化学习
在线阅读
下载PDF
职称材料
题名
用户偏好提取MDP建模研究
被引量:
2
1
作者
黄海清
张平
张曦文
机构
北京邮电大学电信工程学院
航天部第二研究院中心军代室
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2006年第6期81-85,共5页
基金
国家863高技术资助项目(2003AA12331004)
文摘
将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问题提供了新的研究思路。仿真结果表明所构建的MDP模型能够在多状态条件下学习用户偏好,根据用户需求智能选择业务。
关键词
效用理论
用户偏好
马尔可夫判决过程
强化学习
Keywords
utility theory
user preference
Markov decision process
reinforcement learning
分类号
TN929.5 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
用户偏好提取MDP建模研究
黄海清
张平
张曦文
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2006
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部