期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合马尔科夫决策过程与信息熵的对话策略
被引量:
6
1
作者
朱映波
赵阳洋
+2 位作者
王佩
尹凯
王振宇
《计算机工程》
CAS
CSCD
北大核心
2021年第3期284-290,共7页
对话策略是人机对话系统中的重要组成成分,其性能的优劣直接影响对话系统的性能。在面对完全没有数据的冷启动场景时,收集对话数据进行对话策略学习的过程非常复杂和耗时。为在冷启动场景下能够保持良好性能,提出一种融合马尔科夫决策...
对话策略是人机对话系统中的重要组成成分,其性能的优劣直接影响对话系统的性能。在面对完全没有数据的冷启动场景时,收集对话数据进行对话策略学习的过程非常复杂和耗时。为在冷启动场景下能够保持良好性能,提出一种融合马尔科夫决策过程与信息熵的对话算法。利用马尔科夫决策过程快速获得下一步最优对话状态,并结合知识库通过引入属性信息熵方法排除多个状态值函数相同的最优状态,从而获取最优的系统响应动作。在音乐搜索领域数据集上的实验结果表明,与随机策略、基于规则和基于信息熵的算法相比,该算法分别缩短了2.24、0.84和0.03个对话轮次,且能够有效提高对话任务完成率。
展开更多
关键词
对话系统
对话策略
冷启动
信息熵
马尔科夫决策过程
在线阅读
下载PDF
职称材料
题名
融合马尔科夫决策过程与信息熵的对话策略
被引量:
6
1
作者
朱映波
赵阳洋
王佩
尹凯
王振宇
机构
天翼爱音乐文化科技有限公司
华南理工大学软件学院
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第3期284-290,共7页
基金
广东省自然科学基金“面向在线社会网络的信息传播结构分析与宏观预测”(2019A1515011792)
广东省应用型科技研发专项资金重点项目“面向移动互联网用户大数据分析及推荐平台的产业化应用”(2015B010131003)
广州市科技项目“基于大数据分析的移动音乐智能搜索与推荐平台”(201802010025)。
文摘
对话策略是人机对话系统中的重要组成成分,其性能的优劣直接影响对话系统的性能。在面对完全没有数据的冷启动场景时,收集对话数据进行对话策略学习的过程非常复杂和耗时。为在冷启动场景下能够保持良好性能,提出一种融合马尔科夫决策过程与信息熵的对话算法。利用马尔科夫决策过程快速获得下一步最优对话状态,并结合知识库通过引入属性信息熵方法排除多个状态值函数相同的最优状态,从而获取最优的系统响应动作。在音乐搜索领域数据集上的实验结果表明,与随机策略、基于规则和基于信息熵的算法相比,该算法分别缩短了2.24、0.84和0.03个对话轮次,且能够有效提高对话任务完成率。
关键词
对话系统
对话策略
冷启动
信息熵
马尔科夫决策过程
Keywords
dialogue system
dialogue strategy
cold start
information entropy
Markov Decision Process(MDP)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合马尔科夫决策过程与信息熵的对话策略
朱映波
赵阳洋
王佩
尹凯
王振宇
《计算机工程》
CAS
CSCD
北大核心
2021
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部