-
题名基于负反馈修正的多轮对话推荐系统
被引量:3
- 1
-
-
作者
朱立玺
黄晓雯
赵梦媛
桑基韬
-
机构
北京交通大学计算机与信息技术学院
交通数据分析与挖掘北京市重点实验室(北京交通大学)
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第5期1086-1102,共17页
-
基金
中央高校基本科研专项资金(2021RC217)
国家自然科学基金(62202041)资助。
-
文摘
传统的推荐系统从交互历史中挖掘用户兴趣,面临着无法动态地获取用户实时偏好和细粒度偏好的问题,近年对话推荐系统领域的兴起为此问题提供了新的解决方案.对话推荐系统优势在于其可以动态地和用户进行交互,并在交互过程中获取用户的实时偏好,从而提高推荐系统准确率,提升用户体验.然而对话推荐系统相关研究工作中缺乏对负反馈的充分利用,难以对用户偏好表示进行细粒度的修正,即难以有效平衡用户长期偏好和实时偏好之间的关系,同时存在属性候选集过大导致交互轮次过多的问题.因此,本文基于经典的对话推荐框架CPR(Conversational Path Reasoning)提出了一种能够有效利用用户负反馈的对话推荐模型NCPR(Negative-feedback-guide Conversational Path Reasoning).不同于现有的对话推荐系统工作,NCPR能够充分利用用户在交互过程中给出的属性粒度和物品粒度的负反馈对用户的偏好表示进行动态的修正.此外,CPR将对话推荐建模为一个图上的路径推理问题,NCPR使用协同过滤算法基于属性粒度的负反馈对属性候选集进行重排序,在利用图结构的自然优势限制属性候选集大小的同时,进一步减少候选属性空间大小.四个基准数据集上的实验结果表明,NCPR在推荐准确率和平均交互轮次两个评价指标上的表现优于先进的基线模型.最后,我们设计并实现了一个网页端的对话推荐系统,与在线用户进行交互产生推荐结果,证明了NCPR在真实的对话推荐场景下的有效性.
-
关键词
对话推荐系统
强化学习
交互负反馈
知识图谱
协同过滤
-
Keywords
conversational recommendation systems
reinforcement learning
interactive negative feedback
knowledge graph
collaborative filtering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名对话推荐算法研究综述
被引量:13
- 2
-
-
作者
赵梦媛
黄晓雯
桑基韬
于剑
-
机构
北京交通大学计算机与信息技术学院
北京交通大学人工智能研究院
交通数据分析与挖掘北京市重点实验室(北京交通大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第12期4616-4643,共28页
-
基金
国家重点研发计划(2018AAA0100604)
中央高校基本科研专项(2021RC217)
+1 种基金
北京市自然科学基金(JQ20023)
国家自然科学基金(61632002,61832004,62036012,61720106006)。
-
文摘
推荐系统是一种通过理解用户的兴趣和偏好帮助用户过滤大量无效信息并获取感兴趣的信息或者物品的信息过滤系统.目前主流的推荐系统主要基于离线的、历史的用户数据,不断训练和优化线下模型,继而为在线的用户推荐物品,这类训练方式主要存在3个问题:基于稀疏且具有噪声的历史数据估计用户偏好的不可靠估计、对影响用户行为的在线上下文环境因素的忽略和默认用户清楚自身偏好的不可靠假设.由于对话系统关注于用户的实时反馈数据,获取用户当前交互的意图,因此“对话推荐”通过结合对话形式与推荐任务成为解决传统推荐问题的有效手段.对话推荐将对话系统实时交互的数据获取方式应用到推荐系统中,采用了与传统推荐系统不同的推荐思路,通过利用在线交互信息,引导和捕捉用户当前的偏好兴趣,并及时进行反馈和更新.在过去的几年里,越来越多的研究者开始关注对话推荐系统,这一方面归功于自然语言处理领域中语音助手以及聊天机器人技术的广泛使用,另一方面受益于强化学习、知识图谱等技术在推荐策略中的成熟应用.将对话推荐系统的整体框架进行梳理,将对话推荐算法研究所使用的数据集进行分类,同时对评价对话推荐效果的相关指标进行讨论,重点关注于对话推荐系统中的后台对话策略与推荐逻辑,对近年来的对话推荐算法进行综述,最后对对话推荐领域的未来发展方向进行展望.
-
关键词
对话推荐系统
用户建模
人机交互
推荐系统
-
Keywords
conversational recommendation system(CRS)
user modeling
human-computer interaction
recommendation system
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名考虑多粒度反馈的多轮对话强化学习推荐算法
被引量:3
- 3
-
-
作者
姚华勇
叶东毅
陈昭炯
-
机构
福州大学计算机与大数据学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第1期15-21,共7页
-
基金
福建省科技计划项目(2018H6010)。
-
文摘
多轮对话推荐系统(CRS)以交互的方式获取用户的实时信息,相较于基于协同过滤等的传统推荐方法能够取得更好的推荐效果。然而现有的CRS存在用户偏好捕获不够准确、对话轮数要求过多以及推荐时机不恰当等问题。针对这些问题,提出一种基于深度强化学习且考虑用户多粒度反馈信息的对话推荐算法。不同于现有的CRS,所提算法在每轮对话中同时考虑用户对商品本身以及更细粒度的商品属性的反馈,然后根据收集的多粒度反馈对用户、商品和商品属性特征进行在线更新,并借助深度Q学习网络(DQN)算法分析每轮对话后的环境状态,从而帮助系统作出较为恰当合理的决策动作,使它能够在比较少的对话轮次的情况下分析用户购买商品的原因,更全面地挖掘用户的实时偏好。与对话路径推理(SCPR)算法相比,在Last. fm真实数据集上,算法的15轮推荐成功率提升了46.5%,15轮推荐轮次上缩短了0.314轮;在Yelp真实数据集上,算法保持了相同水平的推荐成功率,但在15轮推荐轮次上缩短了0.51轮。
-
关键词
多轮对话推荐系统
反馈信息
深度Q学习网络
偏好挖掘
多粒度
-
Keywords
multi-round conversational recommendation system
feedback information
Deep Q-Network(DQN)
preference mining
multi-granularity
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-