基于多兴趣对比的深度强化学习推荐模型

Deep Reinforcement Learning Recommendation Model Based on Multi-Interest Contrast

在线阅读下载PDF

导出

摘要深度强化学习(DRL)被广泛应用于推荐系统中,用于动态建模用户兴趣并最大化用户的累积收益。然而,用户反馈稀疏问题成为基于DRL的推荐算法面临的重要挑战之一。对比学习作为一种自监督学习方法,通过构造用户兴趣的多个视角增强其表示,进而缓解用户反馈稀疏问题。现有的对比学习方法通常利用基于启发式的增强策略,导致关键信息丢失,且未充分利用异构的交互信息。为解决这些问题,该文提出了基于多兴趣对比的深度强化学习推荐模型(MOCIR)。该模型包括一个对比表示模块和一个策略网络模块。对比表示模块利用异构信息网络(HIN)建模用户不同方面的局部兴趣,同时基于原始数据建模用户的全局兴趣,然后将同一用户的全局兴趣与局部兴趣、不同用户的全局兴趣与局部兴趣分别作为对比学习的正样本对和负样本对,以有效捕捉用户兴趣;策略网络模块用于在聚合用户状态表示后进行推荐;2个模块采用交替更新机制。在3个数据集上的实验结果表明,所提模型的推荐性能优于多个基于深度强化学习的模型,有效地解决了推荐中用户反馈稀疏问题。 Deep Reinforcement Learning(DRL)is widely applied in recommender systems to dynamically model user interests and maximize cumulative user benefits.However,the sparsity of user feedback has become a significant challenge for DRL-based recommendation algorithms.Contrastive learning,as a self-supervised learning method,enhances user interest representation by constructing multiple perspectives,thereby alleviating the issue of sparse user feedback.Existing contrastive learning methods typically rely on heuristic-based augmentation strategies,which often lead to the loss of key information and fail to fully utilize heterogeneous interaction data.To address these issues,this paper proposed a multi-interest oriented contrastive deep reinforcement learning recommendation(MOCIR)model.The model consists of two key modules:a contrastive representation module and a policy network module.The contrastive representation module utilizes a Heterogeneous Information Network(HIN)to model the user’s local interests from different aspects while capturing their global interests based on raw interaction data.It then treats the global and local interests of the same user as positive pairs and those of different users as negative pairs for contrastive learning,effectively enhancing user interest representation.The policy network module aggregates user state representations and generates recommendations.The two modules are trained using an alternating update mechanism.Experimental results on three benchmark datasets show that the proposed model outperforms several DRL-based models in recommendation performance,effectively addressing the problem of sparse user feedback in recommendations.

作者刘慧婷刘绍雄王佳乐赵鹏 LIU Huiting;LIU Shaoxiong;WANG Jiale;ZHAO Peng(School of Computer Science and Technology,Anhui University,Hefei 230601,Anhui,China;Institute of Artificial Intelligence,Hefei Comprehensive National Science Center,Hefei 230088,Anhui,China;Stony Brook Institute,Anhui University,Hefei 230039,Anhui,China)

机构地区安徽大学计算机科学与技术学院合肥综合性国家科学中心人工智能研究院安徽大学纽约石溪学院

出处《华南理工大学学报(自然科学版)》北大核心 2025年第9期11-21,共11页 Journal of South China University of Technology(Natural Science Edition)

基金国家自然科学基金项目(62576003) 安徽省高校协同创新项目(GXXT-2022-040) 安徽省自然科学基金项目(2008085MF219,2108085MF212) 安徽省高校自然科学研究项目(KJ2021-A0040,KJ2021-A0043)。

关键词多兴趣强化学习对比学习异质信息网络 multi-interest reinforcement learning contrastive learning heterogeneous information network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介刘慧婷(1978-),女,博士,副教授,主要从事自然语言处理和个性化推荐研究。E-mail:htliu@ahu.edu.cn。

引文网络
相关文献

参考文献2

1马晓亮,高洁,刘英,裴庆祺,赵汝强,杨邦兴,邓从健.基于意图理解驱动的客服知识推荐大模型构建[J].华南理工大学学报(自然科学版),2025,53(3):40-49. 被引量：3
2蔡晓东,曾志杨.AFGSRec:一种自适应融合全局协同特征的社交推荐模型[J].华南理工大学学报（自然科学版）,2022,50(12):71-79. 被引量：1

二级参考文献12

1冷亚军,陆青,梁昌勇.协同过滤推荐技术综述[J].模式识别与人工智能,2014,27(8):720-734. 被引量：200
2刘海涛,赵卫东.基于知识模式挖掘的流程知识推荐系统[J].计算机集成制造系统,2017,23(2):396-403. 被引量：16
3陈彬,张荣梅,张琦.DCFM:基于深度学习的混合推荐模型[J].计算机工程与应用,2021,57(3):150-155. 被引量：15
4宋美佳,贾鹤鸣,林志兴,卢仁盛,刘庆鑫.自适应学习率梯度下降的优化算法[J].三明学院学报,2021,38(6):36-44. 被引量：5
5黄勃,严非凡,张昊,李佩佩,王晨明,张佳豪,方志军.推荐系统研究进展与应用[J].武汉大学学报（理学版）,2021,67(6):503-516. 被引量：17
6胡琪,朱定局,吴惠粦,巫丽红.智能推荐系统研究综述[J].计算机系统应用,2022,31(4):47-58. 被引量：21
7秦琪琦,张月琴,王润泽,张泽华.基于知识图谱的层次粒化推荐方法[J].计算机科学,2022,49(8):64-69. 被引量：5
8马娟.智能客服在运营商中的主要应用场景探讨[J].无线互联科技,2022,19(16):124-127. 被引量：2
9赵晔辉,柳林,王海龙,韩海燕,裴冬梅.知识图谱推荐系统研究综述[J].计算机科学与探索,2023,17(4):771-791. 被引量：32
10马晓亮,安玲玲,邓从健,杜德泉,张国新.基于行业词表的自动语音转写后优化技术[J].华南理工大学学报（自然科学版）,2023,51(8):118-125. 被引量：4

共引文献2

1李华锋,赵紫辉,孙晓宁,袁勤俭.智能Agent情境适应性角色扮演元综合研究[J].现代情报,2025,45(8):163-177.
2荆思凤,刘希未.人工智能技术发展与未来大学生就业[J].中国大学生就业,2025(8):30-41.

华南理工大学学报(自然科学版)

2025年第9期

浏览历史

内容加载中请稍等...

基于多兴趣对比的深度强化学习推荐模型

参考文献2

二级参考文献12

共引文献2

相关作者

相关机构

相关主题

浏览历史