传统的协同过滤算法广泛应用于推荐系统领域,但该算法仍存在用户冷启动和数据稀疏性问题,造成算法的推荐质量较差。对此,提出一种基于用户多属性与兴趣的协同过滤算法AICF(attributes and interests collaborative filtering)。首先通...传统的协同过滤算法广泛应用于推荐系统领域,但该算法仍存在用户冷启动和数据稀疏性问题,造成算法的推荐质量较差。对此,提出一种基于用户多属性与兴趣的协同过滤算法AICF(attributes and interests collaborative filtering)。首先通过对多种用户属性分配权重计算出用户多属性相似度。其次利用改进的Slope One算法填充用户—项目评分矩阵,然后计算基于隐性标签的用户兴趣相似度。最后基于两种相似度的组合进行推荐。实验结果表明,AICF算法不仅明显提高了推荐结果的准确性,同时也改善了用户冷启动和数据稀疏性问题。展开更多
针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出...针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出一种内容和地点感知的主题模型(content-location-aware topic model,CLATM),用以模拟用户在决策过程中的签到行为.该模型由内容主题建模和地点主题建模两个核心模块构成,用户签到内容依赖内容主题和地点主题,内容主题和地点主题在一定程度上共同决定用户签到地点,地理位置依赖于地点主题并服从高斯分布.该模型不仅恰当地整合了内容、地点和地理位置等重要的上下文因素,且充分利用这些因素之间的潜在关系有效缓解了数据稀疏性.在Foursquare和Yelp两个真实的位置社交网络数据集上对CLATM进行性能评测,实验结果表明,该模型在召回率(recall)和归一化折损累计增益(normalized discounted cumulative gain,NDCG)指标上均优于基准,recall@20和NDCG@20最大分别提高约141.09%和94.44%.综合使用上下文因素的共同作用能有效提升POI推荐性能.展开更多
针对短视频序列推荐中存在的点击数据稀疏性、观看时长反馈中的噪声以及偏差问题,提出了一种基于时长感知的短视频序列推荐模型(duration-aware for short video sequential recommendation,DASR)。该模型通过对用户观看时长反馈的深入...针对短视频序列推荐中存在的点击数据稀疏性、观看时长反馈中的噪声以及偏差问题,提出了一种基于时长感知的短视频序列推荐模型(duration-aware for short video sequential recommendation,DASR)。该模型通过对用户观看时长反馈的深入建模,有效地缓解了数据稀疏性问题。提出了一种无偏差的多语义观看时长反馈标签生成方法。该方法结合了K近邻算法和训练数据的百分位数分析,动态生成适应不同视频时长的标签阈值,有效地消除了视频时长偏差的影响。提出了一种基于强弱注意力网络的噪声提取方法,从观看时长中准确地提取正向和负向兴趣信号,从而解决了观看时长反馈中存在的噪声。在开源的短视频数据集上进行了广泛实验,结果表明该模型在多个评价指标上优于其他主流方法。展开更多
文摘针对短视频序列推荐中存在的点击数据稀疏性、观看时长反馈中的噪声以及偏差问题,提出了一种基于时长感知的短视频序列推荐模型(duration-aware for short video sequential recommendation,DASR)。该模型通过对用户观看时长反馈的深入建模,有效地缓解了数据稀疏性问题。提出了一种无偏差的多语义观看时长反馈标签生成方法。该方法结合了K近邻算法和训练数据的百分位数分析,动态生成适应不同视频时长的标签阈值,有效地消除了视频时长偏差的影响。提出了一种基于强弱注意力网络的噪声提取方法,从观看时长中准确地提取正向和负向兴趣信号,从而解决了观看时长反馈中存在的噪声。在开源的短视频数据集上进行了广泛实验,结果表明该模型在多个评价指标上优于其他主流方法。