-
题名基于改进的倾向得分估计的无偏推荐模型
被引量:5
- 1
-
-
作者
骆锦潍
刘杜钢
潘微科
明仲
-
机构
大数据系统计算技术国家工程实验室(深圳大学)
人工智能与数字经济广东省实验室(深圳)(深圳大学)
深圳大学计算机与软件学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第12期3508-3514,共7页
-
基金
国家自然科学基金重点项目(61836005)
国家自然科学基金面上项目(61872249)。
-
文摘
现实中推荐系统通常遭受着各种各样的偏置问题,例如曝光偏置、位置偏置和选择偏置。一个忽略偏置问题的推荐模型不能反映推荐系统的真实性能,且对于用户而言可能是不可信任的。先前的工作已经表明基于倾向得分估计的推荐模型能够有效缓解隐式反馈数据的曝光偏置,但是通常只考虑通过物品信息来估计倾向得分,这可能导致倾向得分估计不准确。为了提高倾向得分估计的准确性,提出配对倾向得分估计(MPE)方法。具体来说,该方法引入了用户流行度偏好的概念,通过计算用户流行度偏好和物品流行度的配对程度来对样本曝光率进行更加精确的建模,最后将提出的估计方法和一个主流的传统推荐模型以及一个无偏推荐模型进行集成并和包括前两者的三个基线模型进行对比。在公开数据集上的实验结果表明,结合MPE方法后的模型分别相比对应的基线模型在召回率、折损累计增益(DCG)和平均准确率(MAP)这三个评估指标上均有显著的提升;此外,通过实验结果还观察到性能的增益有很大一部分来自长尾物品,可见所提方法有助于提升推荐物品的多样性与覆盖率。
-
关键词
推荐系统
隐式反馈
曝光偏置
倾向得分估计
矩阵分解
长尾物品
用户流行度偏好
-
Keywords
recommender system
implicit feedback
exposure bias
propensity score estimation
matrix factorization
long-tail item
users’popularity preference
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于分层伪标签的图像聚类方法
被引量:1
- 2
-
-
作者
蔡少填
陈小军
陈龙腾
邱莉萍
-
机构
深圳大学计算机与软件学院
大数据系统计算技术国家工程实验室(深圳大学)
-
出处
《计算机科学》
CSCD
北大核心
2023年第6期225-235,共11页
-
基金
深圳市基础研究面上项目(JCYJ20210324093000002)。
-
文摘
图像聚类是图像处理中一个重要且开放的问题。最近,一些方法利用联合对比学习的良好表征能力来进行端到端聚类学习,利用伪标签技术来生成高质量的伪标签以提升聚类模型的鲁棒性。伪标签方法通常需要设置一个较大的概率阈值,并对满足要求的样本生成one-hot的标签,同时利用生成的标签来更新模型。但是,这种简单的伪标签生成方法难以获得足够数量的高质量伪标签。为了解决以上问题,提出了一种基于分层伪标签的图像聚类方法,它旨在利用结构化信息与伪标签信息对分类模型进行训练和精炼。引入3个假设来指导聚类方法的设计,包括局部平滑假设、自训练假设及低密度分离假设。新方法包含两个阶段:1)基于流形的一致性学习,利用近邻一致性学习来初始化聚类模型;2)基于分层伪标签的模型精炼,基于第一阶段的结果生成伪标签,并利用其来提升聚类模型的鲁棒性。首先,将基于第一阶段的结果生成强伪标签数据集及弱伪标签数据集;然后,提出了基于标签传播及分层混合的伪标签提升技术来提升弱伪标签数据集的质量;最后,同时利用强伪标签数据集及弱伪标签数据集来提升分类模型的泛化能力。相较于最优结果,SPC算法在STL10和Cifar100-20基准数据集上,ACC平均结果分别提升了7.6%和5.0%。
-
关键词
深度聚类
一致性学习
伪标签
标签传播
自训练学习
-
Keywords
Deep clustering
Consistency learning
Pseudo-labels
Label propagation
Self-training learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向异构单类协同过滤的阶段式变分自编码器
被引量:1
- 3
-
-
作者
陈宪聪
潘微科
明仲
-
机构
大数据系统计算技术国家工程实验室(深圳大学)
人工智能与数字经济广东省实验室(深圳)(深圳大学)
深圳大学计算机与软件学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第12期3499-3507,共9页
-
基金
国家自然科学基金重点项目(61836005)
国家自然科学基金面上项目(61872249)。
-
文摘
在推荐系统领域,大部分现有的工作主要关注仅有一种类型的用户反馈(如购买反馈)的单类协同过滤(OCCF)问题。然而,在现实的应用中,用户的反馈往往是异构的,因此如何对用户的异构反馈进行建模从而准确刻画用户的真实偏好成为了一个新的挑战。围绕异构单类协同过滤(HOCCF)问题(包含了用户的购买反馈和浏览反馈),提出了一个迁移学习解决方案——阶段式变分自编码器(SVAE)模型。首先,将用户的浏览反馈当作辅助数据,以多项式变分自编码器(Multi-VAE)为基础模型学习并生成隐特征向量;然后迁移该隐特征向量到另一路Multi-VAE,用于帮助该Multi-VAE对用户的目标数据(即购买反馈)进行建模。三个真实数据集上的实验结果显示,在多数情况下,SVAE模型在精确度(Precision@5)、归一化折损累计增益(NDCG@5)等重要指标上的表现显著优于其他流行的推荐算法,验证了所提模型的有效性。
-
关键词
推荐系统
用户反馈
异构单类协同过滤
迁移学习
变分自编码器
-
Keywords
recommender system
users’feedback
Heterogeneous One-Class Collaborative Filtering(HOCCF)
transfer learning
Variational AutoEncoder(VAE)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-