题名 基于树相似性聚类的差分隐私推荐算法
1
作者
尹春勇
王硕
机构
南京信息工程大学计算机学院网络空间安全学院
南京信息工程大学软件学院
出处
《计算机工程与设计》
北大核心
2025年第8期2240-2247,共8页
基金
国家自然科学基金面上基金项目(6177282)。
文摘
针对现有差分隐私推荐算法中评分矩阵稀疏、相似性计算依赖于共同评分项且忽略负相似性的问题,提出了一种基于树相似性聚类的差分隐私推荐算法。利用决策树信息熵变化量构建用户间树相似性,采用改进的布谷鸟搜索K-means算法基于树相似性矩阵对用户进行聚类,并通过差分隐私指数机制在目标用户所在簇中选取相似邻居用户集合,根据邻居集合推荐预测分值最高的项目。实验结果在MovieLen 100K和Yahoo Music数据集上显示,该算法相比现有算法,F_(1)值分别提高了7.3%和5.4%,在保护用户隐私的前提下有效提升了推荐精确度。
关键词
差分隐私
推荐系统
决策树
树相似性
隐私保护
聚类模型
协同过滤
Keywords
differential privacy
recommender system
decision tree
tree similar ity
privacy protection
clustering model
collab-orative filtering
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于密度权重的隐私聚类和改进相似度的推荐算法
被引量:4
2
作者
王圣节
张庆红
机构
新疆财经大学统计与数据科学学院
出处
《科学技术与工程》
北大核心
2024年第29期12623-12630,共8页
基金
国家自然科学基金(72164034)。
文摘
针对当前推荐系统中所面临数据稀疏、冷启动、时效性和隐私保护等问题,提出一种基于密度权重的隐私聚类和改进相似度的协同过滤推荐算法。该方法结合了差分隐私保护聚类与改进的相似度的协同过滤推荐算法,旨在提高推荐系统的精准度,同时确保用户数据的隐私安全。通过数据预处理构建用户-项目评分矩阵,并运用Weight Slope One算法智能填充空值,使用DWDPK-medoids隐私聚类算法对矩阵进行精确聚类,融合时间因素和用户兴趣偏好因素,改变相似度的计算,从而提高推荐相关性,最后预测目标用户对项目的评分。在MovieLens数据集,通过和当前学者提出的5种隐私推荐算法进行对比实验验证,该算法在评价指标均方根误差(root mean squared error,RMSE)和平均绝对误差(mean absolute error,MAE)上均有所降低,表明所提方法在一定程度上解决了数据稀疏、冷启动和时效性等问题,并在保护用户隐私的基础上提升了推荐准确性。
关键词
推荐系统
隐私保护
聚类
协同过滤
相似度计算
Keywords
recommender systems
privacy preservation
clustering
collaborative filtering
similar ity computation
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
题名 基于项目聚类的全局最近邻的协同过滤算法
被引量:29
3
作者
韦素云
业宁
朱健
黄霞
张硕
机构
南京林业大学信息科学技术学院
出处
《计算机科学》
CSCD
北大核心
2012年第12期149-152,共4页
基金
国家973项目(2012CB114505)
国家杰出青年基金项目(31125008)
+3 种基金
江苏省自然科学基金项目(BK2009393)
江苏省青蓝工程学术带头人项目(CXLX11_0525)
南京林业大学科技创新项目(163070079)
江苏高校大学生创新计划项目(164070742)资助
文摘
用户评分数据极端稀疏的情况下,传统相似性度量方法存在弊端,导致推荐系统的推荐质量急剧下降。针对此问题,提出了一种基于项目聚类的全局最近邻的协同过滤算法。该算法根据项目之间的相似性进行聚类,使得相似性较高的项目聚成一类,在项目聚类集的基础上,计算用户的局部相似度,使用一种新的最近邻用户全局相似度作为衡量用户间相似性的标准;其次,给出了一种利用重叠度因子来调节局部相似度的方法,以更准确地刻画用户之间的相似性。实验结果表明,该算法可以提升预测结果的准确性,提高推荐质量,特别是在数据较为稀疏时,改善尤为明显。
关键词
推荐系统
协同过滤
聚类
全局相似性
重叠度因子
Keywords
recommend ation systems
Collaborative filtering
clustering
Globe similar ity
Overlap
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 一种改进的K-means聚类的协同过滤算法
被引量:14
4
作者
赵伟
林楠
韩英
张洪涛
机构
郑州大学软件技术学院
华北水利水电大学电力学院
出处
《安徽大学学报(自然科学版)》
CAS
北大核心
2016年第2期32-36,共5页
基金
国家自然科学基金资助项目(31101085)
河南省科技厅基础研究项目(142300410226)
文摘
针对海量新闻的个性化推荐算法进行研究,提出一种改进的推基于K-means聚类的协同过滤用户推荐算法.该算法首先随机初始化了K个质心,按照重新定义过的新的用户相似度公式将用户进行K-means聚类,并选取相似度最大的作为当前用户所属类别;然后再重新定义了质心并进行迭代聚类;最后在每一个用户类里应用基于用户的协同过滤推荐算法,并给用户合理的个性化推荐.仿真实验测试表明,新算法能够提高推荐的准确率,并且有效提高了扩展性.
关键词
推荐系统
协同过滤
聚类
相似度
Keywords
recommend ation systems
collaborative filtering
clustering
similar ity
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 基于联合聚类平滑的协同过滤算法
被引量:12
5
作者
韦素云
肖静静
业宁
机构
南京林业大学信息科学技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S2期163-169,共7页
基金
江苏省"六大人才高峰"基金项目(2011DZXX043)
江苏省自然科学基金项目(BK2012815)
江苏省高等学校大学生实践创新项目(201310298036Z)
文摘
协同过滤是电子商务推荐系统中被广泛采用的技术,但还存在诸如稀疏性、冷启动、可扩展性等制约其进一步发展的瓶颈问题.针对上述问题,提出一种基于联合聚类平滑的协同过滤推荐算法.在该算法中,首先对原始矩阵中的评分模式进行用户和项目2个维度的联合聚类;然后采用联合聚类平滑的方法预测用户对未评分项目的评分值,分别从用户聚类簇、项目聚类簇和联合聚类簇多方面对评分矩阵空缺项进行平滑填充;最后结合基于项目的协同过滤算法查找项目最近邻并进行推荐.实验结果表明,该算法可以有效缓解用户评分数据稀疏带来的不良影响,一定程度上解决冷启动问题,提高预测准确率和推荐质量.
关键词
推荐系统
协同过滤
项目相似性
联合聚类
数据平滑
Keywords
recommend ation systems
collaborative filtering
item similar ity
co-clustering
data smoothing
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 云模式用户行为关联聚类的协同过滤推荐算法
被引量:9
6
作者
王雪蓉
万年红
机构
浙江东方职业技术学院工程技术系
出处
《计算机应用》
CSCD
北大核心
2011年第9期2421-2425,共5页
文摘
传统的协同过滤推荐算法基于互联网模式单纯从某个角度研究电子商务推荐问题,推荐质量明显不高。为改善推荐效果,提高推荐系统的伸缩性和实用价值,基于研究云模式的用户行为相似性度量公式、用户行为等级函数、关联规则函数,定义关联聚类方法,改进相应算法,提出一种云模式用户行为关联聚类的协同过滤推荐算法。最后使用MovieLens和阿里巴巴的云测试数据进行局部实验与全局实验,并对各种算法的实验结果进行对比分析。实验结果表明,该算法推荐效果明显优于传统算法,具有较强的伸缩性和较高的实用价值。
关键词
云模式
用户行为
相似性度量
关联规则
聚类
协同过滤推荐
Keywords
cloud pattern
user behavior
similar ity measure
correlation rule
clustering
collaborative filtering recommender
分类号
TP311.133.1
[自动化与计算机技术—计算机软件与理论]
TP393.027.2
[自动化与计算机技术—计算机应用技术]
题名 基于项目聚类和时间因素改进的推荐算法
被引量:3
7
作者
张林
王晓东
姚宇
机构
中国科学院成都计算机应用研究所
中国科学院大学
出处
《计算机应用》
CSCD
北大核心
2016年第A02期235-238,共4页
基金
四川省科技创新苗子工程项目(2015060)
文摘
针对传统推荐算法忽略时间因素影响的问题,根据用户行为在短期内存在较高的相似性,在计算物品相似度时引入时间衰减函数,提出一种考虑时间因素的物品相似度计算方法。同时基于聚类的思想,对项目作聚类,充分挖掘用户对项目类的兴趣度以及物品在类内的权重关系。基于上述两点对传统的协同过滤推荐算法进行改进,提出一种结合时间因素和项目聚类的TCItem CF算法。实验结果表明,采用改进的推荐算法能够明显改善推荐效果;特别地,在阻尼系数为0.01、时间衰减因子为0.5、聚类数目为160、推荐列表长度为20时,改进的推荐算法相比基于项目聚类的推荐算法Item Cluster推荐准确率提高4.9%。
关键词
推荐系统
协同过滤
物品相似度
兴趣衰减
聚类
Keywords
recommend ation system
collaborative filtering
item similar ity
interest attenuation
clustering
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 融合社会网络和项目特征的移动应用推荐
被引量:3
8
作者
于美琪
邝砾
呙斌
曹高峰
机构
中南大学软件学院
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第2期310-313,共4页
基金
国家自然科学基金项目(61202095)资助
中南大学科研基金项目(7608010001)资助
文摘
随着移动应用的数量增长,如何在海量应用中为用户推荐其感兴趣的应用受到了广泛关注.传统的协同过滤算法通过提取用户共同评分项目信息来计算用户相似度.然而,协同过滤算法普遍存在数据稀疏性问题,这在一定程度上导致了Pearson公式的计算结果不能准确的反映用户的相似程度.为了改善由于数据稀疏性问题导致的推荐结果不准确,我们使用K-means方法对项目进行基于语义相似的聚类,以实现基于相似项目的用户相似度计算,在此基础上,提出一种融合社会网络和项目特征的移动应用推荐.实验表明:融合了社会网络和项目特征的移动应用推荐能够缓解数据稀疏性问题对协同过滤算法的不利影响,在一定程度上提高了推荐结果的准确度.
关键词
K—means聚类
语义相似度
协同过滤
推荐系统
Keywords
K-means clustering
semantic similar ity
collaborative filtering
recommender system
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于情境相似度和二次聚类的协同过滤推荐算法
被引量:2
9
作者
蔡海尼
覃梦秋
文俊浩
熊庆宇
黎懋靓
机构
重庆大学软件学院
出处
《计算机科学》
CSCD
北大核心
2016年第4期210-213,234,共5页
基金
国家自然科学基金(61379158
71301177)
中央高校基本科研业务费科研专项(CDJXS11181161)资助
文摘
随着移动互联网规模的不断扩大,传统推荐系统因较少考虑多种情境因素和用户置信度对用户偏好预测的综合影响,造成了推荐算法预测结果的偏差。针对此问题,将情境信息引入个性化推荐的过程中,提出一种基于情境相似度和二次聚类的协同过滤算法。该算法首先根据用户情境的相似度对用户进行初始聚类,再基于评分矩阵计算用户评分置信度,将用户分为核心用户和非核心用户;然后根据核心用户评分对初始聚类的簇心进行调整,并对簇中非核心用户进行重聚类,形成新的聚簇;最终根据情境相似度对用户偏好进行预测。该算法可以在一定程度上降低评分矩阵中的噪点对聚类结果的影响,提高了推荐结果的准确性。基于实际数据集的仿真实验表明,该算法与传统协同过滤算法相比能够有效提高用户偏好预测的准确性,增加协同过滤推荐算法的精确度。
关键词
推荐系统
情境相似度
协同过滤
核心用户
二次聚类
Keywords
recommend ation system ,Context similar ity,Collaborative filtering,Core users,Twice clustering
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 相似性与置信系数为基础的推荐系统评分预测
被引量:1
10
作者
苏湛
王佳伟
艾均
沈昱明
机构
上海理工大学光电信息与计算机工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第5期984-989,共6页
基金
国家自然科学基金青年基金项目(61803264)资助.
文摘
邻居选择和邻居数量对于推荐系统评分预测具有关键作用.本文采用复杂网络模型中多种聚类方法,针对现有方法通常基于单一相似性选择邻居的问题,建立用户为节点,相似性与置信系数为边的复杂网络模型,设计基于两个因素聚类的推荐系统评分预测算法,以提高推荐系统的预测准确性并减少最优预测所需的邻居数量.实验通过折十验证仿真用户对电影进行评分.结果表明,本文方法达到最优预测准确度时,预测所需邻居数量减少60%.研究揭示了基于置信系数和相似性对邻居进行聚类,可以更加有效选出适当邻居,且聚类方法进行适当化简对性能影响较小.
关键词
推荐系统
评分预测
相似度
置信系数
邻居聚类
Keywords
recommender systems
rating prediction
similar ity
confidence coefficient
neighbor clustering
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
题名 基于相似模式聚类的电子商务网站个性化推荐系统研究
被引量:6
11
作者
王太雷
机构
泰山学院计算机科学与技术系
出处
《计算机工程与应用》
CSCD
北大核心
2005年第6期152-157,共6页
文摘
保证个性化推荐系统产生高质量的推荐结果的重要因素是:系统必须要确定访问者在访问行为的相似程度,从而能预测访问者的访问和购买兴趣。实现此功能的关键技术是计算访问者对象在整个或者部分属性空间的相似距离,从而得到访问行为的相似程度。该文首先分析了目前在推荐系统中常用的用于计算访问行为相似程度的距离函数,发现它们是测定访问者对象在所有测试属性空间上的平均测定,而在属性集的子维空间上的相似模式并没有有效地挖掘出来。然后提出一种新的基于相似模式聚类算法的电子商务个性化推荐系统,综合考虑可供挖掘的数据源(如:网站内容,网站的超链接结构,顾客访问网站的行为,以及商业的实际购买情况,顾客的身份数据等)获取用户访问电子商务网站的访问页面序列,构建较高购买者的顾客行为的矩阵模型,高效地得到访问者对象在整个或者部分属性空间的相似访问行为,然后通过挖掘潜在购买者与较高购买者的相似模式特征,帮助顾客发现他所希望购买的产品信息,用于提高实际购买量,实验数据表明,该系统高效并可广泛使用。
关键词
个性化推荐系统
相似模式聚类
电子商务
Keywords
recommender systems ,similar pattern clustering ,e-commerce
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于相似项目与用户评分的协同推荐算法
被引量:1
12
作者
陶剑文
潘红艳
机构
浙江工商职业技术学院信息工程系
出处
《情报学报》
CSSCI
北大核心
2008年第2期199-204,共6页
基金
浙江省教育厅科研项目资助(20040120).
文摘
推荐系统是电子商务系统中最重要的技术之一。随着电子商务系统用户数目和商品数目日益增加,在整个商品空间上用户评分数据极端稀疏,传统的相似性度量方法均存在各自的弊端,导致推荐系统的推荐质量急剧下降。针对用户评分数据极端稀疏情况下传统相似性度量方法的不足,本文提出了一种基于相似项目与用户评分预测的协同过滤推荐算法,综合利用相似项目和相似用户评分信息预测用户对未评分项目的评分。通过聚类算法形成用户候选近邻集,减小了算法搜索空间,降低了最近邻用户的搜索时间,从而增强了算法的扩展性。实验结果表明,本算法可以有效解决用户评分数据极端稀疏情况下传统协同推荐算法存在的问题,显著提高推荐系统的推荐质量。
关键词
推荐系统
协同过滤
相似性
聚类
平均绝对偏差
Keywords
recommend ation systems , collaborative filtering, similar ity, cluster , MAE
分类号
F623
[经济管理—产业经济]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 个性化推荐系统中相似模式聚类研究
被引量:3
13
作者
王太雷
机构
泰山学院计算机科学与技术系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第10期156-158,共3页
文摘
分析了目前在推荐系统中常用的用以计算访问行为相似程度的距离函数,发现它们仅是测定访问者对象在所有测试属性空间上的平均测定,而在属性集的子维空间上的相似模式并没有有效地挖掘出来。给出一种新的相似模式聚类算法,能高效地得到访问者对象在整个或者部分属性空间的相似访问行为模式。实验系统是高效的。
关键词
推荐系统
相似模式
聚类
Keywords
recommend ation systems
similar pattern
clustering
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 基于语义相似度的API使用模式推荐
被引量:6
14
作者
张云帆
周宇
黄志球
机构
南京航空航天大学计算机科学与技术学院
南京航空航天大学高安全系统的软件开发与验证技术工信部重点实验室
出处
《计算机科学》
CSCD
北大核心
2020年第3期34-40,共7页
基金
国家重点研发计划项目(2018YFB1003900)
中央高校基本科研业务费专项资金(NS2019055)
江苏高校“青蓝工程”~~
文摘
在软件开发过程中,复用应用程序编程接口(Application Programming Interface,API)可以提高软件开发效率,但是使用不熟悉的API是一项耗时且困难的挑战。已有的研究往往将API作为用户输入的查询,通过在语料库中搜索该API的使用模式来进行推荐,但这并不符合开发人员的查询习惯。文中提出了一种基于自然语言语义相似度的API使用模式推荐方法(Semantic Similazing Based API Recommendation,SSAPIR)。该方法使用层次聚类算法来提取API使用模式,然后通过计算查询信息和API使用模式来描述信息之间的语意相似度,向开发人员推荐相关度高且被广泛使用的API使用模式。为了验证SSAPIR的有效性,文中从GitHub的高质量Java项目中提取9个流行的第三方API库的API使用模式以及API使用模式的描述信息,并根据这9个流行的第三方API库的自然语言查询进行API使用模式推荐。通过计算推荐结果的Hit@K准确率来验证SSAPIR的有效性,实验结果表明,层次聚类能有效提高推荐准确率,且SSAPIR在Hit@10平均准确率上达到了85.02%,优于现有研究工作,能够很好地完成API使用模式推荐任务,为开发人员输入的自然语言查询提供精准的API使用模式。
关键词
API使用模式推荐
语义相似度
层次聚类
Keywords
API usage pattern recommend ation
Semantic similar ity
Hierarchical clustering
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种应用于推荐系统的Web挖掘算法:AIR算法
被引量:1
15
作者
张涛
丁二玉
骆斌
机构
南京大学计算机科学与技术系计算机软件新技术国家重点实验室
南京大学软件学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第1期168-170,201,共4页
文摘
针对互联网站点信息海量和结构复杂的趋势,推荐系统被用来协助互联网用户方便快捷地找到所需信息,培养用户忠诚度。Web挖掘技术在处理海量数据和稀疏数据上有着先天的优势,所以Web挖掘技术在推荐系统中得到了越来越广泛的研究和应用。基于Web挖掘的推荐系统所使用的主要技术有聚类、关联规则、序列模式等等。然而,这些技术往往不能在推荐的准确性和覆盖范围方面做到两全。综合这几种技术,取其优点去其缺点,提出了一种新的算法(AIR算法)。通过基于实际使用数据的详尽的实验评估,可以证明该算法能够在准确性和覆盖范围方面明显提高推荐系统的整体性能。
关键词
WEB挖掘
推荐系统
关联规则
序列模式
聚类算法
AIR算法
Keywords
Web mining
recommend ation system
association rules
sequence pattern
clustering
AIR
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于二分图划分联合聚类的协同过滤推荐算法
被引量:6
16
作者
黄乐乐
马慧芳
李宁
余丽
机构
西北师范大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
中国科学院信息工程研究所
出处
《计算机工程与科学》
CSCD
北大核心
2019年第11期2040-2047,共8页
基金
国家自然科学基金(61762078,61363058,61802404,61762079,U1711263,U1811264)
广西可信软件重点实验室研究课题(kx201910)
文摘
准确而积极地向用户提供他们可能感兴趣的信息或服务是推荐系统的主要任务。协同过滤是采用得最广泛的推荐算法之一,而数据稀疏的问题往往严重影响推荐质量。为了解决这个问题,提出了基于二分图划分联合聚类的协同过滤推荐算法。首先将用户与项目构建成二分图进行联合聚类,从而映射到低维潜在特征空间;其次根据聚类结果改进2种相似性计算策略:簇偏好相似性和评分相似性,并将二者相结合。基于结合的相似性,分别采用基于用户和项目的方法来获得对未知目标评分的预测。最后,将这些预测结果进行融合。实验结果表明,所提算法比最新的联合聚类协同过滤推荐算法具有更好的性能。
关键词
推荐系统
协同过滤
二分图划分联合聚类
簇偏好相似性
Keywords
recommender system
collaborative filtering
bipartite graph partitioning co-clustering
cluster preference similar ity
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种基于系统主题挖掘的协同过滤算法
被引量:2
17
作者
李雪
高心丹
机构
东北林业大学信息与计算机工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第4期664-667,共4页
基金
中央高校基本科研业务费专项基金E类项目(2572014EB05)资助
国家自然科学基金项目(61300098)资助
文摘
针对传统推荐算法在近邻寻找时忽略了系统自身群组特性的问题,依据项目内容与分类标签间的高关联性,对项目类别标签进行聚类,提出一种系统主题生成算法.基于同一时间段内相同主题的项目具有较高相似性的思想,在计算类内项目相似度时考虑了项目的评分和时间相似性.对于跨主题分布的项目,在评分预测阶段引入了主题偏重系数对类内评分进行加权计算.根据上述理论思想对传统的协同过滤推荐算法进行改进,提出一种基于系统主题挖掘的协同过滤算法.实验结果表明,该算法对传统算法中存在的问题进行了改善且推荐精度有所提高.
关键词
推荐系统
协同过滤
聚类
主题挖掘
相似度
Keywords
recommend ation system
collaborative filtering
clustering
theme mining
similar ity
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 社区均模型的IBCF算法
被引量:1
18
作者
赵瑞姣
王欣娟
孙静宇
机构
太原理工大学信息与计算机学院
出处
《计算机工程与设计》
北大核心
2019年第9期2478-2482,共5页
基金
国家863高技术研究发展计划基金项目(2014AA015204)
文摘
基于均模型的IBCF(item-based collaborative filtering)算法只考虑在整体的用户集上计算项目之间的相似度,丢失了一些局部上的信息,为此提出社区均模型的IBCF算法。整体用户集聚类成多个用户子集,在整体上和局部上计算相似度,利用整合后的相似度预测评分。在真实数据集上进行实验,实验结果表明,比较几个经典的算法,在时间复杂度较低的情况下,该算法提高了推荐精度。
关键词
推荐系统
相似性计算
均模型
社区
聚类
Keywords
recommend ation system
similar ity calculation
mean model
community
clustering
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]