期刊文献+
共找到273篇文章
< 1 2 14 >
每页显示 20 50 100
协同过滤推荐系统中数据稀疏问题的解决 被引量:51
1
作者 吴颜 沈洁 +3 位作者 顾天竺 陈晓红 李慧 张舒 《计算机应用研究》 CSCD 北大核心 2007年第6期94-97,共4页
介绍了现有协同过滤推荐的几种主要算法。它们对数据稀疏性问题都有一定的缓和作用。通过在数据集MovieLens上的实验,分析了各个算法在不同稀疏度下的推荐质量,为针对不同数据稀疏度的系统实现提供了可靠依据。
关键词 电子商务 推荐系统 协同过滤 数据稀疏 相似性
在线阅读 下载PDF
分步填充缓解数据稀疏性的协同过滤算法 被引量:32
2
作者 张玉芳 代金龙 熊忠阳 《计算机应用研究》 CSCD 北大核心 2013年第9期2602-2605,共4页
为解决传统协同过滤算法中用户评分数据稀疏性所带来的用户最近邻寻找不准确问题,提出了一种结合条件概率和传统协同过滤算法的非固定k近邻算法。该算法在基于分步填充评分矩阵的思想上,第一步只接受相似度和共同评分项目数量达到阈值... 为解决传统协同过滤算法中用户评分数据稀疏性所带来的用户最近邻寻找不准确问题,提出了一种结合条件概率和传统协同过滤算法的非固定k近邻算法。该算法在基于分步填充评分矩阵的思想上,第一步只接受相似度和共同评分项目数量达到阈值的邻居用户作为目标用户邻居,然后计算并填充未评分项目,第二步使用第一阶段部分填充后的矩阵计算剩余未评分项目的评分。实验表明,该算法寻找的邻居用户更准确,能明显地缓解数据稀疏问题,提高评分预测准确性。 展开更多
关键词 协同过滤 条件概率 推荐系统 数据稀疏 分步填充
在线阅读 下载PDF
面向数据稀疏问题的个性化组合推荐研究 被引量:15
3
作者 姜维 庞秀丽 《计算机工程与应用》 CSCD 2012年第21期21-25,30,共6页
协同过滤技术是推荐系统中应用最为广泛的算法,其面临着数据稀疏性问题、冷启动、规模可扩展性等问题。工作体现在两点:一是在基于项的协同过滤模型中,改进了项间的相似度计算方法,相比调整余弦方法仅考虑一个要素,包含了三个要素:两项... 协同过滤技术是推荐系统中应用最为广泛的算法,其面临着数据稀疏性问题、冷启动、规模可扩展性等问题。工作体现在两点:一是在基于项的协同过滤模型中,改进了项间的相似度计算方法,相比调整余弦方法仅考虑一个要素,包含了三个要素:两项的具有共同用户的评分、共同评分用户数量、非共同评分用户数量;二是组合基于用户、基于项和基于奇异值分解的协同过滤推荐,通过多模型组合提高推荐性能。实验结果表明在基于项过滤中MAE指标上提高了4.30%。进一步,加权的组合多种模型方法比基于项方法提高了1.26%。 展开更多
关键词 个性化推荐 协同过滤 数据稀疏问题 组合推荐
在线阅读 下载PDF
一种有效缓解数据稀疏性的混合协同过滤算法 被引量:6
4
作者 郁雪 李敏强 《计算机应用》 CSCD 北大核心 2009年第6期1590-1593,共4页
目前协同过滤技术已经被成功运用到各种推荐系统中,但是随着资源种类的不断膨胀与用户日益的增加,用来评判的数据矩阵越来越稀疏,严重影响了推荐质量。为此设计了一种混合新算法,对基于项目的协同过滤算法提出两个改进方法:首先根据网... 目前协同过滤技术已经被成功运用到各种推荐系统中,但是随着资源种类的不断膨胀与用户日益的增加,用来评判的数据矩阵越来越稀疏,严重影响了推荐质量。为此设计了一种混合新算法,对基于项目的协同过滤算法提出两个改进方法:首先根据网站的层次结构信息改进了传统的相似度计算方法;其次增加了预测缺失兴趣值的算法,使用户的交叉兴趣点增多,有效缓解了稀疏性的问题。实验结果证明了新算法具有较高的推荐精度,能够找到用户潜在的兴趣页面。 展开更多
关键词 推荐系统 协同过滤 数据预测 数据稀疏
在线阅读 下载PDF
一种有效缓解协同过滤推荐评价数据稀疏问题的算法 被引量:5
5
作者 黄永锋 覃罗春 《东华大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第1期83-87,共5页
在采用协同过滤算法构建个性化推荐的系统中,经常面临用户评价数据稀疏问题,这将严重降低个性化推荐的准确度.针对此问题,提出了一种混合加权预测填充算法,从用户访问的资源特征以及该资源在整个用户群体中被访问的热度出发,对用户访过... 在采用协同过滤算法构建个性化推荐的系统中,经常面临用户评价数据稀疏问题,这将严重降低个性化推荐的准确度.针对此问题,提出了一种混合加权预测填充算法,从用户访问的资源特征以及该资源在整个用户群体中被访问的热度出发,对用户访过的但未给出评价的数据进行预测并填充,从而降低了由于用户评价数据缺失所造成的评价矩阵稀疏程度,提高推荐准确度.在MoiveLense数据集上的试验结果表明,该算法能够明显地提高推荐准确度. 展开更多
关键词 个性化推荐 协同过滤 数据稀疏 预测填充 资源特征
在线阅读 下载PDF
一种缓解互惠推荐系统中数据稀疏性的算法 被引量:5
6
作者 殷方勇 王红 王吉华 《济南大学学报(自然科学版)》 北大核心 2017年第1期48-54,共7页
为解决以在线交友为代表的互惠推荐系统中数据稀疏性问题,根据LMa Fit算法提出一种改进评分矩阵的互惠推荐算法,该算法改进了传统评分矩阵填充的单向性与融合相似度计算。结果表明,与基于项目的协同过滤推荐算法和基于内容和协同过滤的... 为解决以在线交友为代表的互惠推荐系统中数据稀疏性问题,根据LMa Fit算法提出一种改进评分矩阵的互惠推荐算法,该算法改进了传统评分矩阵填充的单向性与融合相似度计算。结果表明,与基于项目的协同过滤推荐算法和基于内容和协同过滤的混合算法相比,改进评分矩阵的互惠推荐算法在准确率、召回率和调和平均数值方面有明显改进,该算法不仅改善了数据稀疏性的问题,而且推荐质量也明显优于其他算法。 展开更多
关键词 数据稀疏 互惠推荐 矩阵填充 融合相似度
在线阅读 下载PDF
点云数据稀疏区域建筑物立面重建方法 被引量:3
7
作者 刘亚文 覃苏舜 《应用科学学报》 CAS CSCD 北大核心 2017年第2期217-225,共9页
建筑物立面兼顾规则和非规则的几何结构排列,利用先验或提取的立面结构规则推理数据稀疏区域立面模型时,会产生不合理的重建结果.为此,提出一种结合规则推理和点云数据验证的数据稀疏区域建筑物立面重建方法,能够对推测的立面模型合理... 建筑物立面兼顾规则和非规则的几何结构排列,利用先验或提取的立面结构规则推理数据稀疏区域立面模型时,会产生不合理的重建结果.为此,提出一种结合规则推理和点云数据验证的数据稀疏区域建筑物立面重建方法,能够对推测的立面模型合理性进行验证.在利用影像数据改善立面点云数据初始重建模型偏移的基础上,分析立面结构的排列规律.采用四邻域模板匹配方法推理点云数据稀疏区域立面几何结构的位置和类型.最后用点云数据验证推理重建结果的可靠性.实验表明,对于结构多样的建筑物立面,该方法可检测出不合理的重建结果,提高了基于规则建筑物立面重建的可靠性. 展开更多
关键词 点云数据稀疏 建筑物立面重建 规则推理 点云数据验证
在线阅读 下载PDF
一种有效缓解数据稀疏问题的协同过滤推荐算法 被引量:12
8
作者 张清 于博 +1 位作者 王辉 邓林 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2019年第4期473-478,共6页
文章针对数据的稀疏会导致传统的协同过滤(collaborative filtering,CF)推荐算法不能准确地查找到最近邻居问题,提出了一种改进的基于用户Tanimoto相似性系数预填充的算法,通过改进的Tanimoto相似性系数得到更加合理的用户相似度,并结... 文章针对数据的稀疏会导致传统的协同过滤(collaborative filtering,CF)推荐算法不能准确地查找到最近邻居问题,提出了一种改进的基于用户Tanimoto相似性系数预填充的算法,通过改进的Tanimoto相似性系数得到更加合理的用户相似度,并结合提出的预测公式对目标用户的未评分项进行预测评分和填充,从而降低矩阵的数据稀疏度。实验结果表明,该算法对稀疏数据集具有较好的表现,能够提高推荐的质量。 展开更多
关键词 数据稀疏 协同过滤(CF) Tanimoto相似性系数 推荐算法 矩阵填充
在线阅读 下载PDF
稀疏数据驱动的涡轮叶片表面裂纹长度提取方法
9
作者 李茂月 雷金超 +1 位作者 张成龙 刘泽隆 《仪器仪表学报》 北大核心 2025年第1期157-169,共13页
航发涡轮叶片裂纹的长度测量是裂纹危险等级评判的基础和修复的前提。针对涡轮叶片表面裂纹形状不规则、目标小、数据集样本稀少和裂纹成像角度失真等问题,提出一种稀疏数据驱动的涡轮叶片表面裂纹长度提取方法。首先,为提升Unet模型在... 航发涡轮叶片裂纹的长度测量是裂纹危险等级评判的基础和修复的前提。针对涡轮叶片表面裂纹形状不规则、目标小、数据集样本稀少和裂纹成像角度失真等问题,提出一种稀疏数据驱动的涡轮叶片表面裂纹长度提取方法。首先,为提升Unet模型在处理稀疏数据时的精度,采用GeLu函数与Vgg16网络结合的方法提取裂纹特征,将输出作为Unet网络解码部分的输入,保证模型匹配的前提下,在随机初始化权重中引入预训练权重,并在跳跃连接层中引入高效金字塔压缩注意力模块,增强模型在复杂背景下对裂纹特征的聚焦能力。然后,为了得到裂纹的单位像素特征曲线,在精分割后提出使用八邻域骨架化保留裂纹的主干特征结构。最后,深入分析了相机成像原理,讨论了叶片弦线角和相机自身参数对裂纹长度的测量影响,采用张正友标定法求解相机内部参数,建立了像素尺寸与实际尺寸转换模型。实验结果表明,与X光测量相比,该方法在测量距离为100~300 mm时,得到的裂纹长度最大误差为6.8%,证明该方法在测量涡轮叶片表面裂纹长度中对X光检测技术具有可替代性;与原算法相比,改进的算法在针对稀疏数据检测时精度显著提高,平均交并比提升了7.14%。所提出的涡轮叶片裂纹长度提取方法,为叶片质量评估及后续修复提供了理论基础和数据支持。 展开更多
关键词 稀疏数据 深度学习 裂纹 涡轮叶片 相机标定
在线阅读 下载PDF
考虑时空关联的道路行程速度稀疏数据修复与解释性算法
10
作者 徐韬 任其亮 +1 位作者 张磊 程龙春 《铁道科学与工程学报》 北大核心 2025年第1期77-88,共12页
为研究拓扑路网中稀疏数据路段行程速度与其空间关联道路间的耦合影响,以路网中空间距离分布为基础,明确了道路空间关联指数(road spatial correlation index,RSCI)定义和计算方法,构建了一种面向道路行程速度稀疏数据修复和可解释性模... 为研究拓扑路网中稀疏数据路段行程速度与其空间关联道路间的耦合影响,以路网中空间距离分布为基础,明确了道路空间关联指数(road spatial correlation index,RSCI)定义和计算方法,构建了一种面向道路行程速度稀疏数据修复和可解释性模型。首先,在传统轮盘算法基础上提出了针对选择操作和算子的改进遗传算法(improved genetic algorithm,IGA),利用自适应机制优化个体选择概率,通过设置常数λ解决后续优秀个体选择概率偏低缺陷,提高模型收敛性能。其次,利用IGA和K折交叉验证(K-fold cross validation,K-Fold CV)实现极限梯度提升算法(extreme gradient boosting,XGBoost)中n_estimators、Learning_rate、Min_child_weight、Max_depth超参数寻优。然后,利用SHAP(shapey additive explanation,SHAP)方法对XGBoost模型各特征重要性开展全局解释和个体样本溯源分析。最后,以目标道路行程速度为输出、连接道路行程速度为特征输入进行实例验证。研究结果表明:IGA-XGBoost组合算法f_(MAE)、f_(RMSE)分别为1.95、2.66,R^(2)为0.941,较GA-XGBoost提高0.4%,模型运行时间为1.532 s,较GA-XGBoost运行时间减少7.6%,组合算法预测精度更高,迭代效率有明显提升;以SHAP值标定特征重要性下,连接道路特征重要性与其RSCI呈正相关,RSCI数值越大,连接道路对预测结果贡献越高;在连接道路数量不足时,以SHAP值排名前3的连接道路对目标道路数据填补时,模型f_(MAE)、f_(RMSE)、R^(2)分别为2.53、3.30、0.905,仍能取得较好的数据修复精度,证明了方法的适用性。研究结果可为城市道路行程车速数据修复填补提供新思路。 展开更多
关键词 智能交通 稀疏数据修复 改进遗传算法 XGBoost SHAP算法
在线阅读 下载PDF
数据驱动的流场稀疏数据建模
11
作者 王鸿鑫 徐德刚 +2 位作者 周楷文 李林文 温新 《上海交通大学学报》 北大核心 2025年第5期684-690,共7页
流场实时感知与预测在航空航海等领域具有十分重要的应用价值,但是往往面临流场维度高和实时测量信息少等挑战.针对该问题,提出一种数据驱动的流场建模方法,通过线下建立稀疏数据与高维流场映射,实现线上流场实时重构.线下建模中,针对... 流场实时感知与预测在航空航海等领域具有十分重要的应用价值,但是往往面临流场维度高和实时测量信息少等挑战.针对该问题,提出一种数据驱动的流场建模方法,通过线下建立稀疏数据与高维流场映射,实现线上流场实时重构.线下建模中,针对流场高维度挑战,使用本征正交分解等方法对数据进行降维,提取主要流场空间模态.采用正交三角(QR)分解方法,挖掘流场模态敏感性特征,优化测点位置.利用时间延迟的动态模态分解,显著降低测点数量.在线上重构中,基于实时稀疏测量数据与数据驱动模型,实现对当前和未来时刻全场流场的预测.在圆柱尾涡流场测试中,使用该方法并采用20个稀疏测点,得到的全场重构误差可达10%以下. 展开更多
关键词 数据驱动 降阶模型 动态模态分解 位置优化 稀疏数据 流场重构
在线阅读 下载PDF
面向稀疏数据的协同过滤算法相似度 被引量:7
12
作者 赵文涛 冯婷婷 《计算机工程与设计》 北大核心 2024年第6期1728-1734,共7页
针对数据稀疏加剧导致传统相似度模型的推荐准确性低的问题,提出一种混合的协同过滤相似度模型。引入Jensen-Shannon(JS)散度作为基函数,利用全局评级概率分布衡量用户间评级偏好相似度。定义融合评级值的结构型相似度作为权重因子,针... 针对数据稀疏加剧导致传统相似度模型的推荐准确性低的问题,提出一种混合的协同过滤相似度模型。引入Jensen-Shannon(JS)散度作为基函数,利用全局评级概率分布衡量用户间评级偏好相似度。定义融合评级值的结构型相似度作为权重因子,针对用户的共同评级项目设计差异化的相似度计算方式,提高相似用户的区分度,得到基于相对区间跨度的相似度。在不同稀疏度数据集上与7种具有代表性的相似度方法进行对比实验,其结果表明了所提方法在预测和推荐准确性指标上均有良好性能。 展开更多
关键词 稀疏数据 协同过滤 相似度 散度 用户评级偏好 全局结构 相对区间跨度
在线阅读 下载PDF
基于大语言模型和数据增强的通感隐喻分析
13
作者 盛坤 王中卿 《计算机应用》 北大核心 2025年第3期794-800,共7页
中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀,中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题,利用真实训练数据中的稀疏感觉词数据作为提示,并使用大语言模型生成额外的合成样本进... 中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀,中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题,利用真实训练数据中的稀疏感觉词数据作为提示,并使用大语言模型生成额外的合成样本进行数据增强。为避免合成数据的引入造成的额外噪声影响模型性能,构建基于大语言模型的数据增强框架,并采用评分机制和标签误差优化机制减小合成数据和真实数据之间的分布差异。实验结果表明,所提框架可以生成高质量的合成数据来扩充数据集,在感觉词抽取和感觉领域分类任务上的总体F1值达到68.5%,比仅使用真实训练数据的基线模型T5(Text-To-Text Transfer Transformer)提升了2.7个百分点。 展开更多
关键词 大语言模型 数据增强 通感隐喻 数据稀疏 数据合成
在线阅读 下载PDF
基于稀疏轨迹数据的出租车载客区域推荐 被引量:4
14
作者 廖祝华 张健 +3 位作者 刘毅志 肖浩 赵肄江 刘建勋 《电子学报》 EI CAS CSCD 北大核心 2020年第11期2178-2185,共8页
基于短期出租车轨迹数据的载客区域推荐能极大减少系统开销,提高推荐效率,但常伴随着数据稀疏性的问题.针对该问题,本文提出了一种融合地理信息的隐语义模型-GeoLFM.该模型通过将出租车司机所处的客观地理环境信息,融合到司机-载客区域... 基于短期出租车轨迹数据的载客区域推荐能极大减少系统开销,提高推荐效率,但常伴随着数据稀疏性的问题.针对该问题,本文提出了一种融合地理信息的隐语义模型-GeoLFM.该模型通过将出租车司机所处的客观地理环境信息,融合到司机-载客区域矩阵分解的过程中,从而弥补数据稀疏性带来的不足.同时,根据出租车实时的空间位置信息,为身处不同地点的出租车推荐不同的载客区域.实验证明,本文提出的方法与常用方法相比,推荐结果与真实的出租车司机载客情况间的平均绝对误差和均方根误差都得到大幅降低,较好的提升了推荐效果. 展开更多
关键词 轨迹挖掘 载客推荐 数据稀疏 隐语义模型 地理信息
在线阅读 下载PDF
基于重叠窗的稀疏评价数据计算方法
15
作者 杨超 曹顺良 《计算机应用与软件》 CSCD 2010年第10期83-85,共3页
数据样本稀疏影响计算结果的准确性。针对评价数据中经常存在的数据稀疏问题,在前期研究的基础上,对原有算法进行了扩展,提出了一种在不改变原有数据集的前提下,借助窗口重叠,弥补数据稀疏,并最终提高评价计算准确度的方法。仿真实验证... 数据样本稀疏影响计算结果的准确性。针对评价数据中经常存在的数据稀疏问题,在前期研究的基础上,对原有算法进行了扩展,提出了一种在不改变原有数据集的前提下,借助窗口重叠,弥补数据稀疏,并最终提高评价计算准确度的方法。仿真实验证明,无论数据稀疏与否,重叠窗技术均可提高评价计算的准确度。简单介绍了方法的一个具体应用。 展开更多
关键词 评价 数据稀疏 重叠窗 实验分析
在线阅读 下载PDF
面向多维稀疏时空数据的可视化研究 被引量:11
16
作者 赵凡 蒋同海 +2 位作者 周喜 马博 程力 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第7期556-568,共13页
时空数据的多维属性和稀疏分布特征是数据分析的主要难点.利用数据可视化技术实现多维稀疏时空数据的表现和辅助分析是当前一个研究热点.基于此,提出一种多模态数据可视化方法,利用多层次视图表现模型和人机交互方式,直观展示稀疏时空... 时空数据的多维属性和稀疏分布特征是数据分析的主要难点.利用数据可视化技术实现多维稀疏时空数据的表现和辅助分析是当前一个研究热点.基于此,提出一种多模态数据可视化方法,利用多层次视图表现模型和人机交互方式,直观展示稀疏时空数据的多维属性,进而分析数据的统计群组特征和典型个体行为模式,最终实现对异常行为的识别.针对覆盖新疆全区的车辆加油数据,融合多种相关数据源,利用该可视化方法,实现了一个车辆行为可视化数据分析系统,使用平行坐标、地图、日历矩阵、桑基图、散点图等视图模型,实现了对个体行为特征和群体行为模式的可视化表现,进而实现了对异常行为的识别、确认和预警等功能. 展开更多
关键词 可视化 时空数据 多维数据 稀疏数据
在线阅读 下载PDF
稀疏数据插值问题的回归克里格方法 被引量:8
17
作者 鲁程鹏 束龙仓 +1 位作者 张颖 王勇 《水电能源科学》 北大核心 2009年第1期81-84,共4页
针对稀疏数据的插值问题,基于克里格方法提出了一套应用于数据量少、插值空间广泛的回归克里格方法。研究结果表明,该方法可有效解决稀疏数据无法给出合理理论变异函数的问题,且插值结果与基于最小二乘法的简单克里格相比平稳性更好。... 针对稀疏数据的插值问题,基于克里格方法提出了一套应用于数据量少、插值空间广泛的回归克里格方法。研究结果表明,该方法可有效解决稀疏数据无法给出合理理论变异函数的问题,且插值结果与基于最小二乘法的简单克里格相比平稳性更好。回归克里格方法应依据具体问题选择变量,以满足强相关为首要条件,过多增加相关变量往往不能取得很好的插值效果。 展开更多
关键词 稀疏数据 插值 回归克里格 地质统计
在线阅读 下载PDF
一种解决稀疏数据和冷启动问题的组合推荐方法 被引量:5
18
作者 郭晓波 赵书良 +2 位作者 牛东攀 王长宾 逄焕利 《中国科学技术大学学报》 CAS CSCD 北大核心 2015年第10期804-812,共9页
针对传统推荐算法所面临的冷启动与稀疏数据问题以及现有ARM(association rule mining)算法大多用于购物篮顾客行为分析,并不适用于特定用户推荐业务且效率较低等现象,提出一种基于相似度的关联推荐模式,实现一种新的结合关联规则推荐... 针对传统推荐算法所面临的冷启动与稀疏数据问题以及现有ARM(association rule mining)算法大多用于购物篮顾客行为分析,并不适用于特定用户推荐业务且效率较低等现象,提出一种基于相似度的关联推荐模式,实现一种新的结合关联规则推荐与协同过滤推荐方法.采用基于指定后件项的关联规则推荐,直接对目标用户和目标项目进行关联规则挖掘,并利用兴趣因子对活跃用户(或项目)与非活跃用户(或项目)进行权值均衡,以加权方法推荐最优解(规则).同时,采用相似度测量方法,过滤低相似度的项目,为用户推荐既有高评分又具有较高相似度的项目集合.最后,结合规则推荐与CF(collaborative filter)推荐形成最终推荐结果,实现基于用户(或项目)的协同过滤推荐.在MovieLens数据集上的实验结果表明,同已有成果相比本文方法能够更好地处理稀疏数据和冷启动问题,推荐质量明显提高. 展开更多
关键词 关联推荐 组合相似度 协同过滤 冷启动 稀疏数据
在线阅读 下载PDF
基于排序思想的高维稀疏数据聚类 被引量:2
19
作者 祝琴 高学东 +2 位作者 武森 陈敏 陈华 《计算机工程》 CAS CSCD 北大核心 2010年第22期13-14,共2页
针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高... 针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高CABOSFV聚类的质量。 展开更多
关键词 高维稀疏数据 CABOSFV聚类 排序
在线阅读 下载PDF
面向稀疏数据的协同过滤用户相似度计算研究 被引量:9
20
作者 武森 董雅贤 +1 位作者 魏桂英 高晓楠 《计算机科学与探索》 CSCD 北大核心 2022年第5期1043-1052,共10页
基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤。传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选... 基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤。传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响较小但区分度低。针对上述协同过滤任务中数据稀疏带来的相似度计算问题,提出一种稀疏余弦相似度。首先定义新的结构相似度——稀疏集合相似度,将用户区分为高相关用户与低相关用户,并进一步针对不同类型用户设计差异化的数值相似度计算方式,以缓解传统数值相似度在面临数据稀疏时的不足,最终综合数值相似度与结构相似度形成稀疏余弦相似度。实验结果表明,与七种相似度计算方法相比,稀疏余弦相似度解决了传统数值相似度受数据稀疏影响严重和结构相似度计算结果区分度低的问题,可更准确计算用户相似度,提升推荐效果。 展开更多
关键词 相似度计算 协同过滤 稀疏数据 推荐系统
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部