-
题名基于网络小说热度预测的CDN内容分发策略研究
被引量:3
- 1
-
-
作者
赵礼强
姜崇
靖可
-
机构
沈阳航空航天大学经济与管理学院
-
出处
《中文信息学报》
CSCD
北大核心
2018年第10期87-97,共11页
-
基金
国家自然科学基金(71301108)
教育部人文社科规划基金(17YJA630139)
辽宁省教育厅重点项目(L201706)
-
文摘
内容分发网络(CDN)以推(Push)和拉(Pull)作为两种主要的内容分发策略。拉是服务器对用户请求给予回应的方式,在面对高并发请求时,以推方式预分发到服务器上的内容将有效辅助改善服务器过载的情况,并实现热度内容的主动推送。预分发内容的热度高低直接决定了内容的边缘命中率和用户的启动延迟,有效减少预分发内容替换的频率和对源服务器访问时的网络堵塞,因此在网络小说服务器中依据网络小说热度对内容分发策略的部署就显得更为重要。目前针对网络小说服务器的内容分发策略的研究较少,缺乏对网络小说热度科学有效的评价标准。以服务器管理人员的主观经验判断和低命中的预分发内容的不断替换来实现内容推送的策略,不仅主观性强,同时内容的不断替换更极大地增加了服务器负担。针对这一问题,该文通过定义网络小说热度概念,对在起点中文网爬取到的数据进行预处理,数据拟合显示数据符合幂律分布规律,并建立热度等级评价标准,分别采用贝叶斯网络、随机森林算法与Logistic回归建立预测模型,对网络小说热度预测进行对比研究。结果显示,随机森林算法的预测正确率达到97.097%,均方误差为0.112 8,分类预测效果更优,且误差率更低。因此选用随机森林算法,依据网络小说热度评价标准,能够有效解决网络小说CDN系统内容部署不准确而导致低命中内容的不断替换和用户访问延迟的问题,为内容分发策略提供有效指导,从而提高内容命中率,提升网络小说CDN系统运作效率。
-
关键词
网络小说热度
幂律分布
内容分发策略
随机森林算法
预测
-
Keywords
network novels heat
power law distribution
content distribution strategy
random forest. algorithm
forecast
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-