期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于特征工程的广告点击转化率预测模型 被引量:4
1
作者 邓秀勤 谢伟欢 +2 位作者 刘富春 张翼飞 樊娟 《数据采集与处理》 CSCD 北大核心 2020年第5期842-849,共8页
在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注。计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告。其核心... 在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注。计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告。其核心问题是通过网络广告点击转化率预测的计算,将用户点击可能性最高的广告选择出来。广告点击转化率的精确预测与媒体、广告主和用户3方的利益密切相关。该研究基于TrackMaster平台提供的真实广告数据,以特征工程的视角,分别从用户信息特征、广告信息特征、上下文特征和统计特征4个角度进行特征分析,从而挖掘出对广告点击转化率影响较大的重要特征,构建广告点击转化率预测分层模型并训练,并且结合LightGBM算法模型得出广告点击转化率的重要特征排序。实验结果表明当特征选择阈值λ=0.95,特征选择数目为19,树的颗数为100时的受试者工作特征曲线下的面积(Area under receiver operating characteristic curve,AUC)值最大,模型的对数损失函数值约为0.1368,此时模型具有最优的效果。预测模型和特征排序结果有助于企业制定最优的广告投放策略。 展开更多
关键词 数据分析 点击转化率 计算广告 特征工程 特征分析
在线阅读 下载PDF
HybriG:一种高效处理大量重边的属性图存储架构 被引量:8
2
作者 黄权隆 黄艳香 +4 位作者 邵蓥侠 孟嘉 任鑫琦 崔斌 冯是聪 《计算机学报》 EI CSCD 北大核心 2018年第8期1766-1779,共14页
在图中,起点和终点都相同的两条边称为重边.属性图是一种带标志和重边的有向图,图中的点和边可以拥有任意数目的属性值.属性图由于其丰富的表达能力而广泛应用于实际建模中.实际应用中一般用图数据库解决属性图的存储需求.相比于传统的... 在图中,起点和终点都相同的两条边称为重边.属性图是一种带标志和重边的有向图,图中的点和边可以拥有任意数目的属性值.属性图由于其丰富的表达能力而广泛应用于实际建模中.实际应用中一般用图数据库解决属性图的存储需求.相比于传统的关系型数据库,图数据库在做多跳邻域查询、路径查询等与图结构相关的查询时,具有更优异的性能.Titan是产业界日渐关注的一个开源的分布式图数据库,Titan的数据以邻接表的方式组织,每个点的邻接表存储了相邻的所有边,这使得与邻接点集相关的查询都需要遍历整个邻接表.当图中含有大量重边时,邻接表规模巨大,这种数据组织方式导致邻域查询性能严重受损.邻域查询是大部分图查询的基础,如多跳邻域查询、路径查询、局部聚集系数查询(计算)等,这些查询往往由嵌套的邻域查询实现,随着邻域深度的增加,这种性能受损将被急剧放大.文中提出了一种基于Titan和列式存储数据库HBase的复合架构设计——HybriG,基于Titan和HBase建立存储层,用Titan来存储图的结构信息和点集的属性信息,HBase存储边集的所有属性信息.在HybriG中邻接表保持了项数和数据量上的精简,从而能克服上述图数据库的缺点.相比于传统图数据库Titan,HybriG在邻域点集相关查询以及边集数据批量导入上的性能提升一个量级以上.文中介绍了HybriG基于Titan和HBase的存储设计,并描述了在此存储设计基础上,如何高效地实现图查询以及图数据的插入操作.此外,文中还提出了图数据的高效导入方案,并保证导入过程中Titan与HBase存储数据的一致性.最后通过实验验证了HybriG在处理大量重边时的优异性能. 展开更多
关键词 属性图 重边 图数据库 TITAN HBASE 架构设计
在线阅读 下载PDF
融合RCM、PHM和数据挖掘的城市轨道交通车辆维护决策技术研究 被引量:14
3
作者 高明亮 高珊 +6 位作者 于闯 石海明 刘德权 邵俊捷 贾颜菽 唐玉清 莫柳松 《城市轨道交通研究》 北大核心 2021年第2期64-68,共5页
提出了一种用于轨道交通车辆系统维修决策的RCM(以可靠性为中心的维修)可靠性评估的新方法。针对轨道交通车辆系统故障机理复杂,影响因素冗多,提出基于RCM、PHM(故障预测与健康管理)和数据挖掘算法相融合的方法来构建系统的维护决策模... 提出了一种用于轨道交通车辆系统维修决策的RCM(以可靠性为中心的维修)可靠性评估的新方法。针对轨道交通车辆系统故障机理复杂,影响因素冗多,提出基于RCM、PHM(故障预测与健康管理)和数据挖掘算法相融合的方法来构建系统的维护决策模型。与传统方法的区别在于,该方法能够更精准地定义维护模型,并获得系统的最优维护间隔,计算效率高,适用于复杂状态系统的可靠性计算。该方法可有效降低传统RCM的维护不足现象,降低运维成本,具有一定的推广应用价值。 展开更多
关键词 城市轨道交通车辆 维护决策技术 故障预测与健康管理 以可靠性为中心的维修 数据挖掘
在线阅读 下载PDF
平行调试方法的应用及安全风险分析
4
作者 王泽啸 《都市快轨交通》 北大核心 2017年第6期110-112,116,共4页
为了避免综合监控系统延伸线接入主线时功能调试对主线运营造成的影响,通过在主线停运期间用增设的临时中央级设备进行调试,在主线运营期间则恢复至原有中央级设备,当调试已完成且相应问题已基本整改时将延伸线正式接入主线。将其中搭... 为了避免综合监控系统延伸线接入主线时功能调试对主线运营造成的影响,通过在主线停运期间用增设的临时中央级设备进行调试,在主线运营期间则恢复至原有中央级设备,当调试已完成且相应问题已基本整改时将延伸线正式接入主线。将其中搭建的临时中央级设备、延伸线临时接入主线、开展平行调试、骨干网接入和设备升级等重要步骤进行归纳总结,并针对项目实施前的主线通信网络发生功能性损害的安全风险,以及项目实施过程中的系统数据库出现紊乱、临时设备上电后超载跳闸、非调试期间人员误操作等的安全风险提出相应管控措施,进一步提高后续类似项目的施工效率和安全性。 展开更多
关键词 轨道交通 综合监控系统 平行调试 延伸线接入主线 风险管控
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部