摘要
利用浮动车数据对交通状态进行挖掘和分析已经是交通领域的重要研究手段之一,而浮动车数据的稀疏性给数据挖掘工作带来了阻碍。对路网数据缺失特性进行分析后,提出了稀疏浮动车数据的填充模型,模型中对缺失小于30%的偶然性数据缺失采用基于朴素贝叶斯(NB)的分类方法进行数据填充,对缺失大于30%的多发性数据缺失采用基于动态时间规整(DTW)的方法进行二次填充,将两种方法结合并应用于路网实例中,对路段缺失的交通流速度数据进行填充,提升了浮动车数据的路网覆盖率,有效降低了浮动车数据缺失对交通流速度信息的采集、发布以及预测工作带来的影响。
It has been one of the essential study methods to analyze traffic condition via the floating car data (FCD) in transportation field. The sparsity of FCD, Nevertheless, is a hindrance to researches. After analyzing the data missing features of road network, this paper put forward a filling model for the sparse FCD, which fills the random data missing based on Naive Bayes classifier and double fills the multiple data missing based on dynamic time warping. By combining the two methods mentioned above and applying them to field cases, filling the roads’ traffic flow velocity data missing can substantially increase network coverage rate of FCD and reduce the impact on collecting, launching and forecasting the traffic flow velocity data brought by the FCD missing.
作者
许伦辉
陈凯勋
郭雅婷
XU Lunhui;CHEN Kaixun;Guo Yating(South China University of Technology, School of Civil Engineering and Transportation,Guangzhou 510641, China)
出处
《中山大学学报(自然科学版)》
CAS
CSCD
北大核心
2019年第4期136-145,共10页
Acta Scientiarum Naturalium Universitatis Sunyatseni
基金
国家自然科学基金(61263024)
广东省自然科学基金(2015A030313797)
作者简介
许伦辉(1965年生),男;研究方向: 交通系统建模与分析;E-mail:lhx_ scut@163.com;通信作者:陈凯勋(1993年生),男;研究方向:交通系统建模与分析;E-mail:651423076@qq.com.