-
题名基于信息熵的自适应多分类器交通数据插值模型
- 1
-
-
作者
张运凯
高金
李青
王旭
-
机构
河北省高校道路交通感知与智能应用技术研发中心
河北交通职业技术学院电气与信息工程系
河北工业大学人工智能与数据科学学院
-
出处
《河北科技大学学报》
北大核心
2025年第3期248-256,共9页
-
基金
国家自然科学基金(62402160)
河北省高等学校科学技术研究项目(ZD2021317)
石家庄市科技计划资金项目(2412606301)。
-
文摘
为了解决单一交通数据缺失值插补模型不能全面地考虑交通数据多源异构、数据量复杂等问题,提出一种基于信息熵来确定自适应权重的多分类器插值模型。首先,选择表示“混乱度”的信息熵来衡量预测结果的优劣进而确定多分类器的权重;其次,设计动态的自适应权重设定方法来解决设备差异性引起的不同样本适应的分类器不同的问题;最后,在公共数据集与自采数据集上进行验证。结果表明:所提模型相较于其他插值模型在检测效果上取得了显著的提升,并且在公开数据集“州际公路交通流量数据集”上进行的实验也取得了较高精度,F1达到0.778,RMSE提升10%,具有较强的泛化性。在使用信息熵确定权重模型的基础上,使权重跟随数据流自适应变化,具有较快的检测速度和更高的准确度,为交通数据清洗中缺失值填补模型的建立提供了技术参考。
-
关键词
数据处理
交通数据清洗
缺失值预测
信息熵
自适应权重
-
Keywords
data processing
traffic data cleaning
missing value prediction
information entropy
adaptive weight
-
分类号
TP391.7
[自动化与计算机技术—计算机应用技术]
-