-
题名多源在线地理编码服务分类优化模型
被引量:7
- 1
-
-
作者
廖薇薇
柳林
周素红
宋广文
李秋萍
刘凯
-
机构
中山大学地理科学与规划学院综合地理信息研究中心
广州大学地理科学学院公共安全地理信息分析中心
辛辛那提大学地理系
-
出处
《热带地理》
北大核心
2018年第2期255-263,共9页
-
基金
国家自然科学重点基金项目(41531178)
国家自然科学基金优秀青年基金项目(41522104)
+1 种基金
广东省自然科学基金研究团队项目(2014A030312010)
广东省科技计划项目(2015A020217003)
-
文摘
利用在线地理编码API解决海量中文地址快速编码问题,在此基础上,利用简单的规则对编码结果进行清洗、标记,最后通过基于系统聚类与随机森林的分类优化模型,将多平台编码结果分类处理、优化。利用广州市盗窃案件地址对模型进行训练与验证,结果表明:相比未处理的编码结果,经模型优化过的编码结果整体位置误差距离减小。高德的地理编码服务有着最好的编码质量,但训练样本的高德编码误差均值仍高达590.43 m,经模型优化后,样本的编码误差均值降至173.73 m,验证样本编码误差均值由554.88 m(高德)降至180.04 m,降低了67.49%,高德90.08%的异常编码结果被清洗优化。对于训练样本与验证样本,模型优化效果相似;对于地址类型不同的案件、位于市区与市郊的案件,模型优化效果相似,说明模型具有一定普适性。该模型能够方便快捷地将海量社会经济信息转化为空间数据,提高编码精度,为地理大数据的研究提供更好的数据支持。
-
关键词
在线地理编码
数据清洗
系统聚类
随机森林
-
Keywords
online geocoding service
data cleaning
hierarchical clustering method
random forest
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-