-
题名基于模式匹配的交通微博文本位置信息提取模型
被引量:5
- 1
-
-
作者
谭永滨
侯梦飞
张志军
李小龙
程朋根
章泽之
-
机构
东华理工大学测绘工程学院
天津市测绘地理信息研究中心
-
出处
《地理与地理信息科学》
CSCD
北大核心
2021年第5期16-22,共7页
-
基金
国家重点研发计划项目“全球位置信息叠加协议与位置服务网技术”(2017YFB0503700)
国家自然科学基金项目“大数据支持下城市生态环境综合评价及其与人的时空行为耦合效应研究”(41861052)。
-
文摘
及时有效地从快速更新的交通微博文本中提取位置信息是实现智能交通服务的前提之一。该文分析交通事件文本中常用的位置表达模式,结合有限状态机进行位置模式匹配,提出一种微博文本位置信息提取模型。首先根据微博文本位置信息的句法表达特征,基于线性参照方法提取空间特征词的词性与角色属性,构建位置表达模式,并表达为Trie搜索树结构;其次对微博文本进行分词、词性标注等预处理,利用有限状态机建立位置信息提取模型,实现微博文本位置信息提取;最后以南昌、广州、深圳3个城市9799条路况微博文本为实验数据,验证该模型的有效性。结果表明,该模型的准确率和召回率均达85%以上,可有效提取交通微博文本中的位置信息。
-
关键词
交通微博文本
位置
有限状态机
模式匹配
-
Keywords
traffic microblog text
location
finite state machine
pattern matching
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
P208
[天文地球—地图制图学与地理信息工程]
-