-
题名面向导游词的景区地理实体显著性排序方法
被引量:2
- 1
-
-
作者
吴越
张翎
龙毅
-
机构
南京师范大学地理科学学院/虚拟地理环境教育部重点实验室
江苏省地理信息资源开发与利用协同创新中心
-
出处
《地理与地理信息科学》
CSCD
北大核心
2022年第3期9-16,共8页
-
基金
国家自然科学基金项目“多模态地理信息融合机制及其关键技术研究”(42171403)。
-
文摘
地理实体显著性排序是面向自然语言的层次化场景认知研究的重要内容之一。导游词作为系统描述特定景区环境、景点与重要资源的自然语言形式,包含大量的景区地理实体,但传统实体排序方法忽视了地理空间信息的重要作用,难以处理地理实体特有的非结构化或半结构化地理空间特征。该文提出一种面向导游词的景区地理实体显著性排序(Geographic Entity Significance Ranking,GESR)模型,通过分析包含空间拓扑关系、模糊形态描述在内的景区地理实体相关特征构建目标排序函数,迭代生成基于样本误差分布与随机梯度下降法的弱学习器,再通过加权平均集成与降误差剪枝获得提升后的强学习器,即排序模型。利用中文导游词文本对模型进行验证,结果表明:1)与3种基线方法对比,GESR模型的归一化折损累积增益达0.8841,AUC达0.7579,排序性能最优;2)空间拓扑关系和模糊形态描述特征对GESR模型的影响最显著;3)相比人群关注热度,GESR模型对导游词中地理实体空间特征的反映能力更强。
-
关键词
导游词
地理实体
显著性
实体排序
空间拓扑关系
模糊形态描述
-
Keywords
tour guide speech
geographic entity
significance
entity ranking
spatial topological relations
ambiguity levels of morphological descriptions
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
TP391.1
[自动化与计算机技术—计算机应用技术]
-