-
题名基于社交媒体大数据的城市洪涝识别与模拟验证
- 1
-
-
作者
张克寒
梅超
刘家宏
王佳
宋天旭
石虹远
-
机构
中国水利水电科学研究院流域水循环与水安全全国重点实验室
水利部数字孪生流域重点实验室
-
出处
《水科学进展》
北大核心
2025年第4期566-580,共15页
-
基金
国家重点研发计划项目(2022YFC3090600,2022YFE0205200)。
-
文摘
传统的城市水文监测手段在极端洪涝条件下面临一定失效风险,亟需新型监测手段进行补充。本研究提出了一种基于社交媒体大数据的城市洪涝识别方法,采用爬虫技术(BeautifulSoup4)提取社交媒体大数据中的洪涝相关词条,结合BERT(Bidirectional Encoder Representations from Transformers)+CRF(Conditional Random Field)命名体识别技术提取洪涝积水点地理信息,以2021年7月20日郑州极端暴雨洪涝灾害为例,通过与调查积水点空间分布和城市洪涝数值模拟对比验证识别方法的准确性。结果表明:基于社交媒体大数据识别的积水点与调查积水点空间分布基本一致,空间重合率达89.4%,空间重合的识别积水点中,水深在30~<50 cm、50~<100 cm、100~<200 cm、200~<300 cm和≥300 cm的比例依次为49.6%、36.8%、8.2%、4.1%和1.3%;50年一遇和100年一遇设计降雨、2019年8月1日和2024年7月22日实测降雨情景模拟结果从空间趋势上体现了识别结果的合理性。基于社交媒体大数据的城市洪涝识别是极端条件下洪涝监测的一种重要补充,可作为城市洪涝数值模拟验证、洪涝灾害应急决策的重要支撑。
-
关键词
城市洪涝模拟
洪涝识别
社交媒体大数据
命名体识别
-
Keywords
urban flood simulation
flood identification
social media big data
named entity recognition
-
分类号
TV122
[水利工程—水文学及水资源]
-
-
题名词边界字向量的中文命名实体识别
被引量:8
- 2
-
-
作者
姚霖
刘轶
李鑫鑫
刘宏
-
机构
深港产学研基地
北京大学信息科学技术学院
哈尔滨工业大学软件学院
哈尔滨工业大学深圳研究生院计算机科学与技术学院
-
出处
《智能系统学报》
CSCD
北大核心
2016年第1期37-42,共6页
-
基金
原创项目研发与非遗产业化资助项目(YC2015057)
-
文摘
常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络从大量未标注数据中,自动抽取出蕴含其中的特征信息,生成字特征向量。同时考虑到汉字不是中文语义的最基本单位,单纯的字向量会由于一字多义造成语义的混淆,因此根据同一个字在词中处于不同位置大多含义不同的特点,将单个字在词语中所处的位置信息加入到字特征向量中,形成词边界字向量,将其用于深度神经网络模型训练之中。在Sighan Bakeoff-3(2006)语料中取得了F189.18%的效果,接近当前国际先进水平,说明了该系统不仅摆脱了对特征提取的依赖,也减少了汉字一字多义产生的语义混淆。
-
关键词
机器学习
中文命名体识别
深度神经网络
特征向量
特征提取
-
Keywords
machine learning
Chinese named entity recognition
deep neutral networks
feature vector
feature extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-