期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于社交媒体大数据的城市洪涝识别与模拟验证
1
作者 张克寒 梅超 +3 位作者 刘家宏 王佳 宋天旭 石虹远 《水科学进展》 北大核心 2025年第4期566-580,共15页
传统的城市水文监测手段在极端洪涝条件下面临一定失效风险,亟需新型监测手段进行补充。本研究提出了一种基于社交媒体大数据的城市洪涝识别方法,采用爬虫技术(BeautifulSoup4)提取社交媒体大数据中的洪涝相关词条,结合BERT(Bidirection... 传统的城市水文监测手段在极端洪涝条件下面临一定失效风险,亟需新型监测手段进行补充。本研究提出了一种基于社交媒体大数据的城市洪涝识别方法,采用爬虫技术(BeautifulSoup4)提取社交媒体大数据中的洪涝相关词条,结合BERT(Bidirectional Encoder Representations from Transformers)+CRF(Conditional Random Field)命名体识别技术提取洪涝积水点地理信息,以2021年7月20日郑州极端暴雨洪涝灾害为例,通过与调查积水点空间分布和城市洪涝数值模拟对比验证识别方法的准确性。结果表明:基于社交媒体大数据识别的积水点与调查积水点空间分布基本一致,空间重合率达89.4%,空间重合的识别积水点中,水深在30~<50 cm、50~<100 cm、100~<200 cm、200~<300 cm和≥300 cm的比例依次为49.6%、36.8%、8.2%、4.1%和1.3%;50年一遇和100年一遇设计降雨、2019年8月1日和2024年7月22日实测降雨情景模拟结果从空间趋势上体现了识别结果的合理性。基于社交媒体大数据的城市洪涝识别是极端条件下洪涝监测的一种重要补充,可作为城市洪涝数值模拟验证、洪涝灾害应急决策的重要支撑。 展开更多
关键词 城市洪涝模拟 洪涝识别 社交媒大数据 命名体识别
在线阅读 下载PDF
词边界字向量的中文命名实体识别 被引量:8
2
作者 姚霖 刘轶 +1 位作者 李鑫鑫 刘宏 《智能系统学报》 CSCD 北大核心 2016年第1期37-42,共6页
常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络... 常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络从大量未标注数据中,自动抽取出蕴含其中的特征信息,生成字特征向量。同时考虑到汉字不是中文语义的最基本单位,单纯的字向量会由于一字多义造成语义的混淆,因此根据同一个字在词中处于不同位置大多含义不同的特点,将单个字在词语中所处的位置信息加入到字特征向量中,形成词边界字向量,将其用于深度神经网络模型训练之中。在Sighan Bakeoff-3(2006)语料中取得了F189.18%的效果,接近当前国际先进水平,说明了该系统不仅摆脱了对特征提取的依赖,也减少了汉字一字多义产生的语义混淆。 展开更多
关键词 机器学习 中文命名体识别 深度神经网络 特征向量 特征提取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部