-
题名面向电力低资源领域的无监督命名实体识别方法
被引量:5
- 1
-
-
作者
刘荫
张凯
王惠剑
杨冠群
-
机构
国网山东电力集团公司
-
出处
《中文信息学报》
CSCD
北大核心
2022年第6期69-79,共11页
-
基金
国网山东省电力公司科技项目(2020A-013)。
-
文摘
该文提出了一种在低资源条件下,只利用无标注文档资源进行电力领域命名实体识别的无监督方法。该方法收集电力领域相关语料,利用串频统计技术更新电力领域词典,同时根据结构化电力数据解析出实体词及其类型,并通过表示学习获得每种实体类型的代表词表示。同时利用BERT全词遮盖技术对文本中的词语进行预测,计算文本词语和实体类型代表词之间的语义相似度,进而完成命名实体识别及类型判断。实验表明,该方法对数据条件要求低,具有很强的实用性,且易于复用到其他领域。
-
关键词
命名实体识别
无监督方法
电力领域
bert全词遮盖
-
Keywords
named entity recognition
unsupervised method
electric power domain
bert whole word masking
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-