-
题名面向工艺实体识别的双向神经概率转换器
- 1
-
-
作者
李瑞婷
王裴岩
王立帮
杨丹清忻
-
机构
沈阳航空航天大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第S01期248-255,共8页
-
基金
辽宁省应用基础研究计划(2022JH2/101300248)
全国科技名词审定委员会科研项目(YB2022015)
国家自然科学基金(U1908216)。
-
文摘
工艺实体识别旨在识别出产品制造中所遵照或是产生的文本中蕴含的零件、材料、属性和属性值等实体。目前,工艺等领域实体识别大多加入词典或正则规则等领域实体先验知识,修正神经网络模型识别结果或是生成预识别特征加入模型中。但上述方法未能实现领域实体识别的先验知识与神经网络模型统一建模,领域知识的加入没有减小模型训练代价,仍需大量标注数据。为解决上述问题,提出了面向工艺实体识别的双向神经概率转换器(Bi-NPT),将工艺实体识别先验知识建模为正则规则,然后将正则规则转化为参数化的概率有限状态转换器,使得模型在训练前带有实体识别的先验知识,同时具有可训练性。通过在标注数据上的训练,模型能够习得正则规则未覆盖实体的识别能力。实验结果表明,提出的Bi-NPT在未训练的情况下与正则规则实体识别效果相当,这表明未经过训练的初始模型即携带了实体识别知识。在小样本条件下,Bi-NPT优于PER,Template-based BART和NNShot方法;在充足样本条件下,Bi-NPT优于BiLSTM与TENER等方法。
-
关键词
工艺文本
实体识别
正则规则
概率有限状态转换器
-
Keywords
Process text
Entity recognition
Regular rules
Probabilistic finite state transducer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-