针对化工安全问题,化工安全事故命名实体识别(NER)可以有效识别事故发生地点、何种化学品参与事故以及致使此事故发生的人员等信息。然而,化工安全事故领域NER中的信息多样且不能充分利用词信息。为解决这些问题,提出使用SoftLexicon的l...针对化工安全问题,化工安全事故命名实体识别(NER)可以有效识别事故发生地点、何种化学品参与事故以及致使此事故发生的人员等信息。然而,化工安全事故领域NER中的信息多样且不能充分利用词信息。为解决这些问题,提出使用SoftLexicon的lattice长短时记忆(LSTM)网络结合自注意力机制的融合网络模型。首先,将输入句子扩展到字符级别,并在引入词信息的过程中结合外部词典资源构造字符特征;其次,将字符特征放进引入自注意力机制的Lattice-LSTMCRF(Conditional Random Field)层,并结合预训练模型BERT(Bidirectional Encoder Representations from Transformers)进行实体识别。实验结果表明,所提模型在化工数据集上的F1分数达到88.61%,在微博和简历公开数据集上的指标值优于字级BiLSTM-CRF、Lattice-LSTM等主流模型。可见,所提模型可以有效完成化工安全事故领域的NER任务。展开更多
文摘针对化工安全问题,化工安全事故命名实体识别(NER)可以有效识别事故发生地点、何种化学品参与事故以及致使此事故发生的人员等信息。然而,化工安全事故领域NER中的信息多样且不能充分利用词信息。为解决这些问题,提出使用SoftLexicon的lattice长短时记忆(LSTM)网络结合自注意力机制的融合网络模型。首先,将输入句子扩展到字符级别,并在引入词信息的过程中结合外部词典资源构造字符特征;其次,将字符特征放进引入自注意力机制的Lattice-LSTMCRF(Conditional Random Field)层,并结合预训练模型BERT(Bidirectional Encoder Representations from Transformers)进行实体识别。实验结果表明,所提模型在化工数据集上的F1分数达到88.61%,在微博和简历公开数据集上的指标值优于字级BiLSTM-CRF、Lattice-LSTM等主流模型。可见,所提模型可以有效完成化工安全事故领域的NER任务。