基于膨胀卷积的中文命名实体识别

Chinese named entity recognition based on dilated convolution

在线阅读下载PDF

导出

摘要基于循环神经网络模型在命名实体识别任务中限制了GPU并行计算效率,提出融合全局词频统计的膨胀卷积模型。对训练语料文本向量化后,使用文本向量训练膨胀卷积神经网络各节点权重,通过条件随机场有效避免预测结果产生不符合规则标签。在MSRA数据集上,F1值达到了92.12%,在简历数据集上,F1值达到了93.48%。模型的训练速度相比Bi-LSTM-CRF模型提高了3倍。条件随机场虽然能够学习到标签之间的潜在关系,但极大地降低了模型的运行速度。同时在序列建模中,卷积神经网络无法考虑词的有序关系。实验结果表明,本文的模型可在保持高精度的同时,具有更快的处理速度。 Recurrent neural networks have limited GPU parallelism computation efficiency in named entity recognition tasks.To solve this problem,we proposed a dilated convolution neural network model by introducing global word frequency statistics.Firstly,we vectorize our corpus,and then calculate the node weights of the dilated convolution neural network with the vectorized corpus.Finally,a conditional random field is used to effectively prevent irregular results from training datasets.A maximum F1 score of 92.12%is obtained on the MSRA benchmark datasets,and a maximum F1 score of 93.48%is obtained on the resume benchmark datasets.The model is around 3 times faster than Bi-LSTM-CRF model.Although the conditional random field can learn the potential relationship between the labels,it greatly reduces the computing speed.The convolutional neural network cannot consider the ordered relation of the tokens in sequence modelling.The experimental results show that our model provides very high training speed while maintaining high accuracy.

作者张东迟呈英战学刚 ZHANG Dong;CHI Chengying;ZHAN Xuegang(School of Computer Science and Software Engineering,University of Science and Technology Liaoning,Anshan 114051,China)

机构地区辽宁科技大学计算机与软件工程学院

出处《辽宁科技大学学报》 CAS 2020年第3期231-236,共6页 Journal of University of Science and Technology Liaoning

基金国家自然科学基金(61672138)。

关键词命名实体识别膨胀卷积序列标注 named entity recognition dilated convolution sequence labelling

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介张东(1996-),男,辽宁海城人;通讯作者:迟呈英(1963-),女,辽宁鞍山人,教授。

引文网络
相关文献

参考文献1

1刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：158

二级参考文献22

1张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：67
2孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：88
3向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
4刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：48
5俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：163
6周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：113
7张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：21
8冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):104-110. 被引量：24
9张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：84
10张玥杰,徐智婷,薛向阳.融合多特征的最大熵汉语命名实体识别模型[J].计算机研究与发展,2008,45(6):1004-1010. 被引量：33

共引文献157

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：4
2刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
3张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：15
4熊奥,高畅,赵明辉,张玲玲.基于知识图谱的核电设备健康管理知识建模与分析[J].科技促进发展,2021,17(4):640-649. 被引量：10
5顾佼佼,翟一琛,姬嗣愚,宗富强.基于BERT和知识蒸馏的航空维修领域命名实体识别[J].电子测量技术,2023,46(3):19-24. 被引量：3
6李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：30
7高源.自然语言处理发展与应用概述[J].中国新通信,2019,21(2):117-118. 被引量：8
8马孟铖,艾斯卡尔.艾木都拉,吐尔地.托合提.基于条件随机场多特征融合的中文地名、机构名实体识别[J].现代计算机,2019,25(12):13-17. 被引量：5
9侯丽仙,李艳玲,李成城.面向任务口语理解研究现状综述[J].计算机工程与应用,2019,55(11):7-15. 被引量：11
10朱淑媛,罗军.基于本体的领域自动问答系统研究[J].计算机应用与软件,2019,36(8):98-105. 被引量：8

1马千程,王崑声,周晓纪.基于深度学习的竞争情报命名实体识别研究[J].情报探索,2020(9):1-7. 被引量：2
2马孟铖,杨晴雯,艾斯卡尔·艾木都拉,吐尔地·托合提.基于词向量和条件随机场的中文命名实体分类[J].计算机工程与设计,2020,41(9):2515-2522. 被引量：9
3黄胜琼.初中数学教学中的情景教学研究[J].读与写（上旬）,2020(10):157-157.
4李敏.体验式教学法在小学英语故事教学中的应用浅析[J].英语画刊（高级）,2020(11):86-86. 被引量：2
5刘再行,刘毅,郜洵.人工智能语义分析技术在用户研究中的应用[J].包装工程,2020,41(18):53-59. 被引量：6
6黄彪,陈倩,吴钦,王国玉.基于循环水洞测试技术的流体力学研究教学应用[J].实验室科学,2020,23(4):5-8. 被引量：3
7徐毅超,杜青.特发性脊柱侧凸与关节松弛的相关性研究进展[J].教育生物学杂志,2020,8(3):203-207.
8孙敏,李旸,庄正飞,余大为.基于并行混合网络融入注意力机制的情感分析[J].计算机应用,2020,40(9):2543-2548. 被引量：3
9刘先林,骆俊晖,米德才.广西花岗岩软土地基沉降预测及承载力评价[J].中外公路,2020,40(4):25-28. 被引量：7
10查孝柱,徐源,李卫平.中国山药研究现状的文献计量学可视化分析[J].宜春学院学报,2020,42(6):79-83. 被引量：4

辽宁科技大学学报

2020年第3期

浏览历史

内容加载中请稍等...

基于膨胀卷积的中文命名实体识别

参考文献1

二级参考文献22

共引文献157

相关作者

相关机构

相关主题

浏览历史