基于数据增强的中文医疗命名实体识别被引量：13

Data Augmentation for Chinese Clinical Named Entity Recognition

导出

摘要由于缺乏大量已标注数据,在中文医疗命名实体识别中,主要利用外部资源来改善医疗实体识别的性能,这需要大量的时间和有效的规则加入外部资源.为了解决标注数据不足的问题,提出了一种基于生成对抗网络的数据增强算法,自动生成大量标注数据,提高医疗实体识别的性能.实验结果表明,该算法在性能方面优于实验中的基准模型,证明了该算法在医疗实体识别上的有效性. Chinese clinical named entity recognition plays an important role in recognizing medical entities contained in Chinese electronic medical records.Limited to lack of large annotated data,most of existing methods concentrate on employing external resources to improve the performance of clinical named entity recognition,which require lots of time and efficient rules.To solve the problem of lack of large annotated data,data augmentation using sequence adversarial generative network is used to generate more various data depending on entities and non-entities in the training set.Experiments show that when using generated data to expand training set,the proposed named entity recognition system has achieved competitive performance compared with state-of-art methods,which shows the effectiveness of our data augmentation method.

作者王蓬辉李明正李思 WANG Peng-hui;LI Ming-zheng;LI Si(School of Artificial Intelligence,Beijing University of Posts and Telecommunications,Beijing 100876,China)

机构地区北京邮电大学人工智能学院

出处《北京邮电大学学报》 EI CAS CSCD 北大核心 2020年第5期84-90,共7页 Journal of Beijing University of Posts and Telecommunications

基金国家自然科学基金项目(61702047)

关键词命名实体识别数据增强序列生成对抗网络 named entity recognition data augmentation generative adversarial network

分类号 R197.1 [医药卫生—卫生事业管理] TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介王蓬辉(1996—),男,硕士生;通信作者:李思(1985—),女,副教授,E-mail:lisi@bupt.edu.cn.

引文网络
相关文献

同被引文献161

1张妍,王蕊,李天来,须晖,许巧莉.黄瓜霜霉病菌侵染黄瓜叶片过程中内部组织变化的研究[J].植物生理学报,2019,55(12):1797-1805. 被引量：3
2李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：63
3徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：8
4张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：15
5李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：25
6张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：16
7佘俊,张学清.音乐命名实体识别方法[J].计算机应用,2010,30(11):2928-2931. 被引量：8
8闫萍.基于规则和概率统计相结合的中文命名实体识别研究[J].计算机与数字工程,2011,39(9):88-91. 被引量：13
9潘正高.基于规则和统计相结合的中文命名实体识别研究[J].情报科学,2012,30(5):708-712. 被引量：32
10朱岩,景丽萍,于剑.一种利用近邻和信息熵的主动文本标注方法[J].计算机研究与发展,2012,49(6):1306-1312. 被引量：4

引证文献13

1屈倩倩,阚红星.基于Bert-BiLSTM-CRF的中医文本命名实体识别[J].电子设计工程,2021,29(19):40-43. 被引量：27
2艾新波,郭彦君,谢云昊,陈成.基于ERNIE-CRF-ESL安全隐患文本结构化解析[J].北京邮电大学学报,2021,44(5):107-113. 被引量：2
3郑丽敏,任乐乐.采用融合规则与BERT-FLAT模型对营养健康领域命名实体识别[J].农业工程学报,2021,37(20):211-218. 被引量：6
4黄铭,刘捷,戴齐.融合字词特征的中文嵌套命名实体识别[J].现代计算机,2021,27(34):21-28. 被引量：1
5刘兴丽,范俊杰,马海群.面向小样本命名实体识别的数据增强算法改进策略研究[J].数据分析与知识发现,2022,6(10):128-141. 被引量：7
6王颖洁,张程烨,白凤波,汪祖民,季长清.中文命名实体识别研究综述[J].计算机科学与探索,2023,17(2):324-341. 被引量：34
7张领先,韩梦瑶,丁俊琦,李凯雨.作物病害智能诊断与处方推荐技术研究进展[J].农业机械学报,2023,54(6):1-18. 被引量：7
8王海荣,徐玺,王彤,荆博祥.多模态命名实体识别方法研究进展[J].郑州大学学报（工学版）,2024,45(2):60-71. 被引量：1
9王颖洁,张程烨,白凤波,汪祖民.基于Transformer的司法文书命名实体识别方法[J].计算机科学,2024,51(S01):113-121. 被引量：2
10田雪涵,董坤,赵剑锋,郭希瑞.基于增强优化预训练语言模型的电力数据实体识别方法[J].智慧电力,2024,52(6):100-107. 被引量：4

二级引证文献90

1赵奎,杜昕娉,高延军,马慧敏.融合文字与标签的电子病历命名实体识别[J].计算机系统应用,2022,31(10):375-381. 被引量：2
2李灿,解丹.中医电子病历入院记录信息自动抽取方法研究[J].世界科学技术-中医药现代化,2023,25(5):1615-1622. 被引量：1
3李震,李佳盟,王楠,张源,孙红,李民赞.基于轻量化改进模型的小麦白粉病检测装置研发[J].农业机械学报,2023,54(S02):314-322. 被引量：1
4左昊轩,黄祺成,杨佳昊,孙泉,李思恩,李莉.基于改进YOLO v5s的作物黄化曲叶病检测方法[J].农业机械学报,2023,54(S01):230-238. 被引量：9
5杨佳昊,左昊轩,黄祺成,孙泉,李思恩,李莉.基于YOLO v5s的作物叶片病害检测模型轻量化方法[J].农业机械学报,2023,54(S01):222-229. 被引量：10
6张硕,赵卓峰,刘晨.基于图卷积网络的产业领域科技服务资源命名实体识别[J].计算机与数字工程,2023,51(1):20-27.
7杨雷,韦韩,龚尚文,赵莺菲.基于LSTM的桥梁养护文本数据的命名实体识别方法[J].公路交通科技,2023,40(S02):187-192.
8王松,李正钧,杨涛,胡孔法.中医药知识图谱研究现状及发展趋势[J].南京中医药大学学报,2022,38(3):272-278. 被引量：31
9耿汝山,陈艳平,唐瑞雪,黄瑞章,秦永彬,董博.跨度语义增强的命名实体识别方法[J].西安交通大学学报,2022,56(7):118-126. 被引量：3
10赵良,张赵玥,廖子逸,王玲.用BERT和改进PCNN模型抽取食品安全领域关系[J].农业工程学报,2022,38(8):263-270. 被引量：8

1李成丽.不要忽视小学语文教学中的口语交际教学[J].语文新读写,2020(29):152-152.
2许淑琴,高丽,王友民.一流课程目标下本科税法课程开展混合式教学改革的思考[J].高教学刊,2021(8):24-27. 被引量：24
3王亦凡,李继云.基于异构图嵌入学习的相似病案推荐[J].计算机系统应用,2020,29(10):228-234. 被引量：1
4吴文浩,谢志芳.教育对外开放进程中国际学生辅导员的角色定位与角色实现[J].黑龙江高教研究,2020(10):35-39. 被引量：8

北京邮电大学学报

2020年第5期

浏览历史

内容加载中请稍等...

基于数据增强的中文医疗命名实体识别被引量：13

同被引文献161

引证文献13

二级引证文献90

相关作者

相关机构

相关主题

浏览历史

基于数据增强的中文医疗命名实体识别 被引量：13

同被引文献161

引证文献13

二级引证文献90

相关作者

相关机构

相关主题

浏览历史

基于数据增强的中文医疗命名实体识别被引量：13