期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文医疗文本中的嵌套实体识别方法 被引量:5
1
作者 闫璟辉 宗成庆 徐金安 《软件学报》 EI CSCD 北大核心 2024年第6期2923-2935,共13页
实体识别是信息抽取的关键技术.相较于普通文本,中文医疗文本的实体识别任务往往面对大量的嵌套实体.以往识别实体的方法往往忽视了医疗文本本身所特有的实体嵌套规则而直接采用序列标注方法,为此,提出一种融合实体嵌套规则的中文实体... 实体识别是信息抽取的关键技术.相较于普通文本,中文医疗文本的实体识别任务往往面对大量的嵌套实体.以往识别实体的方法往往忽视了医疗文本本身所特有的实体嵌套规则而直接采用序列标注方法,为此,提出一种融合实体嵌套规则的中文实体识别方法.所提方法在训练过程中将实体的识别任务转化为实体的边界识别与边界首尾关系识别的联合训练任务,在解码过程中结合从实际医疗文本中所总结出来的实体嵌套规则对解码结果进行过滤,从而使得识别结果能够符合实际文本中内外层实体嵌套组合的组成规律.在公开的医疗文本实体识别的实验上取得良好的效果.数据集上的实验表明,所提方法在嵌套类型实体识别性能上显著优于已有的方法,在整体准确率方面比最先进的方法提高0.5%. 展开更多
关键词 实体识别 中文文本 医疗领域 嵌套实体识别 边界识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部