-
题名基于层叠条件随机场的中文医疗机构名识别
被引量:2
- 1
-
-
作者
万业号
刘利军
黄青松
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省计算机应用重点实验室
-
出处
《济南大学学报(自然科学版)》
北大核心
2017年第1期61-66,共6页
-
基金
国家自然科学基金项目(81360230)
-
文摘
针对目前中文医疗机构名识别问题,提出一种基于层叠条件随机场模型的中文医疗机构名识别方法;该方法第一层条件随机场(CRF)模型基于词粒度,结合自定义词典,实现人名、地名以及简单机构名识别,将最终的结果传递到第二层CRF模型;第二层CRF模型通过词性、词界以及上下文等特征最终完成对复合嵌套的医疗机构名实体的识别。结果表明:在封闭实验中,该方法识别正确率达到94.6%,召回率达到96.2%;在开放实验中,该方法识别正确率达到92.3%,召回率达到90.2%。本文模型相比于结合规则的单层CRF模型,F值分别提高1.99%、2.8%,总体结果得到显著改善。
-
关键词
实体识别
机构名
中文医疗机构
层叠条件随机场
嵌套实体
-
Keywords
entity recognition
organization name
Chinese medical institution
cascading conditional random field
nested entity
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-