期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于半监督学习和规则相结合的中医古籍命名实体识别研究 被引量:14
1
作者 包振山 宋秉彦 +1 位作者 张文博 孙超 《中文信息学报》 CSCD 北大核心 2022年第6期90-100,共11页
目前针对中医古籍实体识别研究较少,且大多使用有监督学习方法。但古籍数字化程度低、标注语料稀少,且其语言多为文言文,专业术语也不断发展,现有方法无法有效解决以上问题。故而,该文在构建了中医古籍语料库的基础上,通过对中医古籍中... 目前针对中医古籍实体识别研究较少,且大多使用有监督学习方法。但古籍数字化程度低、标注语料稀少,且其语言多为文言文,专业术语也不断发展,现有方法无法有效解决以上问题。故而,该文在构建了中医古籍语料库的基础上,通过对中医古籍中实体名的分析研究,提出了一种基于半监督学习和规则相结合的中医古籍实体识别方法。以条件随机场模型为基本框架,在引入词、词性、词典等有监督特征的同时也引入了通过词向量获得的无监督语义特征,对比不同特征组合的识别性能,确定最优的半监督学习模型,并与其他模型进行了对比。之后,结合古籍语言学特点构建规则库对其进行基于规则的后处理。实验结果中最终F值达到83.18%,证明了该方法的有效性。 展开更多
关键词 半监督学习 条件随机场 命名实体识别 中医古籍
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部