摘要
近年来,我国数字图书馆发展迅速,为馆藏资源的深度挖掘和利用提供了基础。该文以数字化的方志古籍为研究语料,在全文人工标注的基础上,通过分析物产别名的内外部特征,构建基于条件随机场的别名自动抽取模型,精确率达到了93.52%。实验结果表明,条件随机场模型能够较好的应用于方志类古籍内容挖掘,为数字图书馆资源利用提供借鉴。
Recently,the rapid development of digital library in China provides a foundation for the deep excavation and utilization of collection resources.Taking the digital ancient local chronicles as research corpus,this paper analyzes the internal and external features of aliases based on full-text manual annotation,and proposes an automatic extraction model of alias based on conditional random field.The accuracy of the model reaches 93.52%,indicating that the CRFs model is suitable for the content mining of ancient local chronicles.
作者
李娜
LI Na(College of Humanities and Social Sciences,Nanjing Forestry University,Nanjing,Jiangsu 210037,China)
出处
《中文信息学报》
CSCD
北大核心
2018年第11期41-48,61,共9页
Journal of Chinese Information Processing
基金
2018年度江苏高校哲学社会科学研究基金(2018SJA0122)
关键词
方志古籍
条件随机场
别名
古籍整理
ancient local chronicles
Conditional Random Fields
Alias
collation of ancient books
作者简介
李娜(1985-),博士,讲师,主要研究领域为文本挖掘与可视化。E-mail:rwlina@njfu.edu.cn.