期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
HanNER:一个面向汉语古籍语料命名实体自动抽取的通用框架
被引量:
5
1
作者
严承希
唐雪梅
+2 位作者
杨浩
苏祺
王军
《情报学报》
CSSCI
CSCD
北大核心
2023年第2期203-216,共14页
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解...
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解决,包括少样本学习问题、标注成本管理问题和数据质量控制问题。本研究提出了一个面向古籍资源命名实体自动化抽取的通用框架——HanNER,包括“基于规则的实体预标注”“基于深度主动学习的迭代实体抽取”以及“人机交互模式下的标注决策”三个主要部分。多组实验比较证明了HanNER的可行性和优势,包括基于深度主动学习模型CNN-BiLSTM-CRF+margin的优势、多功能标注模块“标注查询”与“自动推荐”的积极作用以及ZenCrowd-II算法的优势。最后,本研究基于优化后的BERT-CNN-BiLSTM-CRF模型开发了在线的汉语古籍的实体自动抽取系统。HanNER的提出有利于推进汉语古籍实体抽取工作及相关任务在方法与技术上的发展,而且从工程化角度为古籍实体抽取产品的落地提供了借鉴和启发。
展开更多
关键词
汉语古籍
实体抽取
深度主动学习
交互式标注
标签自动汇聚
在线阅读
下载PDF
职称材料
题名
HanNER:一个面向汉语古籍语料命名实体自动抽取的通用框架
被引量:
5
1
作者
严承希
唐雪梅
杨浩
苏祺
王军
机构
中国人民大学信息资源管理学院
中国人民大学数字人文研究中心
北京大学信息管理系
北京大学数字人文研究中心
北京大学外国语学院
出处
《情报学报》
CSSCI
CSCD
北大核心
2023年第2期203-216,共14页
基金
国家自然科学基金项目“中国儒家学术史知识图谱构建研究”(72010107003)
中国博士后科学基金第70批面上资助项目“融合深度学习和知识图谱技术的清史语料数字化整理研究”(2021M703564)。
文摘
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解决,包括少样本学习问题、标注成本管理问题和数据质量控制问题。本研究提出了一个面向古籍资源命名实体自动化抽取的通用框架——HanNER,包括“基于规则的实体预标注”“基于深度主动学习的迭代实体抽取”以及“人机交互模式下的标注决策”三个主要部分。多组实验比较证明了HanNER的可行性和优势,包括基于深度主动学习模型CNN-BiLSTM-CRF+margin的优势、多功能标注模块“标注查询”与“自动推荐”的积极作用以及ZenCrowd-II算法的优势。最后,本研究基于优化后的BERT-CNN-BiLSTM-CRF模型开发了在线的汉语古籍的实体自动抽取系统。HanNER的提出有利于推进汉语古籍实体抽取工作及相关任务在方法与技术上的发展,而且从工程化角度为古籍实体抽取产品的落地提供了借鉴和启发。
关键词
汉语古籍
实体抽取
深度主动学习
交互式标注
标签自动汇聚
Keywords
ancient Chinese texts
entity extraction
deep active learning
interactive annotation
label automatic consolidation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
H13 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
HanNER:一个面向汉语古籍语料命名实体自动抽取的通用框架
严承希
唐雪梅
杨浩
苏祺
王军
《情报学报》
CSSCI
CSCD
北大核心
2023
5
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部