-
题名基于语料库的明清小说人名与称谓研究
被引量:4
- 1
-
-
作者
熊丹
陆勤
罗凤珠
石定栩
赵天成
-
机构
香港理工大学电子计算学系
台湾元智大学中国语文学系
香港理工大学中文及双语学系
-
出处
《中文信息学报》
CSCD
北大核心
2015年第1期19-27,43,共10页
-
基金
2009年度蒋经国国际学术交流基金会"历代语言知识库建置计划"(RG013-D-09)
-
文摘
在自然语言处理及其应用领域,人名和称谓作为重要的命名实体,是信息处理的关键部分之一。该文从命名实体识别和资讯提取的角度出发,在对4部明清古典小说的语料库进行标注的前提下,建构了姓名、字号和称谓作为命名实体的分类及标注系统。人名和称谓总体上分为单一型和复合型,根据复合型的内部组成元素和组合方式,将其进一步分为固定式、同位式、附属嵌套式、灵活嵌套式。结合语料库的完整数据统计,该文对各类型人名和称谓进行了比较分析,并分别展示了4部名著在人名、称谓使用上的特点。
-
关键词
命名实体标注
人名和称谓分类
语料库构建
-
Keywords
named entity annotation, classification o{ personal names and terms of address, corpus construction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-