-
题名中文模糊限制语语料库的研究与构建
被引量:4
- 1
-
-
作者
周惠巍
杨欢
张静
亢世勇
黄德根
-
机构
大连理工大学计算机科学与技术学院
鲁东大学文学院
-
出处
《中文信息学报》
CSCD
北大核心
2015年第6期83-89,共7页
-
基金
国家自然科学基金(61272375
61173100)
-
文摘
模糊限制语常用来表示不确定性和可能性的含义,由模糊限制语所引导的信息为模糊限制信息。为进行中文事实信息的抽取,应将模糊限制信息与事实信息区分开来。然而中文模糊限制语语料资源却十分缺乏,影响了中文模糊限制语和模糊限制信息检测的研究。该文研究了中文模糊限制语的分类,并在生物医学和维基百科两个领域,设计构建了一个具有2.4万句规模的中文模糊限制语语料库。统计分析了语料标注的一致性,以及模糊限制语的类型和领域之间的关系。这些资源对于中文模糊限制信息检测研究,以及中文事实信息的抽取具有重要意义。同时,为语言学家从语义和语用等方面进行模糊限制语的研究提供了强大的知识库支持。
-
关键词
中文模糊限制语
分类
语料库
一致性分析
-
Keywords
Chinese hedge
categorization
corpus
agreement analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于共享表示的跨领域中文模糊限制语识别
- 2
-
-
作者
周惠巍
宁时贤
杨云龙
刘壮
林英玉
李思嘉
-
机构
大连理工大学计算机科学与技术学院
台湾逢甲大学资讯电机学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2019年第2期34-39,共6页
-
基金
国家自然科学基金项目(61772109
61272375)
教育部人文社科项目(17YJA740076)
-
文摘
为充分利用源领域的标注数据,减少目标领域的标注代价,提出一种基于共享表示的跨领域模糊限制语识别方法.该方法利用双向长短期记忆网络,通过参数共享机制交替地学习源领域和目标领域的训练数据,同时引入对抗学习,把各领域私有特征从共享特征中剥离,从而获得不同领域间的共享语义表示.在中文生物医学和维基百科两个领域上的实验表明,基于共享表示的方法在跨领域中文模糊限制语识别性能上明显优于基于实例和基于特征的迁移学习方法.
-
关键词
中文模糊限制语识别
跨领域
共享表示
对抗学习
-
Keywords
Chinese hedge cue detection
cross-domain
shared representation
adversarial learning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-