基于依存分析和错误驱动的中文时间表达式识别被引量：21

Recognizing the Extent of Chinese Time Expressions Based on the Dependency Parsing and Error-Driven Learning

在线阅读下载PDF

导出

摘要时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 Recognizing time expressions is the foundation of its normalization, and its performance directly influences the robustness of the normalization. This paper proposes a new method for recognizing the extents of the time expressions based on dependency parsing and error-driven learning, which begins with time trigger word （namely, the syntactic head of dependency relation）, uses Chinese dependency parsing to recognize the extents of the time expressions, Subsequently, we use the transformation based error-driven learning to improve the performance., which can automatically acquire and modify the rules and get 3.5 % increase after applying the learned rules. Finally, F1 = 76. 38% and F1 -76.57% results are obtained on the closed and the open test set respectively.

作者贺瑞芳秦兵刘挺潘越群李生

机构地区哈尔滨工业大学信息检索研究室

出处《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(60575042)

关键词计算机应用中文信息处理时间表达式识别触发词依存分析错误驱动学习 computer application Chinese information processing time expression recognition trigger word dependency parsing error-driven learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介贺瑞芳（1979-），女，博士生，研究方向为时序信息抽取、时序文本挖掘；秦兵（1968-），女，博士、副教授，主要研究方向为文本挖掘；刘挺（1972-），男，博士、教授，主要研究方向为信息检索、自然语言处理。

引文网络
相关文献

参考文献14

1Mingli Wu,Wenjie Li,Qin Lu,Baoli Li.CTEMP:A Chinese Temporal Parser for Extracting and Normalizing Temporal Information[A].IJCNLP 2005[C].694-706.
2Yang Ye,Victoria Li Fossum,and Steven Abney.Latent features in automatic tense translation between chinese and english[A].In:Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing[C].Sydney,Australia:July 2006.48-55.
3SemEval-2007[EB/OL].http://nlp.cs.swarthmore.edu/semeval/index.shtml.
4Vazov N.A System for Extraction of Temporal Expressions from French Texts based on Syntactic and Semantic Constraints[A].In:Proceedings of the ACL Workshop on Temporal and Spatial Information Processing (2001)[C].96-103.
5Wilson,G.,Mani,I.,Sundheim,B.,and Ferro,L.2001.A multilingual approach to annotating and extracting temporal information[A].In:Proceedings of the Workshop for Temporal and Spatial Information Processing EACL-ACL 2001[C].Toulouse,France:July,2001.
6SETZER,A.2001.Temporal information in newswire articles:An annotation scheme and corpus study[EB/OL].Ph.D.thesis,Univ.of Sheffield.
7Mani,I.2004.Recent Developments in Temporal Information Extraction[A].In:NICOLOV,N.,AND MITKOV,K.,Proceedings of the Conference on Recent Advances In Natural Language Processing[C].John Benjamins.
8ACE2007 evaluation plan[EB/OL].http://projects.ldc.upenn.edu/ace/intro.html 2006-11-6.
9Jang,S.B.,Baldwin,J.and Mani,I.:Automatic TIMEX2 Tagging of Korean News[J].ACM Transactions on Asian Language Information processing 2004,3(1):51-65.
10Estela,S.,Martinez-Barco,Patricio,and Munoz,R.:Recognizing and Tagging Temporal Expressions in Spanish[A].Workshop on Annotation Standards for Temporal Information in Natural Language,LREC 2002[C].

同被引文献264

1王昀,苑春法.基于转换的时间-事件关系映射[J].中文信息学报,2004,18(4):23-30. 被引量：19
2李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量：9
3刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：200
4陈文亮,朱靖波,吕学强.词性标注规则的获取和优化[J].术语标准化与信息技术,2004(2):23-26. 被引量：5
5邓思颖.汉语时间词谓语句的限制条件[J].中国语文,2002(3):217-221. 被引量：23
6陈振宇,陈振宁.怎样计算现代汉语句子的时间信息[J].中文信息学报,2005,19(3):94-104. 被引量：6
7陆丙甫,屈正林.时间表达的语法差异及其认知解释——从“年、月、日”的同类性谈起[J].世界汉语教学,2005,19(2):12-21. 被引量：14
8辛永芬.日汉时间词对比分析及相关问题[J].河南大学学报（社会科学版）,2005,45(3):96-99. 被引量：3
9吴平博,陈群秀,马亮.基于时空分析的线索性事件的抽取与集成系统研究[J].中文信息学报,2006,20(1):21-28. 被引量：21
10周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：115

引证文献21

1李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量：9
2贺瑞芳,秦兵,潘越群,刘挺,李生.基于启发式错误驱动学习的中文时间表达式识别[J].高技术通讯,2008,18(12):1258-1262. 被引量：3
3徐永东,王亚东,刘杨,王伟,权光日.多文档文摘中基于时间信息的句子排序策略研究[J].中文信息学报,2009,23(4):27-33. 被引量：8
4邬桐,周雅倩,黄萱菁,吴立德.自动构建时间基元规则库的中文时间表达式识别[J].中文信息学报,2010,24(4):3-10. 被引量：16
5朱莎莎,刘宗田,付剑锋,朱芳.基于条件随机场的中文时间短语识别[J].计算机工程,2011,37(15):164-167. 被引量：16
6谭红叶,郑家恒,梁吉业.时间关系识别研究进展[J].中文信息学报,2011,25(5):44-52. 被引量：6
7许旭阳,李弼程,张先飞,席耀一.基于条件随机场与自定义规则的时间表达式识别[J].情报学报,2011,30(10):1065-1071. 被引量：3
8沈思,苏新宁,谢靖,王东波.基于清华汉语树库的时间表达式抽取模型构建研究[J].图书情报工作,2012,56(18):127-132. 被引量：6
9肖升,何炎祥,李勇帆.基于依存分析的中文时间表达式类型判定[J].计算机应用,2013,33(6):1582-1586. 被引量：2
10田卫东,李亚娟.基于CRF和错误驱动的中心词识别[J].计算机应用研究,2013,30(8):2345-2348. 被引量：3

二级引证文献84

1赵旭剑,王崇伟,金培权,张晖,杨春明,李波.面向Web的故事脉络挖掘研究综述[J].中文信息学报,2021,35(11):13-33. 被引量：4
2Zhixiang Ji,Xiaohui Wang,Changyu Cai,Hongjian Sun.Power entity recognition based on bidirectional long short-term memory and conditional random fields[J].Global Energy Interconnection,2020,3(2):186-192. 被引量：9
3李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量：9
4张京生.《全国图书馆学情报学精选文摘》编制工作的实践与思考[J].现代情报,2009,29(12):206-208.
5邬桐,周雅倩,黄萱菁,吴立德.自动构建时间基元规则库的中文时间表达式识别[J].中文信息学报,2010,24(4):3-10. 被引量：16
6王东,朱平,朱莎莎,刘炜.Event temporal relation computation based on machine learning[J].Journal of Shanghai University(English Edition),2011,15(5):487-492. 被引量：2
7王风娥,谭红叶,钱揖丽.基于最大熵的句内时间关系识别[J].计算机工程,2012,38(4):37-39. 被引量：12
8沈思,苏新宁,谢靖,王东波.基于清华汉语树库的时间表达式抽取模型构建研究[J].图书情报工作,2012,56(18):127-132. 被引量：6
9岳大鹏,饶岚,王挺.一种针对新闻话题的多文档文摘技术[J].中文信息学报,2012,26(6):79-84. 被引量：3
10刘金岭,倪晓红,王新功.手机短信文本信息流的自动文摘生成[J].现代图书情报技术,2013(2):43-49. 被引量：4

1贺瑞芳,秦兵,潘越群,刘挺,李生.基于启发式错误驱动学习的中文时间表达式识别[J].高技术通讯,2008,18(12):1258-1262. 被引量：3
2吴琼,黄德根.基于条件随机场与时间词库的中文时间表达式识别[J].中文信息学报,2014,28(6):169-174. 被引量：11
3李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量：9
4左亚尧,龙耀发,李杰骏.基于规则的中文时间表达式识别与规范化[J].广东工业大学学报,2014,31(3):88-94. 被引量：3
5高源,席耀一,李弼程,李苏奕.基于词典特征优化和依存关系的中文时间表达式识别[J].信息工程大学学报,2016,17(4):490-495. 被引量：4
6许旭阳,李弼程,张先飞,席耀一.基于条件随机场与自定义规则的时间表达式识别[J].情报学报,2011,30(10):1065-1071. 被引量：3
7王凤玲.基于条件随机域模型的英语时间表达式识别研究[J].电子技术（上海）,2012,39(5):8-10. 被引量：2
8刘莉,何中市,邢欣来,毛小丽.基于语义角色的中文时间表达式识别[J].计算机应用研究,2011,28(7):2543-2545. 被引量：14
9邬桐,周雅倩,黄萱菁,吴立德.自动构建时间基元规则库的中文时间表达式识别[J].中文信息学报,2010,24(4):3-10. 被引量：16
10赵紫玉,徐金安,张玉洁,刘江鸣.规则与统计相结合的日语时间表达式识别[J].中文信息学报,2013,27(6):192-200. 被引量：3

中文信息学报

2007年第5期

浏览历史

内容加载中请稍等...

基于依存分析和错误驱动的中文时间表达式识别被引量：21

参考文献14

同被引文献264

引证文献21

二级引证文献84

相关作者

相关机构

相关主题

浏览历史

基于依存分析和错误驱动的中文时间表达式识别 被引量：21

参考文献14

同被引文献264

引证文献21

二级引证文献84

相关作者

相关机构

相关主题

浏览历史

基于依存分析和错误驱动的中文时间表达式识别被引量：21