期刊文献+

基于句子特征和语义距离的文本摘要技术 被引量:3

Text Summarization Based on the Sentence Features and Semantic Distance
在线阅读 下载PDF
导出
摘要 自动摘要是解决网络信息过载问题的关键技术之一。在对文本中句子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法。首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要。实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能。 The technology of automatic text summarization provide a solution to the information overload problem. This paper proposes an effective method to extract salient sentences using the sentence features and semantic distance. The proposed method combines three steps: the first ste Pis to calculate the sentence feature weight based on its features, the second ste Pis to modify the sentence weight through the semantic computation among sentences, the last ste Pis to choose the sentence which own the highest weight and deal with the summary smoothly. The experimental results on web pages show that our proposed method can make high quality summarization in different compression ratio, has promising performance.
作者 张培颖
出处 《微计算机应用》 2009年第7期14-18,共5页 Microcomputer Applications
基金 中国石油大学(华东)计算机与通信工程学院青年教师创新基金资助(08120907)
关键词 文本摘要 句子特征 语义距离 句子抽取 text summarization, sentence feature, semantic distance, sentence extraction
作者简介 张培颖,男,(1981-),讲师,主要研究方向:自然语言处理、信息检索。
  • 相关文献

参考文献6

  • 1Mohamed Abdel Fattah,Fuji Ren.Automatic Text Summarization.International Journal of Computer Science.2008,3 (1):25~28
  • 2Youngjoong Ko,Jungyun Seo.An effective sentence-extraction technique using contextual information and statistical approached for text summarization.Pattern Recognition Letters,2008,(29):1366~1371
  • 3董振东.[EB/OL].知网http://www.keenage.com,1999.
  • 4刘群,李素建.基于知网的词汇语义相似度计算.第三届汉语词汇语义学研讨会论文集.中国台北,2002:59-76.
  • 5江敏,肖诗斌,王弘蔚,施水才.一种改进的基于《知网》的词语语义相似度计算[J].中文信息学报,2008,22(5):84-89. 被引量:109
  • 6王萌,李春贵,唐培和,王晓荣.一种主题句发现的中文自动文摘研究[J].计算机工程,2007,33(8):180-181. 被引量:8

二级参考文献21

  • 1夏天,樊孝忠,刘林,骆正华.基于ALICE的汉语自然语言接口[J].北京理工大学学报,2004,24(10):885-889. 被引量:11
  • 2吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量:218
  • 3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量:328
  • 4李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量:106
  • 5Luhn H R The Automatic Creation of Literature Abstracts[J]. IBM J.Res. and Dev., 1958, 2(2): 159-165.
  • 6Tadashi N, Yuji M. A New Approach to Unsupervised Text Summarization[C]//Proceedings ofACM SIGIR'01. 2001.
  • 7Po H, Tingting H, Ji Donghong. Chinese Text Summarization Based On Thematic Area Detection[C]//Proceedings of the ACL'04 Workshop. 2003.
  • 8Yihong Gong, Xin Liu. Generic Text Summarization Using Relevance Measure and Latent Semantic Analysis[C]//Proc. of SIGIR'01. 2001
  • 9Brigitte E, Elisabeth M, Alexander S. How to Implement a Naturalistic Model of Abstracting: Four Core Working Steps of An Expert Abstractor[J]. Informatin Processing & Management, 1995, 31(5).
  • 10Radev D R, Hovy E, McKeown K. Introduction to the Special Issue on Summarization[J]. Computational Linguistics, 2002, 28(4).

共引文献133

同被引文献39

引证文献3

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部