-
题名基于句法分析的代码摘要技术
被引量:2
- 1
-
-
作者
王金水
薛醒思
翁伟
-
机构
福建工程学院信息科学与工程学院
厦门理工学院计算机与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2015年第7期1999-2003,共5页
-
基金
国家自然科学基金资助项目(61402108)
福建省中青年教师教育科研资助项目(JA14221)
+1 种基金
福建工程学院科研启动基金资助项目(GY-Z13113
GY-Z14068)
-
文摘
针对词袋模型忽略了词条之间语义关系和概念结构的问题,提出一种基于句法分析的代码摘要技术。首先,该技术利用词性标注识别出最有可能体现代码特性的关键词;然后,通过块分析修正在词性标注过程中可能引入的错误;其次,对标识出的关键词进行降噪,以减少文本噪声带来的不利影响;最后,从关键词中选取若干个权值最高的词以组成代码摘要。实验结果表明,与基于词频-逆文档频率(TF-IDF)和基于TF-IDF扩展的代码摘要技术对比,所提技术生成的代码摘要与参考答案的重叠率(overlap)至少分别提高了9%和6%,说明该技术能够生成更加准确的代码摘要。
-
关键词
代码摘要
文本摘要
句法分析
自然语言处理
程序理解
-
Keywords
source code summarization
text summarization
syntactic analysis
natui'al language processing
program comprehension
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名文摘生成系统中词典的一种构造方法
被引量:1
- 2
-
-
作者
孙春葵
钟义信
-
机构
北京邮电大学信息工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
1999年第8期17-19,共3页
-
基金
国家863计划的资助!863-317-9601-06-03
-
文摘
文章讨论了针对文摘生成系统如何有效地建立一种全信息词典,在正确进行自动分词的同时,为后续的文本分析提供尽可能多的词法、词义及词用信息,以便生成具有理解能力的高质量的文本摘要。
-
关键词
文摘生成系统
词典
神经网络
-
Keywords
comprehensive lexicon, text summarization
-
分类号
G257.5
[文化科学—图书馆学]
-