-
题名基于结构感知双编码器的代码注释自动生成
被引量:10
- 1
-
-
作者
徐少峰
潘文韬
熊赟
朱扬勇
-
机构
复旦大学计算机科学技术学院上海市数据科学重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第2期304-308,314,共6页
-
基金
国家自然科学基金(U1636207,91546105,20873999)
上海市科学技术委员会科研计划项目(16JC1400801,17511105502)
-
文摘
在软件开发过程中,性能良好的代码注释工具能够提高开发效率并降低维护成本。部分研究者将代码注释自动生成看作将源代码翻译成自然语言注释的翻译任务,但仅考虑源代码的序列信息而忽略了代码内部的结构特性。为此,在常见端到端翻译模型的基础上,利用代码抽象语法树将源代码的结构信息嵌入到编码器解码器翻译模型中,提出一种基于结构感知的双编码器解码器模型,该模型综合考虑源代码的序列信息与代码内部的结构特性。在真实数据集上的实验结果表明,相比PBMT、Seq2seq模型,该模型的BLEU得分较高,且生成的注释更准确和易读。
-
关键词
代码注释生成
抽象语法树
双编码器解码器模型
卷积神经网络
循环神经网络
-
Keywords
code annotation generation
abstract syntax tree
dual encoder and decoder model
Convolutional Neural Network(CNN)
Recurrent Neural Network(RNN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-