期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于程序流程图和图注意力网络的跨语言代码抄袭检测方法 被引量:1
1
作者 张峰 韦友良 秦玉成 《小型微型计算机系统》 北大核心 2025年第1期249-256,共8页
跨语言代码抄袭检测在软件知识产权保护和计算机程序设计类课程教学等领域有广泛的应用.然而,不同编程语言的语法差异降低了代码之间的相似度,导致抄袭检测的准确率较低.因此,本文提出一种基于程序流程图和图注意力网络的跨语言代码抄... 跨语言代码抄袭检测在软件知识产权保护和计算机程序设计类课程教学等领域有广泛的应用.然而,不同编程语言的语法差异降低了代码之间的相似度,导致抄袭检测的准确率较低.因此,本文提出一种基于程序流程图和图注意力网络的跨语言代码抄袭检测方法.首先,将代码转换为程序流程图,并利用图注意力网络提取程序流程图的特征作为代码的表示;其次,采用交叉匹配方法逐行对比代码的表示,以获得代码的相似特征向量;最后,拼接待检测代码的相似特征向量,并通过全连接神经网络计算抄袭的概率.实验结果表明,与现有的跨语言代码抄袭检测方法相比,本文提出的方法在查准率、查全率和F1值方面均有提高.其中,与基于属性计数的CLCDSA方法、基于抽象语法树的ASTLearner方法相比,F1值分别提高了11%和16%. 展开更多
关键词 代码抄袭检测 跨编程语言 程序流程图 图注意力网络
在线阅读 下载PDF
基于图神经网络的代码抄袭检测方法
2
作者 陈昌奉 赵宏州 周恺卿 《计算机工程与科学》 CSCD 北大核心 2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网... 随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。 展开更多
关键词 代码抄袭检测 深度语义和结构信息提取 图神经网络 图注意力网络 特征强化
在线阅读 下载PDF
基于N-gram的VB源代码抄袭检测方法 被引量:1
3
作者 吴斐 唐雁 补嘉 《重庆理工大学学报(自然科学)》 CAS 2012年第2期86-91,共6页
为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的V... 为了有效地抑制VB程序代码抄袭现象,提出一个基于N-gram的VB源代码抄袭检测方法,利用N-gram来表示VB代码文件,以提高检测准确率。同时采用基于Fork-Join框架的并行计算技术来提高算法效率。通过与MOSS系统的对比实验,证明基于N-gram的VB源代码抄袭检测方法检测准确率高于MOSS系统,并具有处理大规模数据的能力。 展开更多
关键词 代码抄袭检测 N-GRAM 相似度计算 并行计算
在线阅读 下载PDF
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具 被引量:3
4
作者 李国繁 张峰 刘聪 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有... 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%. 展开更多
关键词 代码抄袭检测 跨语言 抽象语法树 伪孪生网络
在线阅读 下载PDF
高教程序代码作业抄袭检测的方法研究与实践
5
作者 于俊 李雅洁 +4 位作者 程礼磊 连顺 谭昶 丁德成 刘淇 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第8期1048-1057,共10页
学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性... 学生的编程水平直接反映技术类课程的学习效果,因此教学考察中程序代码作业的比重也越来越大.由于程序代码作业抄袭成本低,导致抄袭现象不同程度地存在于各高校教学中,严重影响了学生能力的培养和教师教学的效果,打击学生学习的积极性乃至损坏学风.为此以智能且自动化方式找出学生作业的相似之处,分析学生抄袭的总体情况为目的,将人工智能算法和数据处理分析技术相结合,提出一种学生作业抄袭检测方法.首先,分析学生提交的程序代码作业的复杂情况,设计作业数据预处理流程.然后,具体提出了基于KR和Winnowing的程序代码作业相似度检测算法,与传统检测方法相比通过代码格式化等改进手段提升了学生作业相似检测的精准度,并在大批量作业检测实践中,研究优化算法增加了不同学生之间作业相似结果的区分度.为了验证相似度计算部分的有效性和实用性,进一步设计了相关的模拟实验流程(包括与JPlag检测系统的对比),给出在相同实验数据集上不同抄袭类型下的相似度计算结果.最后,依托于科大讯飞博思智慧在线学习平台对该研究进行了真实场景的实际应用.实验结果以及实际应用都表明,该程序代码作业抄袭检测方法,对高校学生程序代码作业相似度检测有效,具有很高的应用价值. 展开更多
关键词 程序代码抄袭检测 相似度检测 在线智慧教育
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部