期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
基于程序流程图和图注意力网络的跨语言代码抄袭检测方法 被引量:1
1
作者 张峰 韦友良 秦玉成 《小型微型计算机系统》 北大核心 2025年第1期249-256,共8页
跨语言代码抄袭检测在软件知识产权保护和计算机程序设计类课程教学等领域有广泛的应用.然而,不同编程语言的语法差异降低了代码之间的相似度,导致抄袭检测的准确率较低.因此,本文提出一种基于程序流程图和图注意力网络的跨语言代码抄... 跨语言代码抄袭检测在软件知识产权保护和计算机程序设计类课程教学等领域有广泛的应用.然而,不同编程语言的语法差异降低了代码之间的相似度,导致抄袭检测的准确率较低.因此,本文提出一种基于程序流程图和图注意力网络的跨语言代码抄袭检测方法.首先,将代码转换为程序流程图,并利用图注意力网络提取程序流程图的特征作为代码的表示;其次,采用交叉匹配方法逐行对比代码的表示,以获得代码的相似特征向量;最后,拼接待检测代码的相似特征向量,并通过全连接神经网络计算抄袭的概率.实验结果表明,与现有的跨语言代码抄袭检测方法相比,本文提出的方法在查准率、查全率和F1值方面均有提高.其中,与基于属性计数的CLCDSA方法、基于抽象语法树的ASTLearner方法相比,F1值分别提高了11%和16%. 展开更多
关键词 代码抄袭检测 跨编程语言 程序流程图 图注意力网络
在线阅读 下载PDF
SQL-Detector:基于编码特征的SQL习题抄袭检测技术
2
作者 许嘉 莫晓琨 +2 位作者 于戈 吕品 韦婷婷 《计算机科学与探索》 CSCD 北大核心 2022年第9期2030-2040,共11页
结构化查询语言(SQL)是学好数据库技术的关键。然而,大量教学实践表明学生在做SQL习题时存在抄袭现象。现有针对SQL习题的抄袭检测方案或是简单将学生提交的SQL代码进行相似性匹配来发现抄袭问题,或是利用学生在SQL编码习惯上的简单差... 结构化查询语言(SQL)是学好数据库技术的关键。然而,大量教学实践表明学生在做SQL习题时存在抄袭现象。现有针对SQL习题的抄袭检测方案或是简单将学生提交的SQL代码进行相似性匹配来发现抄袭问题,或是利用学生在SQL编码习惯上的简单差异特征来发现抄袭的作业,均没能很好地利用学生书写SQL代码时所展现出的丰富编码特征来实现高精确度的抄袭检测。鉴于此,提出了基于编码特征的SQL习题抄袭检测技术,命名为SQL-Detector。首先,从SQL特性出发提出了面向特定SQL习题的学生习题编码特征和面向编码习惯的学生泛化编码特征,从而实现对学生的画像。其次,通过对学生的习题编码特征进行聚类分析识别出抄袭群体。最后,通过比较学生的习题泛化编码特征与其历史泛化编码特征之间的一致性来判定抄袭者与被抄袭者。利用真实课堂实践收集到的SQL习题答题数据进行实验评估,结果表明SQL-Detector技术对于SQL习题的抄袭检测精确度比相关最好的技术平均提高了14.0%。 展开更多
关键词 SQL习题 抄袭检测 编码习惯 编码特征 层次聚类
在线阅读 下载PDF
CLPDetector:一种基于伪孪生网络的跨语言代码抄袭检测工具 被引量:3
3
作者 李国繁 张峰 刘聪 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1562-1568,共7页
近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有... 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%. 展开更多
关键词 代码抄袭检测 跨语言 抽象语法树 伪孪生网络
在线阅读 下载PDF
ChatGPT生成中文学术内容分析——以情报学领域为例 被引量:11
4
作者 郭鑫 王一博 王继民 《图书馆论坛》 CSSCI 北大核心 2024年第3期134-143,共10页
学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGP... 学术写作是ChatGPT的主要应用方向之一。文章以情报学领域的核心期刊论文为研究对象,首先从词、句、篇3个维度出发,使用词性标注、n-gram等文本处理方法对ChatGPT和人类产出的论文引言内容进行对比分析。然后将判断学术内容是否由ChatGPT生成视作一个二元分类任务,采用朴素贝叶斯、支持向量机、随机森林算法进行文本分类实验,并使用SHAP方法对文本结构特征的重要性进行分析。研究发现:ChatGPT在描述有具体时间节点的事实性信息和引用政策文件或研究报告等方面表现较弱,生成引言的篇幅较集中,撰写论文相较于人类更加“循规蹈矩”;查重工具通常无法准确检测出ChatGPT生成内容的原创性,但分类模型可以比较容易地区分出引言是否由ChatGPT生成,平均句子长度、词汇多样性和文本长度是影响分类结果最重要的文本结构特征。 展开更多
关键词 ChatGPT 论文写作 情报学 文本分类 查重检测
在线阅读 下载PDF
区块链下社交网络用户抄袭识别方案
5
作者 李莉 杨春艳 +1 位作者 朱江文 胡荣磊 《计算机应用》 CSCD 北大核心 2024年第1期242-251,共10页
针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为... 针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为文本相似度检测提供依据。在Merkle树和布隆过滤器结构的基础上,设计了新的索引结构BHMerkle,减少了区块构建和查询时的计算开销,实现了对交易的快速定位。同时提出多特征权重Simhash算法,提高了词权计算的准确性并提高签名值匹配阶段的效率,从而对具有抄袭行为的恶意用户进行识别,并通过奖惩机制遏制恶意行为的发生。抄袭识别方案在不同主题的新闻数据集上的平均准确率为94.8%,平均召回率为88.3%,相较于多维度Simhash算法和基于信息熵加权的Simhash(E-Simhash)算法,平均准确率分别提升了6.19、4.01个百分点,平均召回率分别提升了3.12、2.92个百分点。实验结果表明,所提方案在抄袭文本的查询及检测效率方面均有所提升,且在抄袭识别方面具有较高的准确性。 展开更多
关键词 区块链 抄袭识别 Simhash算法 相似度检测 社交网络
在线阅读 下载PDF
基于图神经网络的代码抄袭检测方法
6
作者 陈昌奉 赵宏州 周恺卿 《计算机工程与科学》 CSCD 北大核心 2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网... 随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。 展开更多
关键词 代码抄袭检测 深度语义和结构信息提取 图神经网络 图注意力网络 特征强化
在线阅读 下载PDF
自然语言文档复制检测研究综述 被引量:69
7
作者 鲍军鹏 沈钧毅 +1 位作者 刘晓东 宋擒豹 《软件学报》 EI CSCD 北大核心 2003年第10期1753-1760,共8页
复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了... 复制检测技术在知识产权保护和信息检索中有着重要应用.到目前为止,复制检测技术主要集中在文档复制检测上.文档复制检测在初期主要检测程序复制,现在则主要为文本复制检测.分别介绍了程序复制检测和文本复制检测技术的发展,详细分析了目前已知各种文本复制检测系统的检测方法和技术特点,并比较了各系统关键技术的异同,最后指出了文本复制检测技术的发展思路. 展开更多
关键词 复制检测 剽窃 知识产权保护 信息检索
在线阅读 下载PDF
基于编译优化和反汇编的程序相似性检测方法 被引量:28
8
作者 赵长海 晏海华 金茂忠 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2008年第6期711-715,共5页
提出了基于编译优化和反汇编的程序相似性检测方法,能够检测出标识符重命名、增加冗余语句、等价的控制结构替换等12种学生常用的抄袭手段.基于该方法,设计和实现了一个程序相似性检测系统BuaaSim,采用编译优化和反汇编技术将源程序转... 提出了基于编译优化和反汇编的程序相似性检测方法,能够检测出标识符重命名、增加冗余语句、等价的控制结构替换等12种学生常用的抄袭手段.基于该方法,设计和实现了一个程序相似性检测系统BuaaSim,采用编译优化和反汇编技术将源程序转化为汇编指令集合,删除和替换汇编指令中对程序本质特征影响不大的易变元素,使用一个与指令顺序无关的决策函数计算程序相似度;还给出一个简单有效的聚类算法,从程序集合中聚类出相似的程序子集.通过与著名的JPlag系统针对两份典型的抄袭样本集进行评测对比,表明本文方法的检测效果具有明显的优势. 展开更多
关键词 抄袭 程序相似性 相似性检测 编译优化
在线阅读 下载PDF
基于局部词频指纹的论文抄袭检测算法 被引量:10
9
作者 秦玉平 冷强奎 +1 位作者 王秀坤 王春立 《计算机工程》 CAS CSCD 北大核心 2011年第6期193-194,197,共3页
提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程... 提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程度上克服了现有论文抄袭检测算法检测精度低的缺点,具有较快的检测速度。 展开更多
关键词 抄袭检测 数字指纹 局部词频 相似度
在线阅读 下载PDF
基于XML的C代码抄袭检测算法 被引量:15
10
作者 钟美 张丽萍 刘东升 《计算机工程与应用》 CSCD 北大核心 2011年第8期215-218,235,共5页
主要研究一种基于XML文本的C代码抄袭检测算法。将C程序源代码转化为XML文本,提取XML文本各行标记的属性,计算XML文本行的相似值,得到程序对的相似度。并对抄袭检测算法实行分类测试:按十二种抄袭手段分类;按复杂语义和复杂数据结构分... 主要研究一种基于XML文本的C代码抄袭检测算法。将C程序源代码转化为XML文本,提取XML文本各行标记的属性,计算XML文本行的相似值,得到程序对的相似度。并对抄袭检测算法实行分类测试:按十二种抄袭手段分类;按复杂语义和复杂数据结构分类。测试结果对比验证了抄袭检测算法的有效性。 展开更多
关键词 XML文本 C代码 相似度 抄袭检测算法
在线阅读 下载PDF
基于篇章结构相似度的复制检测算法 被引量:28
11
作者 金博 史彦军 滕弘飞 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期125-130,共6页
学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题... 学术论文的复制检测研究对于知识产权保护和抑制抄袭侵权等行为有重要意义.国内外主要用数字指纹及关键词匹配等技术进行论文的复制检测.为解决目前中文复制检测难题,给出了一种基于篇章结构相似度的中文学术论文复制检测算法及其问题的数学模型.在分析论文篇章结构的基础上,利用数字指纹和词频统计等技术,经编程实现,用于论文的全抄、部分抄袭和拼抄等抄袭现象的初步检测.与基于全文数字指纹和基于全文词频统计的检测方法相比较,更适用于要求较准确的论文复制检测. 展开更多
关键词 学术论文 复制检测 抄袭识别 数字指纹 词频统计 篇章结构
在线阅读 下载PDF
基于AST的代码抄袭检测方法研究 被引量:7
12
作者 刘呈龙 贾胜颖 +1 位作者 张丽萍 刘东升 《计算机工程与设计》 CSCD 北大核心 2012年第4期1660-1664,共5页
为了检测程序设计类课程中出现的作业抄袭行为,提出了基于抽象语法树的抄袭检测方法。运用语法分析工具对代码进行语法分析生成抽象语法树(AST),通过计算生物学中序列匹配的算法进行程序相似度的计算。提取程序相似部分的AST特征,生成... 为了检测程序设计类课程中出现的作业抄袭行为,提出了基于抽象语法树的抄袭检测方法。运用语法分析工具对代码进行语法分析生成抽象语法树(AST),通过计算生物学中序列匹配的算法进行程序相似度的计算。提取程序相似部分的AST特征,生成空间向量,聚类分析找出"抄袭团伙"。实验结果表明,该方法对抄袭行为具有较好的检测效果,并能比较准确地找到"抄袭团伙"。 展开更多
关键词 抄袭检测 抽象语法树 序列匹配 空间向量模型 聚类
在线阅读 下载PDF
抄袭剽窃论文识别研究综述 被引量:7
13
作者 易彤 徐升华 +1 位作者 万常选 吴方君 《情报学报》 CSSCI 北大核心 2007年第4期567-573,共7页
抄袭剽窃论文的识别是知识产权保护中一项重要的内容,已有众多的识别方法和系统.本文从抄袭剽窃的定义、文本的表示(向量空间模型、广义向量空间模型、隐性语义索引模型)、文本相似度的研究内容、文本相似度的计算方法(基于统计学的... 抄袭剽窃论文的识别是知识产权保护中一项重要的内容,已有众多的识别方法和系统.本文从抄袭剽窃的定义、文本的表示(向量空间模型、广义向量空间模型、隐性语义索引模型)、文本相似度的研究内容、文本相似度的计算方法(基于统计学的计算方法和基于语义理解的计算方法)、数字指纹和词频统计两大类技术和方法和抄袭剽窃识别系统等方面为基本思路,对该领域中已提出的主要研究方案进行了分类阐述和比较分析,总结了其最新研究进展,为下一步的研究提出了新的课题和设想. 展开更多
关键词 剽窃检测 数字指纹 词频统计
在线阅读 下载PDF
基于序列匹配的作业相似度检测系统 被引量:9
14
作者 王晓英 靳力 +1 位作者 王晓青 黄维通 《计算机工程》 CAS CSCD 2012年第24期53-56,61,共5页
为辅助教师进行电子作业的批改和抄袭鉴别,设计并实现一种基于序列匹配的作业相似度检测系统。以班级为分组建立相似度计算模型,利用序列匹配算法计算公共子序列的长度,得到每组作业两两之间的相似度,并在此基础上进行聚类分析,给出可... 为辅助教师进行电子作业的批改和抄袭鉴别,设计并实现一种基于序列匹配的作业相似度检测系统。以班级为分组建立相似度计算模型,利用序列匹配算法计算公共子序列的长度,得到每组作业两两之间的相似度,并在此基础上进行聚类分析,给出可视化结果。实验结果表明,该系统具有较强的实用性,能够辅助教师在批改作业时快速高效地鉴别疑似抄袭的情况。 展开更多
关键词 电子作业 相似度检测 抄袭检测 序列匹配 相似度聚类 公共子序列
在线阅读 下载PDF
一种基于BP神经网络的代码相似性检测方法 被引量:12
15
作者 熊浩 晏海华 +2 位作者 黄永刚 郭涛 李舟军 《计算机科学》 CSCD 北大核心 2010年第3期159-164,共6页
如何有效地检测程序设计课程作业中的抄袭现象是一个重要的问题。传统的抄袭检测方法主要利用代码的属性或结构信息来度量代码之间的相似性。给出了一种基于误差反向传播(BP算法)多层前向神经网络的代码抄袭检测方法。提取程序之间的7... 如何有效地检测程序设计课程作业中的抄袭现象是一个重要的问题。传统的抄袭检测方法主要利用代码的属性或结构信息来度量代码之间的相似性。给出了一种基于误差反向传播(BP算法)多层前向神经网络的代码抄袭检测方法。提取程序之间的7种比较特征作为神经网络的输入,经过网络计算后得出程序的相似值,并将该值与抄袭决策阈值相比较以判定存在抄袭现象的程序集。实验结果表明,本方法具有很好的检测效果。 展开更多
关键词 抄袭 相似性检测 BP神经网络 比较特征
在线阅读 下载PDF
一种基于静态词法树的程序相似性检测方法 被引量:4
16
作者 熊浩 晏海华 +1 位作者 赫建营 赵长海 《计算机应用研究》 CSCD 北大核心 2009年第4期1316-1319,1326,共5页
传统的程序相似性检测工具并不能有效地检测出一些常见的高级词法、语义理解变换的抄袭方式。首先归纳了学生常用的三类抄袭手段,然后给出了基于词法树的程序相似性检测方法。以C语言为例,总结了生成词法树的结构体,并对程序的词法树进... 传统的程序相似性检测工具并不能有效地检测出一些常见的高级词法、语义理解变换的抄袭方式。首先归纳了学生常用的三类抄袭手段,然后给出了基于词法树的程序相似性检测方法。以C语言为例,总结了生成词法树的结构体,并对程序的词法树进行主数据流、结构控制流和时序流分析后得出结构体依赖图;使用形式化的图同型方法来判断代码是否相似,还给出了一个聚类方法以获得彼此相似的程序子集。通过与JPlag、BuaaSim系统针对一组典型的抄袭样本集进行评测结果对比,本方法具有更好的检测效果。 展开更多
关键词 抄袭 相似性检测 词法树 形式化 聚类
在线阅读 下载PDF
Java源代码字节码剽窃检测方法及支持系统 被引量:6
17
作者 李虎 刘超 +1 位作者 刘楠 李晓丽 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2010年第4期424-428,共5页
提出一种Java源代码和字节码都适用的剽窃检测方法并实现了支持系统,该方法以类的Java文件或class文件为比较单元,从中抽取代表程序语法和语义特征的5种特征向量,综合计算产生两个类文件之间的相似度,可用于帮助判断两个类文件之间是否... 提出一种Java源代码和字节码都适用的剽窃检测方法并实现了支持系统,该方法以类的Java文件或class文件为比较单元,从中抽取代表程序语法和语义特征的5种特征向量,综合计算产生两个类文件之间的相似度,可用于帮助判断两个类文件之间是否存在全部或部分剽窃现象.在人工修改程序的场景下进行的对比实验结果和剽窃检测实验结果表明,该方法可有效检测程序代码的严格拷贝和近似拷贝,有较高的检测性能,并且能够识别程序剽窃行为中对Java源文件所做的大部分类型的代码变换. 展开更多
关键词 剽窃检测 JAVA源代码 JAVA字节码 相似性度量
在线阅读 下载PDF
软件相似性分析算法的研究综述 被引量:6
18
作者 黄寿孟 高华玲 潘玉霞 《计算机科学》 CSCD 北大核心 2016年第S1期467-470 507,共5页
软件相似性分析算法是为了更好地保护软件的知识产权。此算法并不会加固程序以增加其抵御攻击的能力,而是对两个或两个以上的程序进行比较,判断是否相互包含。该算法有重复代码筛选、软件作者鉴别、软件"胎记"和剽窃检测,它... 软件相似性分析算法是为了更好地保护软件的知识产权。此算法并不会加固程序以增加其抵御攻击的能力,而是对两个或两个以上的程序进行比较,判断是否相互包含。该算法有重复代码筛选、软件作者鉴别、软件"胎记"和剽窃检测,它们最本质的操作就是直接处理程序的源码或二进制可执行文件,将其转换成一种更易于处理的表示形式,从而确定两个程序(或者程序片段)之间的相似度,或是其中一个(部分或全部)是否包含了另一个。最后总结出此类算法的通用格式,并对每种算法作出相应的分析综述表。 展开更多
关键词 软件相似性 相似度算法 重复代码筛选 作者鉴别 软件“胎记” 剽窃检测
在线阅读 下载PDF
一种基于AST的代码抄袭检测方法 被引量:8
19
作者 张丽萍 刘东升 +1 位作者 李彦臣 钟美 《计算机应用研究》 CSCD 北大核心 2011年第12期4616-4620,共5页
针对目前代码抄袭检测方面的研究大多是基于程序源码层面进行相似度比较,不需要对代码进行语法分析,由于忽略程序语法语义,对稍加结构修改的抄袭行为无法有效检测的现状,提出一种基于AST的代码抄袭检测方法。先将代码进行格式化预处理,... 针对目前代码抄袭检测方面的研究大多是基于程序源码层面进行相似度比较,不需要对代码进行语法分析,由于忽略程序语法语义,对稍加结构修改的抄袭行为无法有效检测的现状,提出一种基于AST的代码抄袭检测方法。先将代码进行格式化预处理,再进行词法分析、语法分析,得到对应的AST;然后遍历AST生成代码序列,对代码序列进行相似度计算,从而得到代码的抄袭检测报告。实验结果表明,该方法能够有效检测出C程序代码的抄袭行为,并对C++、Java等多种程序代码的抄袭检测具有一定的通用性和可扩展性。 展开更多
关键词 抽象语法树 抄袭检测 开源语法分析器 相似度
在线阅读 下载PDF
在线评测系统中的源码相似度检测研究与实现 被引量:10
20
作者 陈荣钦 胡永良 +1 位作者 应建健 郭贤海 《实验技术与管理》 CAS 北大核心 2014年第4期109-111,149,共4页
在线评测(online judge,OJ)系统是面向程序设计的源码自动评判系统,目前,许多高校将其扩展并应用到程序设计类课程的辅助教学中。如何有效地检测出源码的抄袭是其有效实施的关键问题之一。结合属性计数算法和Rabin-Karp算法对源码进行比... 在线评测(online judge,OJ)系统是面向程序设计的源码自动评判系统,目前,许多高校将其扩展并应用到程序设计类课程的辅助教学中。如何有效地检测出源码的抄袭是其有效实施的关键问题之一。结合属性计数算法和Rabin-Karp算法对源码进行比对,提出了一种适合于OJ系统源码检测的方法,能自动地对源码进行词法和语法分析,并在比对过程中缓存相关预处理数据,进一步提高检测效率。实验结果表明:该检测方法能有效地检测出OJ系统中的源码抄袭,同时在台州学院在线程序设计综合实验平台中运行效果良好。 展开更多
关键词 源码相似度检测 在线评测系统 字符串匹配
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部