期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
一种特征代码过滤方法的改进
1
作者 马金鑫 袁丁 《计算机应用与软件》 CSCD 2010年第8期286-288,共3页
特征代码检测方法是一种严谨的病毒检测解决方法,在病毒防杀领域应用很广泛,具有较大的研究价值。对几种病毒检测技术分析研究,并且以文件过滤驱动的方法对特征代码检测方法进行了实现,针对这种方法的缺点提出了优化方案,添加专门的内... 特征代码检测方法是一种严谨的病毒检测解决方法,在病毒防杀领域应用很广泛,具有较大的研究价值。对几种病毒检测技术分析研究,并且以文件过滤驱动的方法对特征代码检测方法进行了实现,针对这种方法的缺点提出了优化方案,添加专门的内核线程负责处理规则匹配。经过测试表明,优化方案比原有的方法处理速度更快。 展开更多
关键词 文件过滤驱动 特征代码 内核线程
在线阅读 下载PDF
融合多粒度代码特征和孤立森林算法的配置类型识别
2
作者 刘源 刘大伟 +1 位作者 张玉秀 吴明磊 《计算机工程与应用》 北大核心 2025年第13期185-199,共15页
“高内聚、低耦合”设计原则的普及应用,使得代码中通常存在着专门管理配置选项或配置方法的特殊类型,称为配置类型。配置类型有助于研究人员从属性角度和行为角度增进对配置机制的理解,并为配置错误处理技术提供必要的选项集合以及选... “高内聚、低耦合”设计原则的普及应用,使得代码中通常存在着专门管理配置选项或配置方法的特殊类型,称为配置类型。配置类型有助于研究人员从属性角度和行为角度增进对配置机制的理解,并为配置错误处理技术提供必要的选项集合以及选项数据流信息。然而,配置类型研究尚不充分,其识别仍依赖于人工检索。提出一种融合多粒度代码特征和孤立森林算法的配置类型识别方法。基于10个具有代表性的开源软件,手动构建配置类型数据集,通过实证调研配置类型的分布、分类和识别影响因素,总结得到9个调研结果,用于指导配置类型识别。基于调研结果,选取覆盖代码词汇、结构、语义和语法信息的4个类型级粗粒度特征和3个方法级细粒度特征,并为每个特征设计量化算法。考虑到配置类型存在样本类别分布不平衡问题,将识别问题转化为异常检测问题,利用孤立森林算法推荐配置类型,同时设计启发规则减少误报数量。在5个评估软件上的实验结果表明,该方法能识别出每个软件的配置类型,平均精度均值为0.86,平均时间开销为21min,已初步具备代替人工识别的能力。 展开更多
关键词 软件配置 配置类型识别 实证调研 多粒度代码特征 孤立森林 配置方法
在线阅读 下载PDF
基于函数间结构特征关联的软件漏洞检测方法
3
作者 邱少健 程嘉濠 +1 位作者 黄梦阳 黄琼 《软件学报》 北大核心 2025年第7期3134-3150,共17页
漏洞检测是软件系统安全领域的关键技术.近年来,深度学习凭借其代码特征提取的卓越能力,在漏洞检测领域取得了显著进展.然而,当前基于深度学习的方法仅关注于代码实例自身的独立结构特征,而忽视了不同漏洞代码间存在的结构特征相似关联... 漏洞检测是软件系统安全领域的关键技术.近年来,深度学习凭借其代码特征提取的卓越能力,在漏洞检测领域取得了显著进展.然而,当前基于深度学习的方法仅关注于代码实例自身的独立结构特征,而忽视了不同漏洞代码间存在的结构特征相似关联,限制了漏洞检测技术的性能.针对这一问题,提出了一种基于函数间结构特征关联的软件漏洞检测方法(vulnerability detection method based on correlation of structural features between functions,CSFF-VD).该方法首先将函数解析为代码属性图,并通过门控图神经网络提取函数内的独立结构特征.在此基础之上,利用特征之间的相似性构建函数间的关联网络并构建基于图注意力网络进一步提取函数间关联信息,以此提升漏洞检测的性能.实验结果显示,CSFF-VD在3个公开的漏洞检测数据集上超过了当前基于深度学习的漏洞检测方法.此外,在函数内各独立特征提取的基础上,通过增加CSFF-VD中函数间关联特征提取方法的实验,证明了集成函数间关联信息的有效性. 展开更多
关键词 漏洞检测 代码结构特征 函数关联 图注意力网络
在线阅读 下载PDF
基于多特征权重分配的源代码搜索优化 被引量:6
4
作者 李阵 钮俊 +1 位作者 王奎 辛园园 《计算机应用》 CSCD 北大核心 2018年第3期812-817,共6页
对开源代码进行准确搜索是实现代码复用的前提。在基于关键字搜索的研究中,目前只关注匹配方法签名。结合源代码注释对方法功能的语义描述,提出结合代码注释的关键字搜索方法。通过生成源代码抽象语法树,从中识别方法签名与各类型注释... 对开源代码进行准确搜索是实现代码复用的前提。在基于关键字搜索的研究中,目前只关注匹配方法签名。结合源代码注释对方法功能的语义描述,提出结合代码注释的关键字搜索方法。通过生成源代码抽象语法树,从中识别方法签名与各类型注释等组合代码特征;将代码特征与查询语句分别用向量表示,并计算向量间的余弦相似度,然后制定针对搜索结果多特征权重分配的评分机制。根据评分对搜索结果进行排序,得到与查询语句相关的结果序列。实验结果表明,多个代码特征在不同权重影响下可以提升源代码搜索准确度。 展开更多
关键词 代码复用 代码注释 方法签名 抽象语法树 代码特征
在线阅读 下载PDF
Stack Overflow的缺陷代码特征分析与相似缺陷检测 被引量:2
5
作者 亢振兴 赵逢禹 刘亚 《小型微型计算机系统》 CSCD 北大核心 2021年第3期661-665,共5页
目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关... 目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Overflow中关于缺陷代码的信息,提出一种基于缺陷代码特征分析的相似缺陷检测方法.该方法首先对缺陷报告进行LDA主题分析并将缺陷报告分类到不同的主题(类别)中,统计得到高频缺陷类别;其次对于高频缺陷类别的缺陷代码提取特征;最后根据缺陷代码特征构建相似缺陷检测模型.为了验证相似缺陷检测模型的有效性,针对数据操作缺陷数据构建诊断模型并对该模型进行实证,实验结果表明该方法对检测其他代码中相似缺陷有较好的效果. 展开更多
关键词 Stack Overflow LDA 缺陷代码特征 特征相似度 相似缺陷检测
在线阅读 下载PDF
代码特征自动提取方法 被引量:7
6
作者 史志成 周宇 《计算机科学与探索》 CSCD 北大核心 2021年第3期456-467,共12页
神经网络在软件工程中的应用极大程度上缓解了传统的人工提取代码特征的压力。已有的研究往往将代码简化为自然语言或者依赖专家的领域知识来提取代码特征,简化为自然语言的处理方法过于简单,容易造成信息丢失,而引入专家制定启发式规... 神经网络在软件工程中的应用极大程度上缓解了传统的人工提取代码特征的压力。已有的研究往往将代码简化为自然语言或者依赖专家的领域知识来提取代码特征,简化为自然语言的处理方法过于简单,容易造成信息丢失,而引入专家制定启发式规则的模型往往过于复杂,可拓展性以及普适性不强。鉴于以上问题,提出了一种基于卷积和循环神经网络的自动代码特征提取模型,该模型借助代码的抽象语法树(AST)来提取代码特征。为了缓解因AST过于庞大而带来的梯度消失问题,对AST进行切割,转换成一个AST序列再作为模型的输入。该模型利用卷积网络提取代码中的结构信息,利用双向循环神经网络提取代码中的序列信息。整个流程不需要专家的领域知识来指导模型的训练,只需要将标注类别的代码作为模型的输入就可以让模型自动地学习如何提取代码特征。应用训练好的分类编码器,在相似代码搜索任务上进行测试,Top1、NDCG、MRR的值分别能达到0.560、0.679和0.638,对比当下前沿的用于代码特征提取的深度学习模型以及业界常用的代码相似检测工具有显著的优势。 展开更多
关键词 代码特征提取 代码分类 程序理解 相似代码搜索
在线阅读 下载PDF
融合句嵌入模型和代码特征的补丁验证方法
7
作者 蒋婷婷 姜淑娟 韩威 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3450-3456,共7页
补丁验证常用运行测试套件的方法来验证补丁正确性,然而自动修复技术生成的补丁往往数量巨大,而将每个补丁依次通过测试套件则会产生难以承受的开销.针对该问题,本文提出一个由句嵌入模型InferSent和支持向量机分类器组成的静态补丁验... 补丁验证常用运行测试套件的方法来验证补丁正确性,然而自动修复技术生成的补丁往往数量巨大,而将每个补丁依次通过测试套件则会产生难以承受的开销.针对该问题,本文提出一个由句嵌入模型InferSent和支持向量机分类器组成的静态补丁验证方法.使用InferSent提取代码静态特征并通过支持向量机分类器来预测补丁正确性.该方法更加关注代码的静态特征信息,通过对特征的提取分析,无需运行测试套件即可有效地预测自动修复工具生成的补丁的正确性.本文在多个自动修复工具生成的补丁集合上进行了验证.实验结果表明,在修复工具生成的补丁集合上,本文提出的静态补丁验证方法对补丁预测的F1值达到71.89%,相比其他两种最新静态补丁验证方法分别提高11.64%和6.43%,并在五项评价指标上均优于对比模型.表明该方法可以在不运行测试套件的情况下正确预测补丁,且具有良好的泛化能力. 展开更多
关键词 程序自动修复 补丁验证 代码静态特征 句嵌入技术 支持向量机 代码相似性
在线阅读 下载PDF
基于上下文特征融合的代码漏洞检测方法 被引量:3
8
作者 徐泽鑫 段立娟 +1 位作者 王文健 恩擎 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第11期2260-2270,共11页
针对现有代码漏洞检测方法误报率和漏报率较高的问题,提出基于上下文特征融合的代码漏洞检测方法.该方法将代码特征解耦分为代码块局部特征和上下文全局特征.代码块局部特征关注代码块中关键词的语义及其短距离依赖关系.将局部特征融合... 针对现有代码漏洞检测方法误报率和漏报率较高的问题,提出基于上下文特征融合的代码漏洞检测方法.该方法将代码特征解耦分为代码块局部特征和上下文全局特征.代码块局部特征关注代码块中关键词的语义及其短距离依赖关系.将局部特征融合得到上下文全局特征从而捕捉代码行上下文长距离依赖关系.该方法通过局部信息与全局信息协同学习,提升了模型的特征学习能力.模型精确地挖掘出代码漏洞的编程模式,增加了代码漏洞对比映射模块,拉大了正负样本在嵌入空间中的距离,促使对正负样本进行准确地区分.实验结果表明,在9个软件源代码混合的真实数据集上的精确率最大提升了29%,召回率最大提升了16%. 展开更多
关键词 代码漏洞检测 代码块局部特征提取 上下文全局特征融合 短距离依赖 长距离依赖
在线阅读 下载PDF
代码复用攻防技术演化综述
9
作者 詹静 陈鹏 +2 位作者 张茜 李永震 赵勇 《北京工业大学学报》 CAS CSCD 北大核心 2024年第5期632-650,共19页
当前代码复用攻击研究多从一种或多种代码复用攻击或防御技术角度进行现状和趋势分析,对影响攻防的关键特征及技术覆盖不全面,对攻防技术对抗演化发展规律分析较少。为解决上述问题,从经典代码复用攻击——返回导向编程(return-oriented... 当前代码复用攻击研究多从一种或多种代码复用攻击或防御技术角度进行现状和趋势分析,对影响攻防的关键特征及技术覆盖不全面,对攻防技术对抗演化发展规律分析较少。为解决上述问题,从经典代码复用攻击——返回导向编程(return-oriented programming,ROP)攻击的生命周期入手,归纳影响此类攻击成功与否的关键特征,基于时间线和这些特征,综合衡量安全和性能因素,给出了代码复用攻防技术的发展规律。 展开更多
关键词 程序安全 代码复用攻击 攻防技术演化 指令结构特征 地址随机化 运行代码特征
在线阅读 下载PDF
特征与成组技术在CAD/CAPP/CAM集成中的应用 被引量:2
10
作者 吴晓光 张国珍 《武汉水利电力大学(宜昌)学报》 1999年第2期161-164,共4页
运用特征与成组技术相结合的思路,根据CAD/CAPP/CAM集成的要求成功地实现了圆柱齿轮类零件CAD/CAPP/CAM集成系统中数据交换、传递和共享。
关键词 成组技术 特征图形菜单 特征代码 集成 数据传递
在线阅读 下载PDF
基于代码克隆检测的操作系统脆弱性分析方法 被引量:2
11
作者 汪哲 任怡 +2 位作者 周凯 管剑波 谭郁松 《计算机科学与探索》 CSCD 北大核心 2021年第9期1619-1631,共13页
基于代码克隆检测技术进行软件脆弱性检测,是软件脆弱性静态分析中的一个重要方向。目前,已有软件脆弱性检测工具在面向大规模代码集的脆弱性检测方面存在不足,且缺乏针对操作系统脆弱性的优化。为此,基于代码克隆检测技术,提出了一种... 基于代码克隆检测技术进行软件脆弱性检测,是软件脆弱性静态分析中的一个重要方向。目前,已有软件脆弱性检测工具在面向大规模代码集的脆弱性检测方面存在不足,且缺乏针对操作系统脆弱性的优化。为此,基于代码克隆检测技术,提出了一种操作系统脆弱性检测方法。首先在一般的"代码表征—提取特征—特征比对"检测流程的基础上,加入了基于操作系统软件包类型和函数代码规模的预筛选机制,在进行代码表征之前排除大部分无关代码。其次选择函数基本信息、符号序列和控制流路径三个角度提取代码特征,逐级比较脆弱代码和待测代码的相似度。最后从公开脆弱性数据库获取脆弱样本,对典型开源操作系统进行了实验,结果显示预筛选能够有效缩减实验对象的代码规模,而检测结果的平均精确度达到了84%。 展开更多
关键词 脆弱性检测 代码克隆 操作系统 代码特征 静态分析
在线阅读 下载PDF
基于增强描述的代码搜索方法 被引量:14
12
作者 黎宣 王千祥 金芝 《软件学报》 EI CSCD 北大核心 2017年第6期1405-1417,共13页
如何有效地帮助程序员从目前的各种代码库中搜索与特定编程任务相关的代码,已成为软件工程重要的研究领域之一.提出一种基于增强描述的代码搜索方法 DERECS,该方法首先基于开源项目、问答系统等构建一个代码-描述语料库,并分析代码及自... 如何有效地帮助程序员从目前的各种代码库中搜索与特定编程任务相关的代码,已成为软件工程重要的研究领域之一.提出一种基于增强描述的代码搜索方法 DERECS,该方法首先基于开源项目、问答系统等构建一个代码-描述语料库,并分析代码及自然语言描述,提取方法调用和代码结构相关特征值;然后,基于代码片段中的方法调用及代码片段的结构特征对代码进行描述增强,以减小被搜索的代码与自然语言查询语句之间的差异,扩大搜索的范围.使用真实自然语言查询语句作为测试基准,对DERECS进行验证.验证结果表明,DERECS的效果显著优于典型方法 SNIFF和Krugle的查询结果. 展开更多
关键词 代码搜索 自然语言处理 代码-描述对 代码特征提取 代码描述增强
在线阅读 下载PDF
基于注意力机制的双编码器代码注释生成 被引量:2
13
作者 董传珂 赵逢禹 刘亚 《小型微型计算机系统》 CSCD 北大核心 2022年第2期438-442,共5页
针对代码注释较少导致软件项目可维护性降低、理解代码语义困难等问题,提出一种基于NMT模型的双编码器框架自动生成代码注释的方法.在该框架中,首先提取不同的代码特征信息;然后分别采用序列编码器和图编码器对不同的代码特征编码,引入... 针对代码注释较少导致软件项目可维护性降低、理解代码语义困难等问题,提出一种基于NMT模型的双编码器框架自动生成代码注释的方法.在该框架中,首先提取不同的代码特征信息;然后分别采用序列编码器和图编码器对不同的代码特征编码,引入注意力机制调整编码器输出向量,再对双编码器的输出向量综合处理;最终利用解码器对综合向量解码获得注释序列.为了验证带有注意力机制的双编码器模型效果,本文构建自动生成代码注释算法框架.实验表明,双编码器模型与文中的序列编码器和树编码器模型算法相比,在生成代码注释方面的结果评估得分上表现较好.通过BLEU-1、ROUGE-L和F1测评指标得分对比,验证了本文算法的有效性. 展开更多
关键词 NMT模型 双编码器 代码特征 注意力机制 代码注释
在线阅读 下载PDF
基于众包问答信息的API使用代码搜索 被引量:1
14
作者 李宇琨 彭鑫 赵文耘 《计算机应用与软件》 北大核心 2018年第7期43-51,共9页
现代软件开发大量依赖类库以及第三方软件框架和开发,为此软件开发者经常需要寻找能够解决特定问题的应用程序编程接口API并通过示例代码学习相关API的使用方式。然而,由于开发者的问题描述与相关的API及其使用代码之间的词汇上经常存... 现代软件开发大量依赖类库以及第三方软件框架和开发,为此软件开发者经常需要寻找能够解决特定问题的应用程序编程接口API并通过示例代码学习相关API的使用方式。然而,由于开发者的问题描述与相关的API及其使用代码之间的词汇上经常存在差异,因此直接的代码搜索效果往往不好。Stack Overflow等众包问答网站上存在着很多开发问题及建议解决方案,其中也会包含一些API等代码元素,可以成为问题描述和代码内容之间匹配的桥梁。基于这一思想,提出并实现一种基于众包问答信息的API使用代码搜索方法。该方法首先借助于众包问答信息将问题描述对应到相关的代码元素上,并生成一种包含结构信息的代码骨架,然后基于代码骨架对代码库(例如开源项目代码)进行搜索和匹配,从而生成搜索结果。为了验证方法的有效性,收集了Stack Overflow上的137多万条问答信息以及GitHub上的3亿行Java源码,并针对30个与API相关的问题进行了实验验证。结果表明,96.6%的问题能在前十个结果中找到正确答案,有40%的问题能在第一个结果中找到正确答案,并且所有问题能在2 s内返回结果。 展开更多
关键词 代码搜索 代码特征提取 文本摘要
在线阅读 下载PDF
基于Transformer和卷积神经网络的代码克隆检测 被引量:2
15
作者 贲可荣 杨佳辉 +1 位作者 张献 赵翀 《郑州大学学报(工学版)》 CAS 北大核心 2023年第6期12-18,共7页
基于深度学习的代码克隆检测方法往往作用在代码解析的词序列上或是整棵抽象语法树上,使用基于循环神经网络的时间序列模型提取特征,这会遗漏源代码的重要语法语义信息并诱发梯度消失。针对这一问题,提出一种基于Transformer和卷积神经... 基于深度学习的代码克隆检测方法往往作用在代码解析的词序列上或是整棵抽象语法树上,使用基于循环神经网络的时间序列模型提取特征,这会遗漏源代码的重要语法语义信息并诱发梯度消失。针对这一问题,提出一种基于Transformer和卷积神经网络的代码克隆检测方法(TCCCD)。首先,TCCCD将源代码表示成抽象语法树,并将抽象语法树切割成语句子树输入给神经网络,其中,语句子树由先序遍历得到的语句结点序列构成,蕴含了代码的结构和层次化信息。其次,在神经网络设计方面,TCCCD使用Transformer的Encoder部分提取代码的全局信息,再利用卷积神经网络捕获代码的局部信息。再次,融合2个不同网络提取出的特征,学习得到蕴含词法、语法和结构信息的代码向量表示。最后,采用两段代码向量的欧氏距离表征语义关联程度,训练一个分类器检测代码克隆。实验结果表明:在OJClone数据集上,精度、召回率、F 1值分别能达到98.9%、98.1%和98.5%;在BigCloneBench数据集上,精度、召回率、F 1值分别能达到99.1%、91.5%和94.2%。与其他方法对比,精度、召回率、F 1值均有提升,所提方法能够有效检测代码克隆。 展开更多
关键词 代码克隆检测 抽象语法树(AST) TRANSFORMER 卷积神经网络 代码特征提取
在线阅读 下载PDF
面向基本路径学习的代码自动命名
16
作者 王一凡 赵逢禹 艾均 《小型微型计算机系统》 CSCD 北大核心 2022年第11期2302-2307,共6页
在基于学习的方法代码抽象命名研究中,现有工作中的模型学习的代码表示缺少方法代码的控制流与动态可执行的信息.针对这一问题,本文提出一种面向基本路径学习的代码自动命名模型.该模型首先将方法代码通过编译器得到三地址码的中间表示... 在基于学习的方法代码抽象命名研究中,现有工作中的模型学习的代码表示缺少方法代码的控制流与动态可执行的信息.针对这一问题,本文提出一种面向基本路径学习的代码自动命名模型.该模型首先将方法代码通过编译器得到三地址码的中间表示并在其基础上通过本文给出的算法构建控制流图,然后基于深度优先搜索的思想构建算法提取基本路径集作为代码表示,最后引入使用注意力机制神经网络对基本路径集学习建模,训练得到方法名命名模型.为了验证模型的有效性,基于先前工作的数据集进行实验,实验结果表明本文提出的方法在本实验数据集上实验评估效果优于基线模型,并且在代码较复杂的情况下模型能够更好的理解代码语义. 展开更多
关键词 基本路径 程序语义 机器学习 注意力机制 代码特征
在线阅读 下载PDF
CNMARC中的常见问题分析 被引量:3
17
作者 文丽 王欣 《现代情报》 2003年第11期65-66,共2页
本文就CNMARC著录中经常出现的问题做了分析 ,供从事编目工作的同行们探讨 。
关键词 CNMARC 中国 机读目录格式 文献著录 内容特征代码 文学体裁代码 传记代码 责任者字段 题名字段 多卷集图书 个人名称主题
在线阅读 下载PDF
基于NRefactory的冗余检测与缺陷研究 被引量:3
18
作者 寿能 赵逢禹 《小型微型计算机系统》 CSCD 北大核心 2015年第9期1973-1976,共4页
为了揭示冗余与软件缺陷的关系,在冗余分类的基础上,研究了冗余特征与软件缺陷的关联关系.以死代码冗余和条件冗余为例,首先对两种冗余进行了分类和代码特征提取,确定了分类和软件缺陷的关联,然后基于上述关联,使用NRefactory设计了冗... 为了揭示冗余与软件缺陷的关系,在冗余分类的基础上,研究了冗余特征与软件缺陷的关联关系.以死代码冗余和条件冗余为例,首先对两种冗余进行了分类和代码特征提取,确定了分类和软件缺陷的关联,然后基于上述关联,使用NRefactory设计了冗余检测算法,完成发现冗余并提示缺陷的检测器.通过对若干项目进行的冗余检测和人工审阅后发现,死代码冗余和条件冗余与软件缺陷有着非常紧密的联系,基于冗余代码的检查可以有效地排除冗余相关的软件缺陷. 展开更多
关键词 冗余 代码特征 软件缺陷 NRefactory
在线阅读 下载PDF
基于层级注意力机制与双向长短期记忆神经网络的智能合约自动分类模型 被引量:9
19
作者 吴雨芯 蔡婷 张大斌 《计算机应用》 CSCD 北大核心 2020年第4期978-984,共7页
针对区块链平台上智能合约应用种类繁多,人工筛选合适的智能合约应用服务日益困难的问题,提出一种基于层级注意力机制与双向长短期记忆(Bi-LSTM)神经网络的智能合约自动分类模型——HANN-SCA。首先,利用Bi-LSTM网络从智能合约源代码和... 针对区块链平台上智能合约应用种类繁多,人工筛选合适的智能合约应用服务日益困难的问题,提出一种基于层级注意力机制与双向长短期记忆(Bi-LSTM)神经网络的智能合约自动分类模型——HANN-SCA。首先,利用Bi-LSTM网络从智能合约源代码和账户信息两个角度同时建模,最大限度地提取智能合约的特征信息。其中源代码角度关注智能合约中的代码语义特征,账户信息角度关注智能合约的账户特征。然后,在特征学习过程中从词层面和句层面分别引入注意力机制,重点捕获对智能合约分类有重要意义的单词和句子。最后,拼接代码特征与账户特征以生成智能合约文档级特征表示,通过Softmax层完成分类任务。实验结果表明,所提模型在Dataset-E、Dataset-N和Dataset-EO数据集上的分类正确率分别达到了93.1%、91.7%和92.1%,效果明显优于传统的支持向量机模型(SVM)和其他神经网络基准模型,且具有更好的稳定性与更高的收敛速度。 展开更多
关键词 智能合约分类 层级注意力机制 双向长短期记忆网络 代码语义特征 账户特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部