期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种结合代码片段和混合主题模型的软件数据聚类方法 被引量:2
1
作者 魏林林 沈国华 +2 位作者 黄志球 蔡梦男 郭菲菲 《计算机科学》 CSCD 北大核心 2024年第6期44-51,共8页
使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主... 使用主题模型进行文档聚类是众多文本挖掘任务中一种常见的做法。许多研究针对软件问答网站的数据,利用主题模型进行聚类来分析不同领域在社区的发展情况。然而,这些软件相关数据往往包含代码片段且文本长度分布不均,使用传统单一的主题模型对文本数据建模,易得到不稳定的聚类结果。文中提出了一种结合代码片段和混合主题模型的聚类方法,并使用Stack Overflow作为数据源,构造了在该平台上被提问数量排名前60的Python第三方库数据集,经过建模,该数据集最终划分为以下6个不同的领域:网络安全、数据分析、人工智能、文本处理、软件开发和系统终端。实验结果表明,在自动评估和人工评估的指标上,使用代码片段结合文本进行主题建模,在聚类结果划分的质量上表现良好,而联合多个模型进行实验,一定程度上提高了聚类结果的稳定性和准确性。 展开更多
关键词 代码片段 主题模型 Stack Overflow PYTHON 聚类
在线阅读 下载PDF
基于代码片段的无线传感器网络密钥更新方案 被引量:1
2
作者 朱凌志 王建新 马行坡 《计算机应用研究》 CSCD 北大核心 2011年第6期2212-2214,共3页
针对当前无线传感器网络密钥更新技术存在的安全隐患,提出了一种基于代码片段的密钥更新方案(简称CSKUS方案)。CSKUS首先为传感器节点预分配初始密钥以及代码片段,相邻节点之间通过交换代码片段获得相同的代码片段集;然后利用代码片段... 针对当前无线传感器网络密钥更新技术存在的安全隐患,提出了一种基于代码片段的密钥更新方案(简称CSKUS方案)。CSKUS首先为传感器节点预分配初始密钥以及代码片段,相邻节点之间通过交换代码片段获得相同的代码片段集;然后利用代码片段集所组成的更新程序完成密钥更新。理论分析表明,CSKUS不仅具有很高的安全性,同时具有计算、通信开销低的特点,完全支持大规模无线传感器网络。 展开更多
关键词 初始密钥 代码片段 密钥更新
在线阅读 下载PDF
基于代码片段复用的安卓应用组装技术研究 被引量:2
3
作者 朱亚迪 吴毅坚 赵文耘 《计算机应用与软件》 CSCD 2016年第11期164-168,共5页
安卓系统的开放性和安卓应用开发的较低的技术门槛,吸引了大量开发者加入到安卓应用开发阵营中来。在编码过程中,开发者需要兼顾界面设计和业务逻辑,并手工维护他们的一致性;相似的界面、类似的逻辑也需要开发者手工进行"复制-粘贴... 安卓系统的开放性和安卓应用开发的较低的技术门槛,吸引了大量开发者加入到安卓应用开发阵营中来。在编码过程中,开发者需要兼顾界面设计和业务逻辑,并手工维护他们的一致性;相似的界面、类似的逻辑也需要开发者手工进行"复制-粘贴"式的开发。提出安卓应用界面和业务逻辑的结构模型,以统一的方式描述安卓应用的界面元素、业务逻辑以及两者的关联,支持将安卓应用的界面代码和业务逻辑代码对应起来。提出可配置的安卓应用结构化描述和组装方法,使得开发人员可以以书写配置文件的方式从业务层面描述应用,并支持界面和业务逻辑代码片段的组装,从而快速构建符合需求的安卓应用。设计了安卓应用开发实验来验证所提方法及技术的有效性。 展开更多
关键词 安卓应用 结构模型 代码片段 复用
在线阅读 下载PDF
基于序列到序列模型的代码片段推荐 被引量:4
4
作者 闫鑫 周宇 黄志球 《计算机科学与探索》 CSCD 北大核心 2020年第5期731-739,共9页
在软件开发过程中,开发者经常会以复用代码的方式,提高软件开发效率。已有的研究通常采用传统的信息检索技术来实现代码推荐。这些方法存在自然语言查询的高层级的意图与代码的低层级的实现细节不匹配的问题。提出了一种基于序列到序列... 在软件开发过程中,开发者经常会以复用代码的方式,提高软件开发效率。已有的研究通常采用传统的信息检索技术来实现代码推荐。这些方法存在自然语言查询的高层级的意图与代码的低层级的实现细节不匹配的问题。提出了一种基于序列到序列模型的代码片段推荐方法DeepCR。该方法结合程序静态分析技术与序列到序列模型,训练自然语言查询生成模型,为代码片段生成查询,通过计算生成的查询和开发者输入的自然语言查询的相似度得分来实现代码片段推荐。所构建的代码库的数据来源于Stack Overflow问答网站,确保了数据的真实性。通过计算代码片段推荐结果的平均倒数排名(MRR)和Hit@K来验证方法的有效性。实验结果表明,DeepCR优于现有研究工作,能够有效提高代码片段推荐效果。 展开更多
关键词 程序静态分析 序列到序列模型 代码片段推荐
在线阅读 下载PDF
软件开发问答网站代码片段自动分类方法研究 被引量:1
5
作者 谢文凯 彭鑫 赵文耘 《计算机应用与软件》 北大核心 2021年第8期1-6,共6页
诸如Stack Overflow这种软件开发问答网站已成为开发者在编程中寻找问题解决方案的主要手段,它们通过众包的方式为开发者提供解决方案和代码片段作为参考。自动识别代码片段的用途将为软件开发问答网站的知识抽取提供支持。通过对Stack ... 诸如Stack Overflow这种软件开发问答网站已成为开发者在编程中寻找问题解决方案的主要手段,它们通过众包的方式为开发者提供解决方案和代码片段作为参考。自动识别代码片段的用途将为软件开发问答网站的知识抽取提供支持。通过对Stack Overflow上的问题及代码片段进行研究,总结出4种问题类型和8种代码片段类型。在此基础上,实现基于朴素贝叶斯的自动分类方法。实验表明,8个类型代码片段的分类准确率都在50%以上,整体准确率达到70%以上。 展开更多
关键词 软件开发问答网站 代码片段 经验研究 分类 机器学习
在线阅读 下载PDF
结合可达性分析的代码片段推荐
6
作者 贾翕 于海波 方璐 《计算机工程》 CAS CSCD 2014年第11期71-76,共6页
为满足日益复杂的软件需求,开发人员需要通过代码提示工具来辅助完成开发任务,但现有代码提示工具在推荐包含静态方法的代码片段时存在空间爆炸问题。为此,提出一种基于程序环境信息的代码片段推荐方法。结合可达性分析进行推荐能够有... 为满足日益复杂的软件需求,开发人员需要通过代码提示工具来辅助完成开发任务,但现有代码提示工具在推荐包含静态方法的代码片段时存在空间爆炸问题。为此,提出一种基于程序环境信息的代码片段推荐方法。结合可达性分析进行推荐能够有效削减静态方法入口点,在避免空间爆炸的同时,还可以准确、有效地描述程序环境信息。基于该方法实现在Eclipse中的代码推荐插件,并对Tomcat源码进行实验验证。实验结果表明,该方法可实现静态方法的代码片段推荐,与Eclipse Code Recommenders插件中的推荐方法相比,能获得更准确的推荐结果。 展开更多
关键词 静态方法 代码片段 语义网规则语言 可达性分析 代码推荐 排序
在线阅读 下载PDF
基于SBERT模型的代码片段推荐
7
作者 邓斯元 魏乐 舒红平 《计算机应用研究》 CSCD 北大核心 2022年第12期3730-3735,共6页
在当前的软件开发环境中,海量的低质量、无意义的代码知识为开发人员进行代码复用造成了阻碍,大大降低了软件开发效率。为了快速准确地为开发人员推荐高质量的代码知识,提出了基于SBERT(sentence-BERT)模型的代码片段推荐方法CSRSB(code... 在当前的软件开发环境中,海量的低质量、无意义的代码知识为开发人员进行代码复用造成了阻碍,大大降低了软件开发效率。为了快速准确地为开发人员推荐高质量的代码知识,提出了基于SBERT(sentence-BERT)模型的代码片段推荐方法CSRSB(code snippets recommendation based on sentence-BERT)。该方法首先获取海量的高质量数据来构建代码语料库,并基于深度学习模型SBERT为代码片段对应的自然语言描述和用户输入的自然语言查询生成具有丰富语义的句向量,通过比较点积相似度来实现代码片段的推荐。使用命中率、平均倒数排名和平均准确率这三个常用推荐评估指标与现有相关研究中的方法进行对比来验证该方法的有效性。实验结果表明,CSRSB在有效提高代码片段推荐准确度的同时也能够做到快速推荐。 展开更多
关键词 代码复用 代码语料库 深度学习 代码片段推荐
在线阅读 下载PDF
GITG:面向Gitee平台的issue标题自动生成方法
8
作者 杨君 刘诗凡 +1 位作者 陈翔 崔展齐 《电子学报》 北大核心 2025年第5期1559-1570,共12页
在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有... 在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有的issue标题自动生成方法主要面向GitHub等英文开源平台,当应用在Gitee等国产开源平台时表现不佳.同时,现有方法主要使用issue主体描述作为输入,忽略了issue中的代码片段等重要信息.为此,本文提出一种面向Gitee平台的issue标题自动生成方法GITG(Gitee Issue Title Generation),针对包含中文和英文文本的issue,使用构建的Gitee issue数据集对支持中文的预训练模型Chinese BART(Bidirectional and Auto-Regressive Transformers)进行微调,利用issue主体描述和代码片段的双模态信息来自动生成issue标题.为验证GITG的有效性,构建了包含18242个Gitee issue样本的数据集.实验结果表明,GITG在ROUGE-1、ROUGE-2和ROUGE-L指标上相较于iTAPE和iTiger分别至少提升了13.09%、10.18%和12.84%,在BLEU和METEOR指标上同样取得了性能提升.人工评价结果表明,GITG生成标题的平均得分在整体分数、流畅性、信息性和简洁性4个评价指标上相较iTAPE和iTiger分别至少提升了26.7%、20.8%、24.2%和20.0%. 展开更多
关键词 Gitee issue标题 主体描述 代码片段 预训练模型 软件维护
在线阅读 下载PDF
华中科技大学李珩、姚致远在NDSS 2025上发表最新研究成果
9
《信息网络安全》 北大核心 2025年第1期12-12,共1页
华中科技大学数据科学与计算机视觉实验室博后李珩、硕士姚致远在国际网络与系统安全会议NDSS 2025上发表最新研究成果。对抗样本技术给Android恶意软件检测系统带来了巨大的危害,使得恶意软件能够通过最小的代码修改来规避检测。然而,... 华中科技大学数据科学与计算机视觉实验室博后李珩、硕士姚致远在国际网络与系统安全会议NDSS 2025上发表最新研究成果。对抗样本技术给Android恶意软件检测系统带来了巨大的危害,使得恶意软件能够通过最小的代码修改来规避检测。然而,现有的对抗样本技术忽视了恶意软件生成的过程,限制了该技术的应用范围。论文提出一种恶意软件批量生成方式——恶意代码片段注入,该技术将恶意代码批量嵌入流行应用中生成大量的恶意软件。以这一技术与对抗样本技术结合:针对特定的恶意代码片段,生成与之适配的对抗扰动并将其插入不同的良性载体应用中,从而达到批量产生能够逃脱检测的恶意软件。 展开更多
关键词 恶意软件 计算机视觉 恶意代码 代码片段 系统安全 最新研究成果 代码修改 数据科学
在线阅读 下载PDF
以CodeBERT为基础的代码分类研究 被引量:2
10
作者 成思强 刘建勋 +1 位作者 彭珍连 曹奔 《计算机工程与应用》 CSCD 北大核心 2023年第24期277-288,共12页
随着代码大数据的不断发展,代码库中的源代码数量逐渐增长。如何快速有效地对代码库中的代码进行分类管理,对软件工程的发展具有十分重要的意义。第一次将预训练模型引入代码分类研究,并提出了一种优化的代码分类方法 CBBCC。CBBCC采用w... 随着代码大数据的不断发展,代码库中的源代码数量逐渐增长。如何快速有效地对代码库中的代码进行分类管理,对软件工程的发展具有十分重要的意义。第一次将预训练模型引入代码分类研究,并提出了一种优化的代码分类方法 CBBCC。CBBCC采用wordpiece对源代码进行数据预处理。采用CodeBERT预训练模型对源代码进行特征表征。在预训练模型的基础上进行分类任务的微调。为了验证所提模型的有效性,在POJ104数据集上进行实验分析。实验结果表明,相对于7种基准模型,CBBCC模型各项分类指标都在98%以上。其中准确率上比目前最优模型提高了1.1个百分点,达到了POJ104代码分类数据集上分类任务的SOTA值。CBBCC能有效地对代码进行标注,提高对开源社区源代码的管理,促进软件工程领域的发展。 展开更多
关键词 代码分类 代码表征 CodeBERT 迁移训练 代码片段
在线阅读 下载PDF
智能家电嵌入式软件的源码构件设计方法 被引量:1
11
作者 邓勇 桑楠 +1 位作者 罗克露 高卓 《计算机工程》 CAS CSCD 北大核心 2007年第6期280-282,共3页
通过对家电控制器常用MCU体系结构、程序设计语言、家电功能及外设驱动源码研究,提出了一种形式化的嵌入式软件的源码构件和程序代码的设计方法。介绍了源码构件层次体系和逻辑模式;定义了源码构件运算符;给出了构件及应用代码的形式化... 通过对家电控制器常用MCU体系结构、程序设计语言、家电功能及外设驱动源码研究,提出了一种形式化的嵌入式软件的源码构件和程序代码的设计方法。介绍了源码构件层次体系和逻辑模式;定义了源码构件运算符;给出了构件及应用代码的形式化生成;并以重用因子K为标准,辅助衡量源码构件的代码片段划分和设计的合理性。该方法具有很好的实用性、可扩展性和通用性。 展开更多
关键词 智能家电 源码构件 代码片段 构件描述块 重用因子
在线阅读 下载PDF
一种智能家电嵌入式软件源码构件的设计模式 被引量:2
12
作者 高峰 邓勇 桑楠 《计算机应用》 CSCD 北大核心 2005年第B12期468-470,共3页
通过对家电控制器常用MCU体系结构、程序设计语言、家电功能及外设驱动源码的研究,提出了一种家电嵌入式软件源码构件设计模型。该模型根据特定的构件规范,将成熟软件可重用源代码片段封装成不同级别的源码构件,插在同类家电程序框上,... 通过对家电控制器常用MCU体系结构、程序设计语言、家电功能及外设驱动源码的研究,提出了一种家电嵌入式软件源码构件设计模型。该模型根据特定的构件规范,将成熟软件可重用源代码片段封装成不同级别的源码构件,插在同类家电程序框上,生成所需的嵌入式软件系统。详细介绍了源码构件层次模型和构件封装规范,并以空调控制器应用程序开发为实例,说明源码构件的设计、生成、应用过程。该构件设计方法,特别适合不用操作系统的家电控制程序的构件开发。 展开更多
关键词 智能家电 源码构件规范 源码构件 代码片段 构件描述块
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部