期刊文献+
共找到1,082篇文章
< 1 2 55 >
每页显示 20 50 100
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:1
1
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 大模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
考虑裂纹分形维数的平行黏结模型细观参数标定的神经网络模型
2
作者 龚囱 戚燕顺 +4 位作者 缪浩杰 肖琦 熊良锋 曾鹏 赵奎 《岩土力学》 北大核心 2025年第1期327-336,共10页
针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面... 针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面裂纹分形维数。在此基础上,建立了以宏观弹性模量、宏观泊松比、峰值强度和裂纹分形维数等4个参数为输入层,黏结弹性模量、黏结法向与切向刚度比、黏结内聚力、黏结内摩擦角、黏结抗拉强度和摩擦系数等6个细观参数为输出层的神经网络模型,对比分析了考虑与不考虑裂纹分形维数时平行黏结模型细观参数标定效果。研究结果表明:(1)所建立的神经网络模型具有较好的收敛速度、预测精度与泛化性能,测试集输出数据与期望值误差约为3.34%。(2)将裂纹分形维数纳入神经网络模型后,数值模拟所得弹性模量、峰值应力与泊松比等宏观参数与室内试验结果的误差小于3.00%,优于不考虑裂纹分形维数标定结果。(3)该方法可定量保障数值模拟所得裂纹不规则性与室内试验结果的一致性,其在一定程度上可视为对现有神经网络模型细观参数标定结果的修正。研究成果可为提高平行黏结模型细观参数标定效果提供新思路。 展开更多
关键词 分形维数 颗粒流 平行黏结模型 参数标定 神经网络
在线阅读 下载PDF
基于标准模型的SCD文件虚回路校核方法
3
作者 曹海欧 沈蛟骁 +1 位作者 张玥 陈鹏 《沈阳工业大学学报》 北大核心 2025年第1期21-28,共8页
【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚... 【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚回路信息时,工作量大、效率低下且容易出现漏查等情况,故对人员专业水平要求颇高。基于固定规则的校核技术,因智能站虚回路受电压等级、主接线形式、间隔类型、装置类型、保护功能需求等众多复杂因素影响,致使校核规则极为繁杂,其可靠性与可维护性难以保证。在此背景下,本研究致力于提升智能变电站虚回路自动校核技术的适应性和准确性,涉及智能变电站二次系统整体架构及运行保障等相关范围,对确保变电站安全稳定运行具有重要意义。【方法】采用基于标准模型方法深入剖析影响SCD虚回路校核的因素,通过构建标准模型来适配差异。专业人员依据电压等级、接线方式及装置类型等构建并维护ICD标准虚端子模型库,其标识具备唯一性。同时,建立ICD厂家虚端子与标准虚端子的映射模型,明确映射文件表达方式及数据结构,记录两者精确对应关系。综合考虑多种影响因素构建标准虚回路模型,并由专业人员负责维护发布,为校核提供准确依据。在具体校核过程中,通过解析SCD文件生成装置间互操作关系对象标识,运用数学模型集合的逻辑运算差集,将解析的虚回路数据与标准虚回路模型进行对比,精准计算正确、多余与缺失回路的情况。【结果】所提方法通过标准模型及配套流程可有效解决SCD虚回路校核难题,在一定程度上提高了校核准确性,可有效应对多种差异。【结论】与传统方法相比,提出的基于标准模型的校核模式优势明显,可为智能变电站运维管理政策制定提供有力技术支撑,助力规范行业建设与运维标准制定。在学术交流价值方面,可为智能变电站二次系统研究开拓新路径,为后续虚回路校核研究在模型构建、数据处理等方面提供借鉴。 展开更多
关键词 智能变电站 SCD文件 虚回路校核 标准模型 虚端子 映射模型 编码标识 二次回路
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
4
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
基于扩散模型的恶意代码数据集扩充方法 被引量:1
5
作者 李思聪 王坚 +2 位作者 宋亚飞 王硕 冯存前 《空军工程大学学报》 北大核心 2025年第1期95-103,共9页
随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模... 随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模型可能会过度拟合于这些稀缺数据,导致模型的性能不佳。针对以上问题,提出一种基于扩散模型生成新样本的数据集扩充方法,通过学习从原始数据到噪声的转换过程,并利用反向过程还原噪声样本为新的相似样本,实现数据集的扩充,生成与原始数据集相似但不同的新样本,以缓解部分家族数据不平衡对分类检测任务的影响,提高模型的泛化能力。 展开更多
关键词 恶意代码检测 扩散模型 恶意代码可视化 数据增强技术 U-Net
在线阅读 下载PDF
基于大语言模型的多智能体协作代码评审人推荐 被引量:2
6
作者 王路桥 周洋涛 +5 位作者 李青山 王铭康 徐子轩 崔笛 王璐 罗懿行 《软件学报》 北大核心 2025年第6期2558-2575,共18页
基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增... 基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增加了评审人推荐的难度.现有方法主要聚焦于从PR中挖掘变更代码的语义信息,或基于审查历史构建评审人画像,并通过多种静态策略组合进行推荐.这些研究受限于模型训练语料的丰富性以及交互类型的复杂性,导致推荐性能不佳.鉴于此,提出一种基于智能体间相互协作的代码评审人推荐方法.该方法利用先进的大语言模型,精确捕捉PR和评审人丰富的文本语义信息.此外,AI智能体强大的规划、协作和决策能力使其能够集成不同交互类型的信息,具有高度的灵活性和适应性.基于真实数据集进行实验分析,与基线评审人推荐方法相比,所提方法性能提升4.45%–26.04%.此外,案例研究证明,所提方法在可解释性方面表现突出,进一步验证了其在实际应用中的有效性和可靠性. 展开更多
关键词 代码评审人推荐 基于智能体的软件工程 大型语言模型 代码审查
在线阅读 下载PDF
露天矿爆破设计与模拟Blast-Code模型及其在水厂铁矿的应用 被引量:17
7
作者 璩世杰 尚峰华 +1 位作者 李宝辉 王友成 《工程爆破》 2001年第2期18-24,共7页
结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采... 结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采场的地形条件、矿岩物理力学性质及地质构造等信息 ;后者则依据对爆区地形 (包括台阶自由面条件 )、爆区内矿岩的物理力学性质与地质构造特征、炸药爆炸性能三类对爆破效果具有直接影响的关键因素的综合定量分析 ,由计算机自动进行完整的爆破设计 ,并可对矿岩的破碎效果和爆堆形状进行定量的模拟和预测。Blast Code模型具有爆破参数选取的人工干预和钻孔爆破成本计算功能 ,可对多个设计方案进行技术经济对比分析 。 展开更多
关键词 Blast-code模型 露天矿 爆破设计 地质地形数据库 中深孔爆破 爆破模拟
在线阅读 下载PDF
深度代码模型安全综述
8
作者 孙伟松 陈宇琛 +7 位作者 赵梓含 陈宏 葛一飞 韩廷旭 黄胜寒 李佳讯 房春荣 陈振宇 《软件学报》 北大核心 2025年第4期1461-1488,共28页
随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无... 随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无法比拟的优势.这些面向代码相关任务训练的深度学习模型统称为深度代码模型.然而,由于神经网络的脆弱性和不可解释性,与自然语言处理模型与图像处理模型一样,深度代码模型安全也面临众多挑战,已经成为软件工程领域的焦点.近年来,研究者提出了众多针对深度代码模型的攻击与防御方法.然而,目前仍缺乏对深度代码模型安全研究的系统性综述,不利于后续研究者对该领域进行快速的了解.因此,为了总结该领域研究现状、挑战及时跟进该领域的最新研究成果,搜集32篇该领域相关论文,并将现有的研究成果主要分为后门攻击与防御技术和对抗攻击与防御技术两类.按照不同技术类别对所收集的论文进行系统地梳理和总结.随后,总结该领域中常用的实验数据集和评估指标.最后,分析该领域所面临的关键挑战以及未来可行的研究方向,旨在为后续研究者进一步推动深度代码模型安全的发展提供有益指导. 展开更多
关键词 深度代码模型 深度代码模型安全 人工智能模型安全 后门攻击与防御 对抗攻击与防御
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
9
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:2
10
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
基于大语言模型的自动代码修复综述
11
作者 许鹏宇 况博裕 +1 位作者 苏铓 付安民 《计算机研究与发展》 北大核心 2025年第8期2040-2057,共18页
软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件... 软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向. 展开更多
关键词 自动代码修复 大语言模型 代码大语言模型 软件缺陷 补丁生成
在线阅读 下载PDF
数字经济犯罪的系统考察与刑法应对
12
作者 舒洪水 郭仁东 《浙江工商大学学报》 北大核心 2025年第2期68-78,共11页
数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预... 数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预防性刑法立法及能动性刑事司法对数字经济犯罪作出回应,但仍存在诸多问题。因此,溯源数据经济的基础性结构,对数字经济犯罪应进行系统性考察,而不应割裂三个领域犯罪的整体性,刑法亦应予以体系化应对,而不应局限于某特定领域的犯罪治理,应当确立“刑法修正案+附属刑法”的立法模式,以刑法修正案调整数字经济犯罪罪名体系,以附属刑法立法模式完善数字经济犯罪构成要件。 展开更多
关键词 数字经济犯罪 数据法益 立法模式 刑法修正案 附属刑法
在线阅读 下载PDF
自主化核设计软件包PCM物理模型程序对比验证
13
作者 兰兵 潘昕怿 +1 位作者 马云帆 于世和 《核电子学与探测技术》 北大核心 2025年第7期1042-1046,共5页
压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结... 压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结果表明:PCM组件计算和堆芯计算结果(如,有效增殖系数、组件功率分布、功率峰值)与对比验证程序吻合较好,分离物理模型和组合物理模型的数值计算方法正确,可用于支撑PCM软件实际工程应用。 展开更多
关键词 自主化 核设计软件 物理模型 基准题 验证
在线阅读 下载PDF
融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量:1
14
作者 黄晨峻 高建华 《小型微型计算机系统》 北大核心 2025年第2期504-512,共9页
代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,... 代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. 展开更多
关键词 代码异味 特征选择 CK度量 投票模型 集成学习
在线阅读 下载PDF
大语言模型在代码优化任务中的能力探究及改进方法
15
作者 王志鹏 何铁科 +1 位作者 赵若愚 郑滔 《软件学报》 北大核心 2025年第6期2477-2500,共24页
代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用... 代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用传统代码质量评估指标(例如,BLEU,CodeBLEU,edit progress)对4种主流大语言模型和4种代表性小规模预训练模型在代码优化任务的表现进行评估,发现大语言模型在审查前代码优化子任务的优化质量劣于小规模预训练模型.由于现有代码质量评估指标难以解释上述现象,提出基于Unidiff的代码优化评估指标,量化优化过程中的变更操作,以解释劣势原因并揭示模型执行变更操作的倾向性:(1)审查前代码优化任务难度较大,模型执行正确变更操作的准确度极低,且大语言模型比小规模预训练模型表现更为“激进”,即倾向于执行更多的代码变更操作,导致其表现不佳;(2)相比小规模预训练模型,大语言模型在代码优化任务倾向于执行更多插入(ADD)和修改(MODIFY)变更操作且ADD变更操作平均插入的代码行数较多,进一步证明其“激进”性.为缓解大语言模型在审查前优化任务中的劣势,基于大语言模型和集成学习提出LLM-Voter方法,包含Inference-based(基于模型推理)和Confidence-based(基于置信度选择)两种子方案,旨在集成不同基模型的优势以提升代码优化质量.在此基础上,进一步引入优化判定机制,以增强模型的决策稳定性与可靠性.实验证明:基于置信度选择的LLM-Voter方法能够在大幅提高EM(exact match)值的同时获得优于所有基模型的优化质量,从而有效缓解大语言模型的劣势. 展开更多
关键词 代码审查 自动代码优化 大语言模型 统一差异格式 集成学习
在线阅读 下载PDF
GITG:面向Gitee平台的issue标题自动生成方法
16
作者 杨君 刘诗凡 +1 位作者 陈翔 崔展齐 《电子学报》 北大核心 2025年第5期1559-1570,共12页
在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有... 在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有的issue标题自动生成方法主要面向GitHub等英文开源平台,当应用在Gitee等国产开源平台时表现不佳.同时,现有方法主要使用issue主体描述作为输入,忽略了issue中的代码片段等重要信息.为此,本文提出一种面向Gitee平台的issue标题自动生成方法GITG(Gitee Issue Title Generation),针对包含中文和英文文本的issue,使用构建的Gitee issue数据集对支持中文的预训练模型Chinese BART(Bidirectional and Auto-Regressive Transformers)进行微调,利用issue主体描述和代码片段的双模态信息来自动生成issue标题.为验证GITG的有效性,构建了包含18242个Gitee issue样本的数据集.实验结果表明,GITG在ROUGE-1、ROUGE-2和ROUGE-L指标上相较于iTAPE和iTiger分别至少提升了13.09%、10.18%和12.84%,在BLEU和METEOR指标上同样取得了性能提升.人工评价结果表明,GITG生成标题的平均得分在整体分数、流畅性、信息性和简洁性4个评价指标上相较iTAPE和iTiger分别至少提升了26.7%、20.8%、24.2%和20.0%. 展开更多
关键词 Gitee issue标题 主体描述 代码片段 预训练模型 软件维护
在线阅读 下载PDF
LLM赋能的Datalog代码翻译技术及增量程序分析框架
17
作者 王熙灶 沈天琪 +1 位作者 宾向荣 卜磊 《软件学报》 北大核心 2025年第6期2515-2534,共20页
Datalog是一种声明式逻辑编程语言,在不同领域得到了广泛应用.近年来,学术界和工业界对Datalog的兴趣高涨,设计并开发了多种Datalog引擎和相应方言.然而,多方言带来的一个问题是以一种Datalog方言实现的代码,一般而言不能在另一种方言... Datalog是一种声明式逻辑编程语言,在不同领域得到了广泛应用.近年来,学术界和工业界对Datalog的兴趣高涨,设计并开发了多种Datalog引擎和相应方言.然而,多方言带来的一个问题是以一种Datalog方言实现的代码,一般而言不能在另一种方言的引擎上执行.因此,当采用新Datalog引擎时,需要将现有Datalog代码翻译到新方言上.目前的Datalog代码翻译技术可分为人工重写代码和人工设计翻译规则两类,存在耗时长、大量重复劳动、缺乏灵活性和可拓展性等问题.提出了一种大语言模型(LLM)赋能的Datalog代码翻译技术,利用LLM强大的代码理解和生成能力,通过分治翻译策略、基于少样本提示和思维链提示的提示工程、基于检查-反馈-修复的迭代纠错机制,可以在不同Datalog方言之间实现高精度代码翻译,减轻开发人员重复开发翻译规则的工作量.基于此代码翻译技术,设计并实现了一种通用的基于Datalog的声明式增量程序分析框架.在不同Datalog方言对上评估了所提出的LLM赋能的Datalog代码翻译技术的性能,评估结果验证了所提代码翻译技术的有效性.对通用声明式增量程序分析框架进行了实验评估,验证了基于所提代码翻译技术的增量程序分析的加速效果. 展开更多
关键词 DATALOG 代码翻译 大语言模型 程序分析 增量分析框架
在线阅读 下载PDF
基于SUMT修正法的差分码偏差和电离层TEC估计
18
作者 廖思明 尚俊娜 苏明坤 《电信科学》 北大核心 2025年第3期154-166,共13页
基于球谐函数,实现区域电离层建模,并对区域差分码偏差(differential code bias,DCB)与总电子含量(total electron content,TEC)进行解算。对于格网处垂直总电子含量(vertical total electron content,VTEC)出现的异常值,提出一种序列... 基于球谐函数,实现区域电离层建模,并对区域差分码偏差(differential code bias,DCB)与总电子含量(total electron content,TEC)进行解算。对于格网处垂直总电子含量(vertical total electron content,VTEC)出现的异常值,提出一种序列无约束最小化技术(sequential unconstrained minimization technique,SUMT)修正法进行修正,利用国际全球导航卫星系统服务(International GNSS Service,IGS)网络的6个测站双频观测数据,建立了电离层VTEC区域模型,并估算了31天的卫星频间DCB,将估算值与电离层分析中心中国科学院(Chinese Academy of Sciences,CAS)发布的产品进行对比分析,结果显示:所有的卫星差值都在0.42 ns以内,其中87.5%的卫星差值在0.4 ns以内,78.1%的卫星差值在0.2 ns以内,频间DCB的平均偏差基本小于0.4 ns。此外,估算的全球定位系统(global positioning system,GPS)卫星DCB序列的标准差(standard deviation,STD)值小于0.1 ns。建立了经纬度范围为5°E~25°E、40°N~60°N的电离层区域模型,将VTEC建模结果与CAS发布的全球电离层地图(global ionospheric map,GIM)产品做差比较,结果显示整体时间点的差值均处于4 TECU以内,且超过90%的区域差值在2 TECU以内,表明估算的结果与CAS产品具有良好的一致性。 展开更多
关键词 差分码偏差 TEC估计 电离层建模 SUMT修正法
在线阅读 下载PDF
面向测试用例生成的大模型高效微调方法 被引量:1
19
作者 曹鹏 温广琪 +3 位作者 杨金柱 陈刚 刘歆一 季学纯 《计算机应用》 北大核心 2025年第3期725-731,共7页
基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这... 基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这2个挑战。为了解决这些问题,提出将编码风格和功能风格同步迁移微调的思想,并开发一种高效的LLM微调训练方法用于单元测试用例生成。首先,利用广泛使用的指令数据集对LLM进行指令对齐,并按任务类型对指令集分类;同时,提取并存储具有任务特征的权重增量;其次,设计一个自适应风格提取模块,该模块包含抗噪声干扰学习和编码风格回溯学习,以应对不同的代码编写风格;最后,在目标域分别对功能风格增量和编码风格增量进行联合训练,以实现在目标域低资源情况下的高效适配和微调。在SF110 Corpus of Classes数据集上的测试用例生成实验结果表明,所提方法的结果均优于对比方法,与主流代码生成LLM Codex、Code Llama和DeepSeek-Coder相比,所提方法的编译率分别提高0.8%、43.5%和33.8%、分支覆盖率分别提高3.1%、1.0%和17.2%;行覆盖率分别提高4.1%、6.5%和15.5%,验证了所提方法在代码生成任务上的优越性。 展开更多
关键词 单元测试 代码生成 大语言模型 权重增量学习 微调学习
在线阅读 下载PDF
特征交叉融合和大模型修复的代码生成方法
20
作者 李文静 顾乃杰 +1 位作者 杨戴原 王聪 《小型微型计算机系统》 北大核心 2025年第5期1025-1031,共7页
代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和... 代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和语义的一致性.对此,本文提出基于特征金字塔交叉融合的翻译模型和基于代码大模型修复的方法.在代码翻译阶段,引入特征金字塔网络,利用交叉融合方法提取不同尺度的特征与全局信息结合,提高候选代码片段的正确性.在搜索合成阶段,使用代码大模型修复错误程序.实验表明,当设置修复候选程序数n_(r)=1时,与目前最好的结果相比,本文方法最高提升6.1%的通过率.在n_(r)=10时,最高提升9.0%的通过率,平均提升6.0%的通过率. 展开更多
关键词 代码生成 程序修复 大语言模型 特征金字塔
在线阅读 下载PDF
上一页 1 2 55 下一页 到第
使用帮助 返回顶部