期刊文献+
共找到1,126篇文章
< 1 2 57 >
每页显示 20 50 100
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:1
1
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 大模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
考虑裂纹分形维数的平行黏结模型细观参数标定的神经网络模型
2
作者 龚囱 戚燕顺 +4 位作者 缪浩杰 肖琦 熊良锋 曾鹏 赵奎 《岩土力学》 北大核心 2025年第1期327-336,共10页
针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面... 针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面裂纹分形维数。在此基础上,建立了以宏观弹性模量、宏观泊松比、峰值强度和裂纹分形维数等4个参数为输入层,黏结弹性模量、黏结法向与切向刚度比、黏结内聚力、黏结内摩擦角、黏结抗拉强度和摩擦系数等6个细观参数为输出层的神经网络模型,对比分析了考虑与不考虑裂纹分形维数时平行黏结模型细观参数标定效果。研究结果表明:(1)所建立的神经网络模型具有较好的收敛速度、预测精度与泛化性能,测试集输出数据与期望值误差约为3.34%。(2)将裂纹分形维数纳入神经网络模型后,数值模拟所得弹性模量、峰值应力与泊松比等宏观参数与室内试验结果的误差小于3.00%,优于不考虑裂纹分形维数标定结果。(3)该方法可定量保障数值模拟所得裂纹不规则性与室内试验结果的一致性,其在一定程度上可视为对现有神经网络模型细观参数标定结果的修正。研究成果可为提高平行黏结模型细观参数标定效果提供新思路。 展开更多
关键词 分形维数 颗粒流 平行黏结模型 参数标定 神经网络
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
3
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
基于标准模型的SCD文件虚回路校核方法
4
作者 曹海欧 沈蛟骁 +1 位作者 张玥 陈鹏 《沈阳工业大学学报》 北大核心 2025年第1期21-28,共8页
【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚... 【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚回路信息时,工作量大、效率低下且容易出现漏查等情况,故对人员专业水平要求颇高。基于固定规则的校核技术,因智能站虚回路受电压等级、主接线形式、间隔类型、装置类型、保护功能需求等众多复杂因素影响,致使校核规则极为繁杂,其可靠性与可维护性难以保证。在此背景下,本研究致力于提升智能变电站虚回路自动校核技术的适应性和准确性,涉及智能变电站二次系统整体架构及运行保障等相关范围,对确保变电站安全稳定运行具有重要意义。【方法】采用基于标准模型方法深入剖析影响SCD虚回路校核的因素,通过构建标准模型来适配差异。专业人员依据电压等级、接线方式及装置类型等构建并维护ICD标准虚端子模型库,其标识具备唯一性。同时,建立ICD厂家虚端子与标准虚端子的映射模型,明确映射文件表达方式及数据结构,记录两者精确对应关系。综合考虑多种影响因素构建标准虚回路模型,并由专业人员负责维护发布,为校核提供准确依据。在具体校核过程中,通过解析SCD文件生成装置间互操作关系对象标识,运用数学模型集合的逻辑运算差集,将解析的虚回路数据与标准虚回路模型进行对比,精准计算正确、多余与缺失回路的情况。【结果】所提方法通过标准模型及配套流程可有效解决SCD虚回路校核难题,在一定程度上提高了校核准确性,可有效应对多种差异。【结论】与传统方法相比,提出的基于标准模型的校核模式优势明显,可为智能变电站运维管理政策制定提供有力技术支撑,助力规范行业建设与运维标准制定。在学术交流价值方面,可为智能变电站二次系统研究开拓新路径,为后续虚回路校核研究在模型构建、数据处理等方面提供借鉴。 展开更多
关键词 智能变电站 SCD文件 虚回路校核 标准模型 虚端子 映射模型 编码标识 二次回路
在线阅读 下载PDF
数字经济犯罪的系统考察与刑法应对
5
作者 舒洪水 郭仁东 《浙江工商大学学报》 北大核心 2025年第2期68-78,共11页
数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预... 数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预防性刑法立法及能动性刑事司法对数字经济犯罪作出回应,但仍存在诸多问题。因此,溯源数据经济的基础性结构,对数字经济犯罪应进行系统性考察,而不应割裂三个领域犯罪的整体性,刑法亦应予以体系化应对,而不应局限于某特定领域的犯罪治理,应当确立“刑法修正案+附属刑法”的立法模式,以刑法修正案调整数字经济犯罪罪名体系,以附属刑法立法模式完善数字经济犯罪构成要件。 展开更多
关键词 数字经济犯罪 数据法益 立法模式 刑法修正案 附属刑法
在线阅读 下载PDF
基于扩散模型的恶意代码数据集扩充方法 被引量:1
6
作者 李思聪 王坚 +2 位作者 宋亚飞 王硕 冯存前 《空军工程大学学报》 北大核心 2025年第1期95-103,共9页
随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模... 随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模型可能会过度拟合于这些稀缺数据,导致模型的性能不佳。针对以上问题,提出一种基于扩散模型生成新样本的数据集扩充方法,通过学习从原始数据到噪声的转换过程,并利用反向过程还原噪声样本为新的相似样本,实现数据集的扩充,生成与原始数据集相似但不同的新样本,以缓解部分家族数据不平衡对分类检测任务的影响,提高模型的泛化能力。 展开更多
关键词 恶意代码检测 扩散模型 恶意代码可视化 数据增强技术 U-Net
在线阅读 下载PDF
基于大语言模型的多智能体协作代码评审人推荐 被引量:2
7
作者 王路桥 周洋涛 +5 位作者 李青山 王铭康 徐子轩 崔笛 王璐 罗懿行 《软件学报》 北大核心 2025年第6期2558-2575,共18页
基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增... 基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增加了评审人推荐的难度.现有方法主要聚焦于从PR中挖掘变更代码的语义信息,或基于审查历史构建评审人画像,并通过多种静态策略组合进行推荐.这些研究受限于模型训练语料的丰富性以及交互类型的复杂性,导致推荐性能不佳.鉴于此,提出一种基于智能体间相互协作的代码评审人推荐方法.该方法利用先进的大语言模型,精确捕捉PR和评审人丰富的文本语义信息.此外,AI智能体强大的规划、协作和决策能力使其能够集成不同交互类型的信息,具有高度的灵活性和适应性.基于真实数据集进行实验分析,与基线评审人推荐方法相比,所提方法性能提升4.45%–26.04%.此外,案例研究证明,所提方法在可解释性方面表现突出,进一步验证了其在实际应用中的有效性和可靠性. 展开更多
关键词 代码评审人推荐 基于智能体的软件工程 大型语言模型 代码审查
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
8
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量:1
9
作者 黄晨峻 高建华 《小型微型计算机系统》 北大核心 2025年第2期504-512,共9页
代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,... 代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. 展开更多
关键词 代码异味 特征选择 CK度量 投票模型 集成学习
在线阅读 下载PDF
大模型生成代码的开源许可证违规风险洞察与分析
10
作者 王毅博 王莹 +3 位作者 余跃 许畅 于海 朱志良 《软件学报》 北大核心 2025年第6期2535-2557,共23页
大型语言模型的快速发展极大地影响了软件工程领域.这些模型利用大量开源仓库代码进行预训练,能够高效完成诸如代码生成和代码补全等任务.然而,开源软件仓库中存在大量受开源许可证约束的代码,这给大模型带来了潜在的开源许可证违规风险... 大型语言模型的快速发展极大地影响了软件工程领域.这些模型利用大量开源仓库代码进行预训练,能够高效完成诸如代码生成和代码补全等任务.然而,开源软件仓库中存在大量受开源许可证约束的代码,这给大模型带来了潜在的开源许可证违规风险.聚焦于大模型生成代码与开源仓库的许可证违规风险,基于代码克隆技术开发一个支持大模型生成代码溯源与版权违规问题的检测框架.针对9个主流代码大模型生成的135000个Python代码,利用该框架在开源社区中溯源并检测开源许可证兼容性.通过实践调查3个研究问题来探究大模型代码生成对开源软件生态的影响:(1)大模型生成的代码多大程度克隆于开源软件仓库?(2)大模型生成的代码是否存在开源许可证违规风险?(3)真实开源软件中包含的大模型生成代码是否存在开源许可证违规风险?实验结果发现在使用功能描述和方法签名所生成的43130和65900个大于6行的Python代码中,分别溯源到了68.5%和60.9%的代码存在克隆的开源代码片段.其中CodeParrot和CodeGen系列模型的克隆比例最高,GPT-3.5-Turbo最低.其次,92.7%的通过功能描述生成的代码中没有开源许可证声明.通过与溯源代码许可证进行对比,81.8%的代码存在开源许可证违规风险.此外,在收集到的229个GitHub平台开发者使用大模型生成的代码中,有136个代码溯源了到开源代码片段,其中38个为Type1和Type2克隆类型,有30个存在开源许可证违规风险.以问题报告的形式提交给开发者,到目前为止,得到了8位开发者的反馈. 展开更多
关键词 大语言模型 开源许可证 开源许可证冲突 代码克隆 代码搜索
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:1
11
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
深度代码模型安全综述
12
作者 孙伟松 陈宇琛 +7 位作者 赵梓含 陈宏 葛一飞 韩廷旭 黄胜寒 李佳讯 房春荣 陈振宇 《软件学报》 北大核心 2025年第4期1461-1488,共28页
随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无... 随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无法比拟的优势.这些面向代码相关任务训练的深度学习模型统称为深度代码模型.然而,由于神经网络的脆弱性和不可解释性,与自然语言处理模型与图像处理模型一样,深度代码模型安全也面临众多挑战,已经成为软件工程领域的焦点.近年来,研究者提出了众多针对深度代码模型的攻击与防御方法.然而,目前仍缺乏对深度代码模型安全研究的系统性综述,不利于后续研究者对该领域进行快速的了解.因此,为了总结该领域研究现状、挑战及时跟进该领域的最新研究成果,搜集32篇该领域相关论文,并将现有的研究成果主要分为后门攻击与防御技术和对抗攻击与防御技术两类.按照不同技术类别对所收集的论文进行系统地梳理和总结.随后,总结该领域中常用的实验数据集和评估指标.最后,分析该领域所面临的关键挑战以及未来可行的研究方向,旨在为后续研究者进一步推动深度代码模型安全的发展提供有益指导. 展开更多
关键词 深度代码模型 深度代码模型安全 人工智能模型安全 后门攻击与防御 对抗攻击与防御
在线阅读 下载PDF
露天矿爆破设计与模拟Blast-Code模型及其在水厂铁矿的应用 被引量:17
13
作者 璩世杰 尚峰华 +1 位作者 李宝辉 王友成 《工程爆破》 2001年第2期18-24,共7页
结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采... 结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采场的地形条件、矿岩物理力学性质及地质构造等信息 ;后者则依据对爆区地形 (包括台阶自由面条件 )、爆区内矿岩的物理力学性质与地质构造特征、炸药爆炸性能三类对爆破效果具有直接影响的关键因素的综合定量分析 ,由计算机自动进行完整的爆破设计 ,并可对矿岩的破碎效果和爆堆形状进行定量的模拟和预测。Blast Code模型具有爆破参数选取的人工干预和钻孔爆破成本计算功能 ,可对多个设计方案进行技术经济对比分析 。 展开更多
关键词 Blast-Code模型 露天矿 爆破设计 地质地形数据库 中深孔爆破 爆破模拟
在线阅读 下载PDF
大语言模型在代码优化任务中的能力探究及改进方法
14
作者 王志鹏 何铁科 +1 位作者 赵若愚 郑滔 《软件学报》 北大核心 2025年第6期2477-2500,共24页
代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用... 代码优化任务作为自动化代码审查的关键环节,有助于提高开发效率和代码质量.随着大语言模型在软件工程领域中展现出远胜于传统小规模预训练模型的性能,旨在探讨两类模型在自动代码优化任务的表现,以评估大语言模型的综合优势.通过使用传统代码质量评估指标(例如,BLEU,CodeBLEU,edit progress)对4种主流大语言模型和4种代表性小规模预训练模型在代码优化任务的表现进行评估,发现大语言模型在审查前代码优化子任务的优化质量劣于小规模预训练模型.由于现有代码质量评估指标难以解释上述现象,提出基于Unidiff的代码优化评估指标,量化优化过程中的变更操作,以解释劣势原因并揭示模型执行变更操作的倾向性:(1)审查前代码优化任务难度较大,模型执行正确变更操作的准确度极低,且大语言模型比小规模预训练模型表现更为“激进”,即倾向于执行更多的代码变更操作,导致其表现不佳;(2)相比小规模预训练模型,大语言模型在代码优化任务倾向于执行更多插入(ADD)和修改(MODIFY)变更操作且ADD变更操作平均插入的代码行数较多,进一步证明其“激进”性.为缓解大语言模型在审查前优化任务中的劣势,基于大语言模型和集成学习提出LLM-Voter方法,包含Inference-based(基于模型推理)和Confidence-based(基于置信度选择)两种子方案,旨在集成不同基模型的优势以提升代码优化质量.在此基础上,进一步引入优化判定机制,以增强模型的决策稳定性与可靠性.实验证明:基于置信度选择的LLM-Voter方法能够在大幅提高EM(exact match)值的同时获得优于所有基模型的优化质量,从而有效缓解大语言模型的劣势. 展开更多
关键词 代码审查 自动代码优化 大语言模型 统一差异格式 集成学习
在线阅读 下载PDF
基于大语言模型的自动代码修复综述
15
作者 许鹏宇 况博裕 +1 位作者 苏铓 付安民 《计算机研究与发展》 北大核心 2025年第8期2040-2057,共18页
软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件... 软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向. 展开更多
关键词 自动代码修复 大语言模型 代码大语言模型 软件缺陷 补丁生成
在线阅读 下载PDF
经颅彩色多普勒超声联合经颅超声造影与磁共振血管成像在颅内动脉狭窄诊断中的相关性及应用价值
16
作者 夏岩 王嵘 +3 位作者 张蕾 林发 刘子琪 王晓岩 《首都医科大学学报》 北大核心 2025年第4期694-701,共8页
目的探究经颅彩色多普勒超声(transcranial color-coded Duplex ultrasound,TCCD)联合超声造影(contrast-enhanced ultrasound,CEUS)检测颅内主要动脉狭窄的灵敏度、特异度及其与磁共振血管成像(magnetic resonance angiography,MRA)检... 目的探究经颅彩色多普勒超声(transcranial color-coded Duplex ultrasound,TCCD)联合超声造影(contrast-enhanced ultrasound,CEUS)检测颅内主要动脉狭窄的灵敏度、特异度及其与磁共振血管成像(magnetic resonance angiography,MRA)检查结果的一致性和应用价值。方法选取2023年4月至2024年8月首都医科大学附属北京天坛医院医院55例疑似颅内动脉狭窄或闭塞患者,分别应用TCCD联合CEUS和MRA,检查颈内动脉终末段、大脑中动脉M1和M2段,大脑前动脉A1和A2段、大脑后动脉P1和P2段以及椎动脉V4段等血管狭窄程度。将颅内动脉狭窄程度分为正常/轻度、中度、重度/闭塞3组,计算两种检查方法的灵敏度、特异度及一致性。采用Wilcoxon符号秩检验比较两种检查费用及诊断时长的差异。结果本研究纳入55例(共110例大脑半球)高危脑血管狭窄患者(中位年龄46岁,男性占69.0%),同步行TCCD联合CEUS与MRA检测。TCCD联合CEUS与MRA在颅内动脉狭窄诊断的灵敏度和特异度较高。TCCD联合CEUS与MRA在诊断颅内动脉狭窄具有一致性,其中M2段(加权Kappa值=0.704)、A2段(加权Kappa值=0.650)诊断一致性较高;M1段(加权Kappa值=0.569)一致性中等。同时,TCCD联合CEUS检查的平均费用为240元,诊断时长21 min,而MRA为722元和287 min(P<0.001,效应量r=0.89~0.91)。结论与MRA相比,TCCD联合CEUS在颅内大脑中动脉M2段和大脑前动脉A2段的血管狭窄筛查中具有较高一致性。TCCD联合CEUS更具成本效益。MRA对颅内深部血管狭窄程度的评估更具有优势。选择二者协同应用可优化颅内血管狭窄诊疗资源配置,建议基层医疗机构以TCCD初筛和经过规范培训技术升级联合CEUS,对复杂病例转诊MRA精细化评估。 展开更多
关键词 经颅彩色多普勒超声 超声造影 磁共振血管成像 颅内动脉 卫生经济学 诊疗模式
在线阅读 下载PDF
特征交叉融合和大模型修复的代码生成方法
17
作者 李文静 顾乃杰 +1 位作者 杨戴原 王聪 《小型微型计算机系统》 北大核心 2025年第5期1025-1031,共7页
代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和... 代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和语义的一致性.对此,本文提出基于特征金字塔交叉融合的翻译模型和基于代码大模型修复的方法.在代码翻译阶段,引入特征金字塔网络,利用交叉融合方法提取不同尺度的特征与全局信息结合,提高候选代码片段的正确性.在搜索合成阶段,使用代码大模型修复错误程序.实验表明,当设置修复候选程序数n_(r)=1时,与目前最好的结果相比,本文方法最高提升6.1%的通过率.在n_(r)=10时,最高提升9.0%的通过率,平均提升6.0%的通过率. 展开更多
关键词 代码生成 程序修复 大语言模型 特征金字塔
在线阅读 下载PDF
自主化核设计软件包PCM物理模型程序对比验证
18
作者 兰兵 潘昕怿 +1 位作者 马云帆 于世和 《核电子学与探测技术》 北大核心 2025年第7期1042-1046,共5页
压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结... 压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结果表明:PCM组件计算和堆芯计算结果(如,有效增殖系数、组件功率分布、功率峰值)与对比验证程序吻合较好,分离物理模型和组合物理模型的数值计算方法正确,可用于支撑PCM软件实际工程应用。 展开更多
关键词 自主化 核设计软件 物理模型 基准题 验证
在线阅读 下载PDF
基于SUMT修正法的差分码偏差和电离层TEC估计
19
作者 廖思明 尚俊娜 苏明坤 《电信科学》 北大核心 2025年第3期154-166,共13页
基于球谐函数,实现区域电离层建模,并对区域差分码偏差(differential code bias,DCB)与总电子含量(total electron content,TEC)进行解算。对于格网处垂直总电子含量(vertical total electron content,VTEC)出现的异常值,提出一种序列... 基于球谐函数,实现区域电离层建模,并对区域差分码偏差(differential code bias,DCB)与总电子含量(total electron content,TEC)进行解算。对于格网处垂直总电子含量(vertical total electron content,VTEC)出现的异常值,提出一种序列无约束最小化技术(sequential unconstrained minimization technique,SUMT)修正法进行修正,利用国际全球导航卫星系统服务(International GNSS Service,IGS)网络的6个测站双频观测数据,建立了电离层VTEC区域模型,并估算了31天的卫星频间DCB,将估算值与电离层分析中心中国科学院(Chinese Academy of Sciences,CAS)发布的产品进行对比分析,结果显示:所有的卫星差值都在0.42 ns以内,其中87.5%的卫星差值在0.4 ns以内,78.1%的卫星差值在0.2 ns以内,频间DCB的平均偏差基本小于0.4 ns。此外,估算的全球定位系统(global positioning system,GPS)卫星DCB序列的标准差(standard deviation,STD)值小于0.1 ns。建立了经纬度范围为5°E~25°E、40°N~60°N的电离层区域模型,将VTEC建模结果与CAS发布的全球电离层地图(global ionospheric map,GIM)产品做差比较,结果显示整体时间点的差值均处于4 TECU以内,且超过90%的区域差值在2 TECU以内,表明估算的结果与CAS产品具有良好的一致性。 展开更多
关键词 差分码偏差 TEC估计 电离层建模 SUMT修正法
在线阅读 下载PDF
池式非能动余热排出系统热工水力分析的系统程序改进及验证
20
作者 连强 朱隆祥 +3 位作者 唐思邈 黄涛 张勇 潘良明 《原子能科学技术》 北大核心 2025年第4期858-866,共9页
福岛核事故后非能动理念被广泛应用于先进反应堆的热工安全设计,而池式非能动余热排出系统(PRHRS)也在国产华龙一号中提供了不依赖外部能源驱动的安全保障。尽管RELAP5程序在反应堆瞬态热工水力特性分析方面开展了大量验证工作,但由于... 福岛核事故后非能动理念被广泛应用于先进反应堆的热工安全设计,而池式非能动余热排出系统(PRHRS)也在国产华龙一号中提供了不依赖外部能源驱动的安全保障。尽管RELAP5程序在反应堆瞬态热工水力特性分析方面开展了大量验证工作,但由于缺乏针对性的池式热交换器模型,RELAP5程序低估了池式PRHRS的换热功率及系统流量。因此本文根据池式热交换器工作条件选用棒束池式沸腾换热模型及大管径管内冷凝换热模型,在RELAP5程序中植入了池式热交换器模型,针对两种换热模型分别进行了分离效应验证。基于应急工况池式能量排出系统(PERSTO)实验台架分析了节点划分方式对池式PRHRS热工水力行为的影响,对比了改进程序及原始程序对整体性实验台架系统瞬态参数的模拟能力。经过分离效应验证和整体效应验证,确认了改进程序在池式PRHRS热工水力分析中的有效性。 展开更多
关键词 池式非能动余热排出系统 热工水力 系统程序改进 节点划分方式 模型验证
在线阅读 下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部