期刊文献+
共找到1,072篇文章
< 1 2 54 >
每页显示 20 50 100
基于标准模型的SCD文件虚回路校核方法
1
作者 曹海欧 沈蛟骁 +1 位作者 张玥 陈鹏 《沈阳工业大学学报》 北大核心 2025年第1期21-28,共8页
【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚... 【目的】随着智能变电站的快速发展,其在电力系统中的地位日益重要。智能变电站具有网络化信息共享等特性,SCD文件作为运行关键数据来源,直接关系到站内继电保护动作的准确性,然而当前SCD虚回路校核面临诸多困境。人工校核在面对大量虚回路信息时,工作量大、效率低下且容易出现漏查等情况,故对人员专业水平要求颇高。基于固定规则的校核技术,因智能站虚回路受电压等级、主接线形式、间隔类型、装置类型、保护功能需求等众多复杂因素影响,致使校核规则极为繁杂,其可靠性与可维护性难以保证。在此背景下,本研究致力于提升智能变电站虚回路自动校核技术的适应性和准确性,涉及智能变电站二次系统整体架构及运行保障等相关范围,对确保变电站安全稳定运行具有重要意义。【方法】采用基于标准模型方法深入剖析影响SCD虚回路校核的因素,通过构建标准模型来适配差异。专业人员依据电压等级、接线方式及装置类型等构建并维护ICD标准虚端子模型库,其标识具备唯一性。同时,建立ICD厂家虚端子与标准虚端子的映射模型,明确映射文件表达方式及数据结构,记录两者精确对应关系。综合考虑多种影响因素构建标准虚回路模型,并由专业人员负责维护发布,为校核提供准确依据。在具体校核过程中,通过解析SCD文件生成装置间互操作关系对象标识,运用数学模型集合的逻辑运算差集,将解析的虚回路数据与标准虚回路模型进行对比,精准计算正确、多余与缺失回路的情况。【结果】所提方法通过标准模型及配套流程可有效解决SCD虚回路校核难题,在一定程度上提高了校核准确性,可有效应对多种差异。【结论】与传统方法相比,提出的基于标准模型的校核模式优势明显,可为智能变电站运维管理政策制定提供有力技术支撑,助力规范行业建设与运维标准制定。在学术交流价值方面,可为智能变电站二次系统研究开拓新路径,为后续虚回路校核研究在模型构建、数据处理等方面提供借鉴。 展开更多
关键词 智能变电站 SCD文件 虚回路校核 标准模型 虚端子 映射模型 编码标识 二次回路
在线阅读 下载PDF
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:1
2
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 大模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
考虑裂纹分形维数的平行黏结模型细观参数标定的神经网络模型
3
作者 龚囱 戚燕顺 +4 位作者 缪浩杰 肖琦 熊良锋 曾鹏 赵奎 《岩土力学》 北大核心 2025年第1期327-336,共10页
针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面... 针对试错法在平行黏结模型细观参数标定过程中存在繁琐耗时,且无法定量评价数值模拟与室内试验的裂纹匹配程度等局限性,统计并分析了近10年平行黏结模型细观参数取值范围,采用盒计数法获取了数值模拟试验、室内试验所得破坏后岩石表面裂纹分形维数。在此基础上,建立了以宏观弹性模量、宏观泊松比、峰值强度和裂纹分形维数等4个参数为输入层,黏结弹性模量、黏结法向与切向刚度比、黏结内聚力、黏结内摩擦角、黏结抗拉强度和摩擦系数等6个细观参数为输出层的神经网络模型,对比分析了考虑与不考虑裂纹分形维数时平行黏结模型细观参数标定效果。研究结果表明:(1)所建立的神经网络模型具有较好的收敛速度、预测精度与泛化性能,测试集输出数据与期望值误差约为3.34%。(2)将裂纹分形维数纳入神经网络模型后,数值模拟所得弹性模量、峰值应力与泊松比等宏观参数与室内试验结果的误差小于3.00%,优于不考虑裂纹分形维数标定结果。(3)该方法可定量保障数值模拟所得裂纹不规则性与室内试验结果的一致性,其在一定程度上可视为对现有神经网络模型细观参数标定结果的修正。研究成果可为提高平行黏结模型细观参数标定效果提供新思路。 展开更多
关键词 分形维数 颗粒流 平行黏结模型 参数标定 神经网络
在线阅读 下载PDF
基于扩散模型的恶意代码数据集扩充方法 被引量:1
4
作者 李思聪 王坚 +2 位作者 宋亚飞 王硕 冯存前 《空军工程大学学报》 北大核心 2025年第1期95-103,共9页
随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模... 随着大数据的支撑,深度学习模型在计算机视觉和自然语言处理等领域展现出卓越的能力。然而,在恶意代码图像领域应用中,可能会出现训练数据不足的情况。由于部分恶意家族训练样本数量有限,无法充分描述整个数据集的分布特征,深度学习模型可能会过度拟合于这些稀缺数据,导致模型的性能不佳。针对以上问题,提出一种基于扩散模型生成新样本的数据集扩充方法,通过学习从原始数据到噪声的转换过程,并利用反向过程还原噪声样本为新的相似样本,实现数据集的扩充,生成与原始数据集相似但不同的新样本,以缓解部分家族数据不平衡对分类检测任务的影响,提高模型的泛化能力。 展开更多
关键词 恶意代码检测 扩散模型 恶意代码可视化 数据增强技术 U-Net
在线阅读 下载PDF
基于大语言模型的多智能体协作代码评审人推荐 被引量:2
5
作者 王路桥 周洋涛 +5 位作者 李青山 王铭康 徐子轩 崔笛 王璐 罗懿行 《软件学报》 北大核心 2025年第6期2558-2575,共18页
基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增... 基于拉取请求(pull request,PR)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增加了评审人推荐的难度.现有方法主要聚焦于从PR中挖掘变更代码的语义信息,或基于审查历史构建评审人画像,并通过多种静态策略组合进行推荐.这些研究受限于模型训练语料的丰富性以及交互类型的复杂性,导致推荐性能不佳.鉴于此,提出一种基于智能体间相互协作的代码评审人推荐方法.该方法利用先进的大语言模型,精确捕捉PR和评审人丰富的文本语义信息.此外,AI智能体强大的规划、协作和决策能力使其能够集成不同交互类型的信息,具有高度的灵活性和适应性.基于真实数据集进行实验分析,与基线评审人推荐方法相比,所提方法性能提升4.45%–26.04%.此外,案例研究证明,所提方法在可解释性方面表现突出,进一步验证了其在实际应用中的有效性和可靠性. 展开更多
关键词 代码评审人推荐 基于智能体的软件工程 大型语言模型 代码审查
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:2
6
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
7
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
数字经济犯罪的系统考察与刑法应对
8
作者 舒洪水 郭仁东 《浙江工商大学学报》 北大核心 2025年第2期68-78,共11页
数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预... 数字经济犯罪是由涵盖信息数据、数字技术和信息网络三个领域的犯罪形态共同构成的犯罪体系。传统法益保护模式无法适应数据法益的整合性,传统行为规制模式无法涵盖数字犯罪行为外延,数字经济犯罪已对刑法形成系统挑战。我国刑法通过预防性刑法立法及能动性刑事司法对数字经济犯罪作出回应,但仍存在诸多问题。因此,溯源数据经济的基础性结构,对数字经济犯罪应进行系统性考察,而不应割裂三个领域犯罪的整体性,刑法亦应予以体系化应对,而不应局限于某特定领域的犯罪治理,应当确立“刑法修正案+附属刑法”的立法模式,以刑法修正案调整数字经济犯罪罪名体系,以附属刑法立法模式完善数字经济犯罪构成要件。 展开更多
关键词 数字经济犯罪 数据法益 立法模式 刑法修正案 附属刑法
在线阅读 下载PDF
深度代码模型安全综述
9
作者 孙伟松 陈宇琛 +7 位作者 赵梓含 陈宏 葛一飞 韩廷旭 黄胜寒 李佳讯 房春荣 陈振宇 《软件学报》 北大核心 2025年第4期1461-1488,共28页
随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无... 随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功,软件工程研究者开始尝试将其引入到软件工程任务求解当中.已有研究结果显示,深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无法比拟的优势.这些面向代码相关任务训练的深度学习模型统称为深度代码模型.然而,由于神经网络的脆弱性和不可解释性,与自然语言处理模型与图像处理模型一样,深度代码模型安全也面临众多挑战,已经成为软件工程领域的焦点.近年来,研究者提出了众多针对深度代码模型的攻击与防御方法.然而,目前仍缺乏对深度代码模型安全研究的系统性综述,不利于后续研究者对该领域进行快速的了解.因此,为了总结该领域研究现状、挑战及时跟进该领域的最新研究成果,搜集32篇该领域相关论文,并将现有的研究成果主要分为后门攻击与防御技术和对抗攻击与防御技术两类.按照不同技术类别对所收集的论文进行系统地梳理和总结.随后,总结该领域中常用的实验数据集和评估指标.最后,分析该领域所面临的关键挑战以及未来可行的研究方向,旨在为后续研究者进一步推动深度代码模型安全的发展提供有益指导. 展开更多
关键词 深度代码模型 深度代码模型安全 人工智能模型安全 后门攻击与防御 对抗攻击与防御
在线阅读 下载PDF
基于大语言模型的自动代码修复综述
10
作者 许鹏宇 况博裕 +1 位作者 苏铓 付安民 《计算机研究与发展》 北大核心 2025年第8期2040-2057,共18页
软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件... 软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向. 展开更多
关键词 自动代码修复 大语言模型 代码大语言模型 软件缺陷 补丁生成
在线阅读 下载PDF
露天矿爆破设计与模拟Blast-Code模型及其在水厂铁矿的应用 被引量:17
11
作者 璩世杰 尚峰华 +1 位作者 李宝辉 王友成 《工程爆破》 2001年第2期18-24,共7页
结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采... 结合实例介绍了一种用于露天矿台阶垂直中深孔爆破设计并对爆破破碎效果和爆堆形状分别进行预测和模拟的软件系统———Blast Code模型。该模型主要由采场地质地形数据库、爆破设计与模拟两大部分构成 ,前者可以准确和方便快捷地反映采场的地形条件、矿岩物理力学性质及地质构造等信息 ;后者则依据对爆区地形 (包括台阶自由面条件 )、爆区内矿岩的物理力学性质与地质构造特征、炸药爆炸性能三类对爆破效果具有直接影响的关键因素的综合定量分析 ,由计算机自动进行完整的爆破设计 ,并可对矿岩的破碎效果和爆堆形状进行定量的模拟和预测。Blast Code模型具有爆破参数选取的人工干预和钻孔爆破成本计算功能 ,可对多个设计方案进行技术经济对比分析 。 展开更多
关键词 Blast-code模型 露天矿 爆破设计 地质地形数据库 中深孔爆破 爆破模拟
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
12
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
自主化核设计软件包PCM物理模型程序对比验证
13
作者 兰兵 潘昕怿 +1 位作者 马云帆 于世和 《核电子学与探测技术》 北大核心 2025年第7期1042-1046,共5页
压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结... 压水堆核设计软件作为我国自主化核电软件的基础软件之一,在工程应用前需进行充分的验证。本研究采用国际通用基准题,综合运用分离验证和整体验证策略,通过程序对比的方式开展自主化核设计软件包PCM组件和堆芯计算物理模型验证。验证结果表明:PCM组件计算和堆芯计算结果(如,有效增殖系数、组件功率分布、功率峰值)与对比验证程序吻合较好,分离物理模型和组合物理模型的数值计算方法正确,可用于支撑PCM软件实际工程应用。 展开更多
关键词 自主化 核设计软件 物理模型 基准题 验证
在线阅读 下载PDF
一种CMA数值预报模式代码质量检测方法与实现
14
作者 李佳静 杨泽 +3 位作者 王彬 刘易凡 董泽信 孟涛 《应用气象学报》 北大核心 2025年第2期155-163,共9页
中国气象局(CMA)数值预报的统筹研发对支撑平台的能力建设提出了更高要求,其中一个重要方面就是对数值预报模式代码的质量检测能力。目前缺乏有效针对数值预报模式代码的质量检测方法和工具,尤其对于性能缺陷和大规模代码的检测不能满... 中国气象局(CMA)数值预报的统筹研发对支撑平台的能力建设提出了更高要求,其中一个重要方面就是对数值预报模式代码的质量检测能力。目前缺乏有效针对数值预报模式代码的质量检测方法和工具,尤其对于性能缺陷和大规模代码的检测不能满足需要。为解决上述问题,该文针对子程序定义、数组操作和I/O操作等常见编程规则设计检测方法。该方法采用程序代码解析、抽象语法树匹配和流敏感的静态程序检测等关键技术,其中对分支和循环语句的分析方法有效避免了路径爆炸问题。基于该方法的检测工具在数值预报科创平台V1.0代码协同开发栏目提供使用,并应用于CMA区域数值模式的国省统筹研发。 展开更多
关键词 数值预报模式代码 代码质量 抽象语法树匹配 流敏感程序分析 有穷状态机
在线阅读 下载PDF
基于预训练及控制码的藏文律诗自动生成方法
15
作者 色差甲 慈祯嘉措 +1 位作者 才让加 华果才让 《中文信息学报》 北大核心 2025年第3期42-48,共7页
诗歌自动写作研究是自然语言生成的一个重要研究领域,被认为是极具挑战且有趣的任务之一。该文提出一种基于预训练及控制码的藏文律诗生成方法。在藏文预训练语言模型上进行微调后,生成质量显著提升;同时引入控制码后,在很大程度上确保... 诗歌自动写作研究是自然语言生成的一个重要研究领域,被认为是极具挑战且有趣的任务之一。该文提出一种基于预训练及控制码的藏文律诗生成方法。在藏文预训练语言模型上进行微调后,生成质量显著提升;同时引入控制码后,在很大程度上确保了扣题程度,即关键词在生成诗作中的平均覆盖率居高。此外,在生成的诗作中,不仅提高了词汇的丰富性,而且生成结果的多样性也明显提升。测试表明,基于预训练及控制码的生成方法显著优于基线方法。 展开更多
关键词 藏文律诗自动生成 藏文预训练模型 控制码
在线阅读 下载PDF
铁路客票电子发票数字化技术研究与应用
16
作者 李幸年 单杏花 +1 位作者 陈靖 于锦强 《中国铁路》 北大核心 2025年第7期17-24,共8页
铁路客票电子化的核心之一是实现铁路客票报销凭证电子化,即铁路客票电子发票。分析提出解决铁路客票电子发票面临的问题和需求,系统性规划设计铁路客票电子发票服务平台的总体技术方案,构建税票合一的发票模型,利用全数字化接口对接、... 铁路客票电子化的核心之一是实现铁路客票报销凭证电子化,即铁路客票电子发票。分析提出解决铁路客票电子发票面临的问题和需求,系统性规划设计铁路客票电子发票服务平台的总体技术方案,构建税票合一的发票模型,利用全数字化接口对接、高速顺序赋码、全数字化文件流转等关键技术,完成铁路客票电子发票开具、换开、查询、交付以及其他相关服务功能设计,并通过铁路12306商旅平台试点,有效验证了铁路客票电子发票数字化关键技术的可行性,为全面推广铁路客票电子发票奠定了技术基础,便捷旅客出行报销的同时推动了企业运营的绿色化、数字化转型发展。 展开更多
关键词 铁路客票 电子发票 全面数字化电子发票 发票数据模型 发票赋码
在线阅读 下载PDF
融合特征选择与多模型软投票集成学习的代码异味检测方法 被引量:1
17
作者 黄晨峻 高建华 《小型微型计算机系统》 北大核心 2025年第2期504-512,共9页
代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,... 代码异味会导致软件质量逐渐衰退,降低软件可理解性和可维护性.为检测软件结构中的代码异味,提出了一种基于CK度量的、经过两步特征选择的软投票集成学习的代码异味检测方法,该方法首先进行特征选择,使用Pearson相关系数剔除冗余特征,并在剩余度量中使用XGBoost特征重要性筛选相关度大的度量.然后,针对仅使用单一机器学习模型泛化性能不佳的问题,提出一种基于5种较成熟机器学习模型的软投票集成学习模型,完成代码异味分类检测任务.实验基于CK度量,利用含7个开源项目、4种代码异味的数据集,实验结果表明,此种方法能够减少特征维度,且在性能指标上优于其它分类模型,其中F1值最高提升3.24%,AUC最高提升2.32%. 展开更多
关键词 代码异味 特征选择 CK度量 投票模型 集成学习
在线阅读 下载PDF
面向区块链的数码电子雷管的安全监管系统
18
作者 刘娜 蔡维德 刘元元 《计算机工程与设计》 北大核心 2025年第9期2722-2727,共6页
针对传统数码电子雷管监管存在的易被篡改和单点故障等问题,导致不合格数字电子雷管难以追溯,数字电子雷管事故责任难以认定,提出了一种基于联盟区块链的数字电子雷管安全监管系统。为实现供应链动态监管,引入三码合一机制,建立新型数... 针对传统数码电子雷管监管存在的易被篡改和单点故障等问题,导致不合格数字电子雷管难以追溯,数字电子雷管事故责任难以认定,提出了一种基于联盟区块链的数字电子雷管安全监管系统。为实现供应链动态监管,引入三码合一机制,建立新型数字电子雷管监管模型,同时设计了一个基于区块链的数码电子雷管系统,该系统采用智能合约来实现高效溯源及保证安全。利用联盟区块链平台实现了所提出的模型,并通过实验验证了系统的高效性。 展开更多
关键词 区块链 智能合约 数码电子雷管监管 三码合一 监管模型 溯源 安全监管
在线阅读 下载PDF
GITG:面向Gitee平台的issue标题自动生成方法
19
作者 杨君 刘诗凡 +1 位作者 陈翔 崔展齐 《电子学报》 北大核心 2025年第5期1559-1570,共12页
在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有... 在开源软件和开源平台中,开发人员可以通过提交issue来记录所发现的软件错误或提出新功能需求.由于缺乏经验、专业水平有限等原因,用户可能无法对issue内容进行准确有效地总结,导致issue标题质量较低,进而降低issue的解决效率.此外,现有的issue标题自动生成方法主要面向GitHub等英文开源平台,当应用在Gitee等国产开源平台时表现不佳.同时,现有方法主要使用issue主体描述作为输入,忽略了issue中的代码片段等重要信息.为此,本文提出一种面向Gitee平台的issue标题自动生成方法GITG(Gitee Issue Title Generation),针对包含中文和英文文本的issue,使用构建的Gitee issue数据集对支持中文的预训练模型Chinese BART(Bidirectional and Auto-Regressive Transformers)进行微调,利用issue主体描述和代码片段的双模态信息来自动生成issue标题.为验证GITG的有效性,构建了包含18242个Gitee issue样本的数据集.实验结果表明,GITG在ROUGE-1、ROUGE-2和ROUGE-L指标上相较于iTAPE和iTiger分别至少提升了13.09%、10.18%和12.84%,在BLEU和METEOR指标上同样取得了性能提升.人工评价结果表明,GITG生成标题的平均得分在整体分数、流畅性、信息性和简洁性4个评价指标上相较iTAPE和iTiger分别至少提升了26.7%、20.8%、24.2%和20.0%. 展开更多
关键词 Gitee issue标题 主体描述 代码片段 预训练模型 软件维护
在线阅读 下载PDF
LLM赋能的Datalog代码翻译技术及增量程序分析框架
20
作者 王熙灶 沈天琪 +1 位作者 宾向荣 卜磊 《软件学报》 北大核心 2025年第6期2515-2534,共20页
Datalog是一种声明式逻辑编程语言,在不同领域得到了广泛应用.近年来,学术界和工业界对Datalog的兴趣高涨,设计并开发了多种Datalog引擎和相应方言.然而,多方言带来的一个问题是以一种Datalog方言实现的代码,一般而言不能在另一种方言... Datalog是一种声明式逻辑编程语言,在不同领域得到了广泛应用.近年来,学术界和工业界对Datalog的兴趣高涨,设计并开发了多种Datalog引擎和相应方言.然而,多方言带来的一个问题是以一种Datalog方言实现的代码,一般而言不能在另一种方言的引擎上执行.因此,当采用新Datalog引擎时,需要将现有Datalog代码翻译到新方言上.目前的Datalog代码翻译技术可分为人工重写代码和人工设计翻译规则两类,存在耗时长、大量重复劳动、缺乏灵活性和可拓展性等问题.提出了一种大语言模型(LLM)赋能的Datalog代码翻译技术,利用LLM强大的代码理解和生成能力,通过分治翻译策略、基于少样本提示和思维链提示的提示工程、基于检查-反馈-修复的迭代纠错机制,可以在不同Datalog方言之间实现高精度代码翻译,减轻开发人员重复开发翻译规则的工作量.基于此代码翻译技术,设计并实现了一种通用的基于Datalog的声明式增量程序分析框架.在不同Datalog方言对上评估了所提出的LLM赋能的Datalog代码翻译技术的性能,评估结果验证了所提代码翻译技术的有效性.对通用声明式增量程序分析框架进行了实验评估,验证了基于所提代码翻译技术的增量程序分析的加速效果. 展开更多
关键词 DATALOG 代码翻译 大语言模型 程序分析 增量分析框架
在线阅读 下载PDF
上一页 1 2 54 下一页 到第
使用帮助 返回顶部