期刊文献+
共找到874篇文章
< 1 2 44 >
每页显示 20 50 100
PrivCode:代码生成隐私保护策略
1
作者 杨琴 石林 +1 位作者 徐守坤 张华君 《计算机工程与设计》 北大核心 2024年第12期3546-3552,共7页
为解决用户使用Copilot等代码生成工具时面临的数据隐私泄露的问题,提出一种在线代码生成隐私保护策略PrivCode。考虑到当前机器学习隐私保护策略往往是基于白盒的前提设计的,难以适用不可知结构下的大型模型,将Copilot视为黑盒并引入... 为解决用户使用Copilot等代码生成工具时面临的数据隐私泄露的问题,提出一种在线代码生成隐私保护策略PrivCode。考虑到当前机器学习隐私保护策略往往是基于白盒的前提设计的,难以适用不可知结构下的大型模型,将Copilot视为黑盒并引入代理服务器,通过Mix-Net混淆多个用户的请求,打破用户和代码生成请求之间的映射关系。1-out-of-N不经意传输确保用户接收代码提示的安全。该策略满足定义的3条性质,实验测算结果表明,协议在实际场景中可用。该策略兼顾了用户的安全以及使用需求。 展开更多
关键词 隐私保护 代码生成 混淆网络 数据安全 不经意传输 双线性映射 匿名
在线阅读 下载PDF
基于节点中心性和大模型的漏洞检测数据增强方法
2
作者 张学旺 卢荟 谢昊飞 《信息网络安全》 北大核心 2025年第4期550-563,共14页
智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为... 智能系统源代码漏洞是影响其安全的重要因素,基于深度学习的源代码漏洞检测存在因数据集不平衡、规模小、质量低而引发的模型检测能力与泛化能力不足的问题。虽然采样技术和数据增强技术可改善一部分问题,但在真实数据集上效果不佳。为解决这些问题,文章提出基于节点中心性和大模型的漏洞检测数据增强方法DA_GLvul。该方法首先利用代码属性图将源代码抽象为图结构,并借助图节点中心性分析计算代码优先级值,将最大值对应节点的对应代码行作为关键代码语句,以实现在无已知漏洞语句信息的原始数据集的前提下定位关键代码语句。其次定义一个包含全面的变异规则的变异指令模板,填入原始样本与关键代码后输入至不同的大模型中以生成增强后的代码样本,最终使用增强代码样本与原始样本共同训练漏洞检测模型。实验结果表明,该方法生成的数据中有效样本占73.82%,较两个主流的基于图神经网络的漏洞检测模型在各项评估指标上均对原始结果有优化,其中F1值相比无增强方法平均提升168.85%,相比最优基线方法平均提升8.21%。 展开更多
关键词 漏洞检测 代码生成 数据增强 大语言模型
在线阅读 下载PDF
面向国产加速器的并行代码自动生成框架
3
作者 王玲 高娅 +1 位作者 吉青 卜景德 《计算机工程与设计》 北大核心 2025年第5期1438-1444,共7页
国产加速器复杂的硬件架构需要编写高度优化的代码才能充分发挥其卓越性能,由此带来繁重工作量和技术难度,为此提出一种面向国产加速器的并行代码自动生成框架。基础配置参数模块涵盖广泛的参数选项,实现代码自动调优,提高框架的通用性... 国产加速器复杂的硬件架构需要编写高度优化的代码才能充分发挥其卓越性能,由此带来繁重工作量和技术难度,为此提出一种面向国产加速器的并行代码自动生成框架。基础配置参数模块涵盖广泛的参数选项,实现代码自动调优,提高框架的通用性;预定义代码生成模块生成汇编代码并加入算法优化,扩展预定义代码的汇编指令适配目标架构支持的指令集使该框架适用于其它加速器;最优代码选择模块根据框架生成的多组代码执行情况智能地选择性能最佳的代码进行输出。实验结果表明,该框架能够生成常见数据类型的程序,使用优化组件组合后生成的基准测试程序的性能可达到国产加速器理论峰值的90.1%。 展开更多
关键词 国产加速器 自动调优 配置参数 预定义代码 汇编指令 最优代码选择 代码自动生成
在线阅读 下载PDF
论《民法典》中的身体权概念
4
作者 温世扬 刘昶 《河南师范大学学报(哲学社会科学版)》 北大核心 2025年第1期61-68,F0002,共9页
作为定义类法条,《民法典》第1003条将法律保护作为规范目标,彰显了身体权的防御属性,身体权概念应依该规定加以重构。身体权不具备支配权能,身体部分的“客体化”与“工具化”倾向既忽视了身体部分无法作为支配对象的事实,也混淆了权... 作为定义类法条,《民法典》第1003条将法律保护作为规范目标,彰显了身体权的防御属性,身体权概念应依该规定加以重构。身体权不具备支配权能,身体部分的“客体化”与“工具化”倾向既忽视了身体部分无法作为支配对象的事实,也混淆了权利主体与权利客体的关系,与人格保护“先验性”的本旨相悖。作为身体权的权能之一,“身体完整”意指物理完整,性骚扰等侵扰精神安宁的行为不同于侵害身体权指向的人格要素,无法适用相同的侵权构成要件。与身体相分离的部分,即便权利人具备事后与身体再度结合的意思,也仅构成法律上的物,通过承认物上精神利益的保护即可解决问题。“行动自由”意指物理活动的自由,以可视化的身体为载体,与其他物质型人格权相同,应根据损害结果确定客观层面的民事责任要件,无须结合《民法典》第998条进行利益衡量。非法搜查以限制自然人的人身自由为前提,故纳入行动自由的保护范畴具备合理性。 展开更多
关键词 民法典 身体权 一般人格权 物理完整性 物理活动自由
在线阅读 下载PDF
法典化时代行政法总则的规范功能与构建
5
作者 马怀德 《政法论丛》 北大核心 2025年第3期47-60,共14页
编纂行政基本法典,首先应制定行政法总则。行政法总则在行政基本法典中居于基础地位,发挥着统一基本概念、明确基本原则、建立基本制度的功能。围绕规范行政活动的逻辑主线,行政法总则的主要内容包括:基本规定,基本原则,公民、法人和其... 编纂行政基本法典,首先应制定行政法总则。行政法总则在行政基本法典中居于基础地位,发挥着统一基本概念、明确基本原则、建立基本制度的功能。围绕规范行政活动的逻辑主线,行政法总则的主要内容包括:基本规定,基本原则,公民、法人和其他组织的行政权利,行政主体,行政行为,行政责任。同时,应当处理好行政法总则与行政程序法的关系,行政法总则与提升行政效能的关系,优化行政法总则的立法技术,增强行政基本法典的体系性,确保以“提取公因式”为基本内容的行政法总则与行政基本法典各分则的有机衔接。 展开更多
关键词 行政法总则 行政基本法典 基本原则 行政程序法 提取公因式
在线阅读 下载PDF
基于扩展布尔函数的最优对称Z互补码集构造
6
作者 陈晓玉 张兆瑜 杜玉琼 《通信学报》 北大核心 2025年第6期209-217,共9页
针对宽带广义空间调制(GSM)系统训练序列数目受限的问题,研究了最优对称Z互补码集(SZCCS)和增强型交叉Z互补集(E-CZCS)的构造方法。提出了一种基于扩展布尔函数(EBF)的最优对称Z互补码集的构造方法,所得序列具有新的参数形式,具体为(q^(... 针对宽带广义空间调制(GSM)系统训练序列数目受限的问题,研究了最优对称Z互补码集(SZCCS)和增强型交叉Z互补集(E-CZCS)的构造方法。提出了一种基于扩展布尔函数(EBF)的最优对称Z互补码集的构造方法,所得序列具有新的参数形式,具体为(q^(k),q^(k+1),q^(m),q^(m))。同时,该序列也是具有大零相关区(ZCZ)的增强型交叉Z互补序列集,且序列的零相关区长度与序列长度比值为1。所得2种序列集参数灵活且不再局限于2的幂次形式。以所提增强型交叉Z互补集为基序列构造广义空间调制系统的训练矩阵,通过仿真实验验证了该增强型交叉Z互补集的信道估计能达到理论最小均方误差(MSE)。 展开更多
关键词 广义空间调制 扩展布尔函数 对称Z互补码 增强型交叉Z互补集
在线阅读 下载PDF
DeepCom-GCN:融入控制流结构信息的代码注释生成模型
7
作者 钟茂生 刘会珠 +1 位作者 匡江玲 严婷 《江西师范大学学报(自然科学版)》 北大核心 2025年第1期27-36,共10页
代码注释生成是指给定一个代码片段,通过模型自动生成一段关于代码片段功能的概括性自然语言描述.不同于自然语言,程序语言具有复杂语法和强结构性.部分研究工作只利用了源代码的序列信息或抽象语法树信息,未能充分利用源代码的逻辑结... 代码注释生成是指给定一个代码片段,通过模型自动生成一段关于代码片段功能的概括性自然语言描述.不同于自然语言,程序语言具有复杂语法和强结构性.部分研究工作只利用了源代码的序列信息或抽象语法树信息,未能充分利用源代码的逻辑结构信息.针对这一问题,该文提出一种融入程序控制流结构信息的代码注释生成方法,将源代码序列和结构信息作为单独的输入进行处理,允许模型学习代码的语义和结构.在2个公开数据集上进行验证,实验结果表明:和其他基线方法相比,DeepCom-GCN在BLEU-4、METEOR和ROUGE-L指标上的性能分别提升了2.79%、1.67%和1.21%,验证了该方法的有效性. 展开更多
关键词 代码注释生成 抽象语法树 控制流图 图卷积神经网络 软件工程 程序理解 自然语言处理
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
8
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
向量DSP的数组计算高效代码生成技术研究
9
作者 廖泽明 刘桂开 +1 位作者 胡勇华 谢安星 《计算机科学》 北大核心 2025年第S1期886-892,共7页
随着大规模集成电路技术不断发展,融合SIMD、VLIW等指令并行处理技术的向量DSP在高性能计算领域获得日益广泛的关注和应用。适配不同种类的算法函数库成了向量DSP的关键挑战之一。只有减少编程时重复性工作的投入,更加集中精力于基于向... 随着大规模集成电路技术不断发展,融合SIMD、VLIW等指令并行处理技术的向量DSP在高性能计算领域获得日益广泛的关注和应用。适配不同种类的算法函数库成了向量DSP的关键挑战之一。只有减少编程时重复性工作的投入,更加集中精力于基于向量DSP架构和硬件资源进行代码优化,才能有效提高应用开发效率。综合考虑向量DSP代码中的计算涉及的数据数量,提出基于模板的数组计算高效代码的自动生成方法,实现自动化的动态缓存分配,针对不连续的数据访存进行数据重排,并对标量指令进行优化,使生成的代码能够使用处理器的专用向量资源。实验结果表明,使用技术生成代码大幅度提高了获得相关函数代码的工作效率,并且生成的向量计算汇编代码平均性能达到手写汇编代码平均性能的75%左右,与标量汇编代码性能相比有平均8.7倍的加速比。 展开更多
关键词 高性能计算 代码生成 自动向量化 向量DSP
在线阅读 下载PDF
面向代码注释生成任务的注释质量评价研究
10
作者 赵衔麟 潘兴禄 +2 位作者 邹艳珍 刘陈晓 谢冰 《软件学报》 北大核心 2025年第8期3744-3768,共25页
代码注释生成是软件工程领域的重要研究任务.当前主流的注释生成方法训练深度学习模型以生成注释,依靠在开放的代码注释数据集上采用BLEU等指标来进行注释质量评价,主要反映生成注释与数据集中人工参考注释的相似性.但由于开放注释数据... 代码注释生成是软件工程领域的重要研究任务.当前主流的注释生成方法训练深度学习模型以生成注释,依靠在开放的代码注释数据集上采用BLEU等指标来进行注释质量评价,主要反映生成注释与数据集中人工参考注释的相似性.但由于开放注释数据集中人工参考注释的质量难以保障,其有效性受到越来越多质疑.因此,面向代码注释生成任务,亟需一种直观有效的代码注释质量评价方法,一方面改进开放注释数据集的质量,另一方面提升生成注释的评价效果.针对该问题,对现有量化的注释质量评价方法进行调研和分析,并将一套多维度注释质量评价指标用于对主流开放数据集、典型注释生成方法以及ChatGPT生成代码注释的质量评价,由此给出一些具有参考价值的研究发现:1)现有主流开放数据集中的代码注释质量俱有待提高,均存在不同程度的不准确、可读性差、过于简短、缺乏有用信息等问题;2)现有方法生成的注释普遍在词汇和语义上与代码更接近,缺乏代码高层意图等对开发者更有用的信息;3)生成注释的BLEU值较低,一个重要原因是数据集中大量的参考注释本身质量不佳,譬如与代码缺乏关联、自然性较差等,应过滤或改进此种参考注释;4)大语言模型ChatGPT生成的代码注释内容丰富但较为冗长,其质量评价需要根据开发者意图与具体场景进行针对性改进.基于这些发现,也对未来代码注释生成任务及注释质量评价研究给出若干建议. 展开更多
关键词 代码注释 注释质量 注释评价 注释数据集 注释生成
在线阅读 下载PDF
基于时间编码超表面的跌倒特征模拟与Wi-Fi感知数据集辅助构建
11
作者 陈少楠 顾家铭 +8 位作者 徐超 孙一淼 王思然 陈展野 刘硕 李会东 戴俊彦 何源 程强 《雷达学报(中英文)》 北大核心 2025年第4期950-960,共11页
随着Wi-Fi感知技术在智能健康监测领域的广泛应用,如何构建高质量的数据集成为亟待解决的关键问题。特别是在监测异常行为(如跌倒)时,传统方法依赖于人体的反复实验,这既存在安全隐患,又面临伦理困境。为应对这一挑战,该文提出了一种基... 随着Wi-Fi感知技术在智能健康监测领域的广泛应用,如何构建高质量的数据集成为亟待解决的关键问题。特别是在监测异常行为(如跌倒)时,传统方法依赖于人体的反复实验,这既存在安全隐患,又面临伦理困境。为应对这一挑战,该文提出了一种基于时间编码超表面的辅助数据样本采集方法。通过模拟人体的运动特征,时间编码超表面可以有效替代人体实验,用于辅助构建Wi-Fi感知数据集。为此该文设计了一款具备0~360°全相位调制能力的时间编码超表面验证了该方案的可行性。实验结果表明,超表面生成的信号能够较好地保留人体运动特征,有效补充真实样本,降低数据采集复杂度,并显著提升模型的监测准确性。该方法为Wi-Fi感知技术的数据采集提供了一种创新且可行的解决方案。 展开更多
关键词 Wi-Fi感知 时间编码超表面 运动特征生成 数据集构建 LeNet分类网络
在线阅读 下载PDF
编纂“聚焦建设美丽中国”的生态环境法典总则 被引量:3
12
作者 徐以祥 《中国地质大学学报(社会科学版)》 北大核心 2025年第1期31-41,共11页
《中共中央关于进一步全面深化改革推进中国式现代化的决定》提出了“聚焦建设美丽中国”的生态文明体制改革的总目标。这一总目标应当在生态环境法典总则中进行贯彻和落实。生态环境法典的总则作为法典的“基础性架构”,是对法典基本... 《中共中央关于进一步全面深化改革推进中国式现代化的决定》提出了“聚焦建设美丽中国”的生态文明体制改革的总目标。这一总目标应当在生态环境法典总则中进行贯彻和落实。生态环境法典的总则作为法典的“基础性架构”,是对法典基本性、共通性和综合性问题的规范。总则编应当以创新的改革精神,通过基本概念的创新界定、基本原则的创新设置、生态环境保护基本法律制度体系的构建、体例结构的科学安排的具体路径,回应“聚焦建设美丽中国”对生态环境法典总则编的需求。 展开更多
关键词 生态环境法典 总则 美丽中国 基本概念 基本原则
在线阅读 下载PDF
基于代码生成的细粒度情感分析方法
13
作者 帅健 王中卿 陈嘉沥 《计算机应用》 北大核心 2025年第6期1827-1832,共6页
细粒度情感分析(ABSA)任务越来越受到人们的关注。针对目前主流的ABSA方法无法充分利用语义关系且无法充分学习各情感元素之间联系的局限,提出一种基于代码生成的ABSA方法。首先,对应各情感元素与编程语言(PL);其次,按照对应原则将实验... 细粒度情感分析(ABSA)任务越来越受到人们的关注。针对目前主流的ABSA方法无法充分利用语义关系且无法充分学习各情感元素之间联系的局限,提出一种基于代码生成的ABSA方法。首先,对应各情感元素与编程语言(PL);其次,按照对应原则将实验数据集构造成代码生成任务的数据样式,代码样式可以更好地表达各情感元素之间的联系;最后,利用当前大语言模型(LLM)的强大性能及代码生成方法在事件抽取任务上的良好表现得到更准确的结果。为了验证所提方法的有效性,使用Paraphrase、Seq2Path和意见树生成(OTG)方法进行对比实验。实验结果表明,所提方法在ABSA任务中的餐厅数据集上F1分数比OTG方法高2.82个百分点,具有更好的效果。 展开更多
关键词 细粒度情感分析 结构化生成 代码生成 预训练生成模型 四重提取
在线阅读 下载PDF
特征交叉融合和大模型修复的代码生成方法
14
作者 李文静 顾乃杰 +1 位作者 杨戴原 王聪 《小型微型计算机系统》 北大核心 2025年第5期1025-1031,共7页
代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和... 代码生成任务至今仍有很大探索空间,其挑战主要包括两个方面:首先,它需要理解和转换多种抽象表示之间的语义和语法规则,生成准确的候选代码片段;其次,从庞大的候选代码片段中搜索并合成正确的程序,需要同时考虑搜索效率、上下文关系和语义的一致性.对此,本文提出基于特征金字塔交叉融合的翻译模型和基于代码大模型修复的方法.在代码翻译阶段,引入特征金字塔网络,利用交叉融合方法提取不同尺度的特征与全局信息结合,提高候选代码片段的正确性.在搜索合成阶段,使用代码大模型修复错误程序.实验表明,当设置修复候选程序数n_(r)=1时,与目前最好的结果相比,本文方法最高提升6.1%的通过率.在n_(r)=10时,最高提升9.0%的通过率,平均提升6.0%的通过率. 展开更多
关键词 代码生成 程序修复 大语言模型 特征金字塔
在线阅读 下载PDF
基于大语言模型的自动代码修复综述
15
作者 许鹏宇 况博裕 +1 位作者 苏铓 付安民 《计算机研究与发展》 北大核心 2025年第8期2040-2057,共18页
软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件... 软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向. 展开更多
关键词 自动代码修复 大语言模型 代码大语言模型 软件缺陷 补丁生成
在线阅读 下载PDF
《国际初级卫生保健分类第3版》编码框架与使用流程简介
16
作者 姜岳 李杰 顾湲 《中国全科医学》 北大核心 2025年第29期I0001-I0004,共4页
在全球老龄化加速、慢性病共病负担激增的背景下,全科医疗面临健康数据碎片化、医防协同低效、资源错配三大核心挑战。世界家庭医生组织(WONCA)2020年12月发布的《国际初级卫生保健分类第3版》(ICPC-3)延续了对就诊原因、健康问题和诊... 在全球老龄化加速、慢性病共病负担激增的背景下,全科医疗面临健康数据碎片化、医防协同低效、资源错配三大核心挑战。世界家庭医生组织(WONCA)2020年12月发布的《国际初级卫生保健分类第3版》(ICPC-3)延续了对就诊原因、健康问题和诊疗流程进行系统性分类编码的优势,增加了功能相关等章节,并重新分类和提供编码框架。相比于其他疾病分类系统,ICPC-3更加注重以患者为中心,囊括初级卫生保健/基层医疗卫生工作中面临的复杂症状、未分化疾病和非疾病状况,突出了基层医疗的服务价值。ICPC-3特有的双轴分类法提升了其系统性和合理性,可与其他疾病分类方法互补,因而在世界范围内广泛使用。本文系统介绍了ICPC-3的编码框架和使用流程,以期为ICPC-3在我国推广应用提供参考。 展开更多
关键词 国际初级卫生保健分类第3版 疾病分类 国际疾病分类法 编码框架 使用流程 全科医学
在线阅读 下载PDF
面向测试用例生成的大模型高效微调方法 被引量:1
17
作者 曹鹏 温广琪 +3 位作者 杨金柱 陈刚 刘歆一 季学纯 《计算机应用》 北大核心 2025年第3期725-731,共7页
基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这... 基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这2个挑战。为了解决这些问题,提出将编码风格和功能风格同步迁移微调的思想,并开发一种高效的LLM微调训练方法用于单元测试用例生成。首先,利用广泛使用的指令数据集对LLM进行指令对齐,并按任务类型对指令集分类;同时,提取并存储具有任务特征的权重增量;其次,设计一个自适应风格提取模块,该模块包含抗噪声干扰学习和编码风格回溯学习,以应对不同的代码编写风格;最后,在目标域分别对功能风格增量和编码风格增量进行联合训练,以实现在目标域低资源情况下的高效适配和微调。在SF110 Corpus of Classes数据集上的测试用例生成实验结果表明,所提方法的结果均优于对比方法,与主流代码生成LLM Codex、Code Llama和DeepSeek-Coder相比,所提方法的编译率分别提高0.8%、43.5%和33.8%、分支覆盖率分别提高3.1%、1.0%和17.2%;行覆盖率分别提高4.1%、6.5%和15.5%,验证了所提方法在代码生成任务上的优越性。 展开更多
关键词 单元测试 代码生成 大语言模型 权重增量学习 微调学习
在线阅读 下载PDF
面向RTC的微秒级采样实时控制系统设计与实现
18
作者 周杏伟 胡文山 +1 位作者 刘国平 雷忠诚 《电子测量技术》 北大核心 2025年第5期1-12,共12页
随着现代控制系统对高实时性和高精度要求的不断提升,微秒级采样的实时控制技术已成为研究热点。针对现有技术高度依赖国外平台的问题,本研究基于STM32微控制器,设计并实现了一种具有自主知识产权的微秒级采样实时控制系统,重点解决了... 随着现代控制系统对高实时性和高精度要求的不断提升,微秒级采样的实时控制技术已成为研究热点。针对现有技术高度依赖国外平台的问题,本研究基于STM32微控制器,设计并实现了一种具有自主知识产权的微秒级采样实时控制系统,重点解决了控制任务的实时性、通信任务的高效性以及自动代码生成的复杂性问题。系统采用FreeRTOS实时操作系统进行任务调度,通过硬件定时器实现控制任务的高优先级执行,同时引入LwIP协议以实现低延迟网络通信,支持实验数据的高效上传与指令接收。此外,本研究提出了一种基于图形化框图的控制算法解析与自动代码生成方法,通过服务器对用户前端搭建的控制框图进行解析,并生成适配STM32硬件的高效控制代码。以永磁同步电机的场向量控制为案例的实验验证表明,所设计系统在微秒级采样下具备优异的实时性和控制性能,有效突破了国外技术封锁对相关领域发展的限制,显著提升了自主控制系统的研发能力。该成果为解决关键技术“卡脖子”问题提供了一种可行的技术方案,并展现出广泛的应用前景与推广价值。 展开更多
关键词 STM32 微秒级控制 实时操作系统 自动代码生成 永磁同步电机 场向量控制
在线阅读 下载PDF
代码自动生成工具Github Copilot生成代码质量的分析
19
作者 王东煜 莫然 +1 位作者 詹文静 蒋颖婕 《计算机科学》 北大核心 2025年第7期37-49,共13页
Github Copilot是Github和OpenAI推出的一款基于生成式AI的代码自动生成工具,它的核心功能之一,是根据自然语言的描述生成对应的实现代码。这一AI在编程领域的拓展,近年来引起了热议与重视。现阶段人们的关注点主要在AI编程与人类编程... Github Copilot是Github和OpenAI推出的一款基于生成式AI的代码自动生成工具,它的核心功能之一,是根据自然语言的描述生成对应的实现代码。这一AI在编程领域的拓展,近年来引起了热议与重视。现阶段人们的关注点主要在AI编程与人类编程的对比,比如AI程序员与人类程序员的编程效率对比,以及两者所编写的代码性能对比。然而,目前关于Copilot代码本身特征的研究较少,特别是代码质量问题,例如AI生成代码有哪些缺陷,这些缺陷是否会导致程序错误,以及代码是否易于理解等。代码质量对软件开发至关重要,分析AI生成代码的代码质量有助于更好地使用和改进此类代码生成工具。本文使用工具从LeetCode中提取所有的开源问题(共2033道)作为数据样本对Copilot进行测试,分别生成3种语言(Java,JavaScript,Python)的代码建议,提交并记录代码建议的执行结果。使用SonarQube静态分析这些代码建议文件,结合代码建议的执行结果,从可靠性、可维护性、复杂性3个维度分析Copilot的代码质量特征。结果发现:1)Copilot生成代码较为可靠,对于Java,JavaScript和Python 3种语言,分别收集了7,5,9种Bug类型,且3种语言涉及Bug的代码建议比例不超过3%,但涉及Bug的代码建议50%以上未通过测试;2)Copilot代码建议可维护性较差,对于Java,JavaScript和Python,分别收集了47,23,20种代码异味类类型,3种语言涉及代码建议的比例均超过40%,涉及代码异味的代码建议50%以上未通过测试用例;3)Copilot代码易于理解,多数代码建议的复杂度未超过阈值,且复杂度异常的代码建议比例不超过6%。最后,结合实验结果,提出了维护Copilot的可行建议,并探讨了此类工具未来可能的研究方向。 展开更多
关键词 自动代码生成 代码质量 代码可靠性 代码可维护性 代码复杂度
在线阅读 下载PDF
基于样式权重调制技术的少样本火焰图像增强
20
作者 李明杰 胡羿 易正明 《计算机科学》 北大核心 2025年第S1期491-497,共7页
少样本图像生成技术仅依靠稀缺有限的目标样本,就能够生成以假乱真和多样化的图像,这可以为下游的目标识别任务构建可靠的数据集。这项工作提出了一种基于权重调制的少样本生成模型,在仅输入3张目标图像的条件下,便能获得与目标样本具... 少样本图像生成技术仅依靠稀缺有限的目标样本,就能够生成以假乱真和多样化的图像,这可以为下游的目标识别任务构建可靠的数据集。这项工作提出了一种基于权重调制的少样本生成模型,在仅输入3张目标图像的条件下,便能获得与目标样本具有相同内容且特征呈现多样化的图像。具体来说,对生成器中的编码器和解码器经过了精心设计,采用了梯度流更好的C2F结构来搭建金字塔型网络构架,最大程度地还原图像在不同层次的原始特征。采用了基于注意力机制的特征融合方法,引入了特征样式潜码来控制特征融合质量。其中,样式潜码使用了权重缩放的策略,有效地消除了生成伪影,使生成图像更加逼真。同时,还使用了优化的特征长度探测算法来对源域和目标域的重要信息进行接近度探测。这一技巧能够使模型在源域中通过预训练得到的先验信息更好地迁移到目标域中。针对火焰图像样本的生成任务,给出了定性和定量的对比结果,所提出的模型能够切实提高yolov8算法下的火焰目标识别性能,实质性地提升了数据增强的效果。 展开更多
关键词 少样本生成 火焰数据集 特征融合模块 迁移学习 预训练 权重调制 目标识别 样式潜码
在线阅读 下载PDF
上一页 1 2 44 下一页 到第
使用帮助 返回顶部