软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件...软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向.展开更多
互联网目前已经发展为一个由实时视频和视频点播等内容分发服务主导的网络.传统IP网络对于视频分发类任务的支持存在组播的部署复杂且开销大,不能有效利用多路径获取内容、对移动性的支持差和难以同时满足可靠性以及低延时需求等问题....互联网目前已经发展为一个由实时视频和视频点播等内容分发服务主导的网络.传统IP网络对于视频分发类任务的支持存在组播的部署复杂且开销大,不能有效利用多路径获取内容、对移动性的支持差和难以同时满足可靠性以及低延时需求等问题.命名数据网络(named data networking,NDN)作为新型的下一代互联网体系结构,支持网络内缓存和多路径传输,而且由消费者驱动的传输模式使其天然地支持消费者端移动性.以上特点使NDN具有高效传输视频内容的潜力.首先介绍了视频传输和NDN的基础背景,然后阐述了一些利用NDN中优势实现视频传输的设计方案.通过对已有方案的总结与比较,最后指出了在NDN中传输视频所面临的挑战.展开更多
蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机...蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机制,DSEA(direct squeeze-and-excitation with global average pooling)和DSEM(direct squeeze-and-excitation with global max pooling),改进经典目标检测算法RetinaNet,并引入可变形卷积增强RetinaNet对蝴蝶形变的建模能力,实现野外环境下蝴蝶种类自动识别.以mAP(mean average precision)目标检测指标评价模型性能,通过实验结果可视化,分析影响模型性能的关键因素.实验结果显示,提出的改进RetinaNet对自然环境下的蝴蝶识别任务具有很不错的效果,特别是基于DSEM的RetinaNet;分布平衡的训练集可以提升提出模型的泛化性能;样本的结构相异性是影响模型性能的关键因素.展开更多
文摘软件系统在各行各业中发挥着不可忽视的作用,承载着大规模、高密度的数据,但软件系统中存在的种种缺陷一直以来困扰着系统的开发者,时刻威胁着系统数据要素的安全.自动代码修复(automated program repair,APR)技术旨在帮助开发者在软件系统的开发过程中自动地修复代码中存在的缺陷,节约软件系统开发和维护成本,提高软件系统中数据要素的保密性、可用性和完整性.随着大语言模型(large language model,LLM)技术的发展,涌现出许多能力强大的代码大语言模型,并且代码LLM在APR领域的应用中表现出了强大的修复能力,弥补了传统方案对于代码理解能力、补丁生成能力方面的不足,进一步提高了代码修复工具的水平.全面调研分析了近年APR相关的高水平论文,总结了APR领域的最新发展,系统归纳了完形填空模式和神经机器翻译模式2类基于LLM的APR技术,并从模型类型、模型规模、修复的缺陷类型、修复的编程语言和修复方案优缺点等角度进行全方位的对比与研讨.同时,对APR数据集和评价APR修复能力的指标进行了梳理和分析,并且对现有的实证研究展开深入探讨.最后,分析了当前APR领域存在的挑战及未来的研究方向.
文摘互联网目前已经发展为一个由实时视频和视频点播等内容分发服务主导的网络.传统IP网络对于视频分发类任务的支持存在组播的部署复杂且开销大,不能有效利用多路径获取内容、对移动性的支持差和难以同时满足可靠性以及低延时需求等问题.命名数据网络(named data networking,NDN)作为新型的下一代互联网体系结构,支持网络内缓存和多路径传输,而且由消费者驱动的传输模式使其天然地支持消费者端移动性.以上特点使NDN具有高效传输视频内容的潜力.首先介绍了视频传输和NDN的基础背景,然后阐述了一些利用NDN中优势实现视频传输的设计方案.通过对已有方案的总结与比较,最后指出了在NDN中传输视频所面临的挑战.
文摘蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机制,DSEA(direct squeeze-and-excitation with global average pooling)和DSEM(direct squeeze-and-excitation with global max pooling),改进经典目标检测算法RetinaNet,并引入可变形卷积增强RetinaNet对蝴蝶形变的建模能力,实现野外环境下蝴蝶种类自动识别.以mAP(mean average precision)目标检测指标评价模型性能,通过实验结果可视化,分析影响模型性能的关键因素.实验结果显示,提出的改进RetinaNet对自然环境下的蝴蝶识别任务具有很不错的效果,特别是基于DSEM的RetinaNet;分布平衡的训练集可以提升提出模型的泛化性能;样本的结构相异性是影响模型性能的关键因素.