期刊文献+
共找到398篇文章
< 1 2 20 >
每页显示 20 50 100
开源软件库生态治理技术研究综述:二十年进展 被引量:3
1
作者 王莹 伍盈欣 +4 位作者 高天 陈子莺 许畅 于海 张成志 《软件学报》 EI CSCD 北大核心 2024年第2期629-674,共46页
在“人-机-物”三元融合、泛在计算的时代蓝海下,“开放多变”“需求多样”和“场景复杂”的软件部署和运行环境对开源软件库生态的治理技术提出了更多需求和更高期望.为进一步推动构建可信软件供应链生态,围绕泛在计算模式、打造自主... 在“人-机-物”三元融合、泛在计算的时代蓝海下,“开放多变”“需求多样”和“场景复杂”的软件部署和运行环境对开源软件库生态的治理技术提出了更多需求和更高期望.为进一步推动构建可信软件供应链生态,围绕泛在计算模式、打造自主可控的技术体系,聚焦于开源软件库管理生态,收集近20多年来(2001–2023)发表于软件工程领域较高影响力的学术期刊和会议的348篇论文,对开源软件库生态治理技术的研究工作进行梳理.讨论开源软件库生态的建模与分析、演化与维护、质量保证和管理等方面的工作,总结研究现状、问题、挑战与趋势. 展开更多
关键词 开源软件供应链 开源治理 软件库生态系统
在线阅读 下载PDF
智能化软件新技术专刊前言 被引量:3
2
作者 申富饶 李戈 《软件学报》 EI CSCD 北大核心 2019年第5期1203-1205,共3页
智能化软件新技术是使用人工智能与机器学习技术辅助软件工程的新兴技术.近年来以深度学习为代表的人工智能技术飞速发展,在计算机科学的各个领域中都开始发挥重要作用.随着软件工程领域对数据积累的重视,人工智能技术在软件开发过程中... 智能化软件新技术是使用人工智能与机器学习技术辅助软件工程的新兴技术.近年来以深度学习为代表的人工智能技术飞速发展,在计算机科学的各个领域中都开始发挥重要作用.随着软件工程领域对数据积累的重视,人工智能技术在软件开发过程中的应用也逐渐增加.利用人工智能技术辅助软件工程中的代码编写、纠错、测试等具体工作,可以大量节省人工劳动,提升软件开发效率.将人工智能技术更好地与软件工程的各个环节相结合,进一步提升软件开发过程的自动化、智能化程度,是智能化软件新技术研究的主要关注点. 展开更多
关键词 软件缺陷预测 频繁模式挖掘 代码坏味 测试预言 人工智能技术 软件演化 内存泄漏 测试用例 持续集成
在线阅读 下载PDF
神经形态计算:从脉冲神经网络到边缘部署
3
作者 俞诗航 易梦军 +2 位作者 吴洲 申富饶 赵健 《软件学报》 北大核心 2025年第4期1758-1795,共38页
受生物神经系统启发,神经形态计算的概念于20世纪80年代被提出,旨在模拟生物大脑的结构和功能,实现更高效、更具生物合理性的计算方式.作为神经形态计算的代表模型,脉冲神经网络(SNN)因其脉冲稀疏性,事件驱动性、生物可解释性以及硬件... 受生物神经系统启发,神经形态计算的概念于20世纪80年代被提出,旨在模拟生物大脑的结构和功能,实现更高效、更具生物合理性的计算方式.作为神经形态计算的代表模型,脉冲神经网络(SNN)因其脉冲稀疏性,事件驱动性、生物可解释性以及硬件契合性等优势,在资源严格受限的边缘智能任务中得到了广泛应用.针对脉冲神经网络的边缘部署情况进行梳理和汇总,首先从脉冲神经网络模型自身的原理出发,论述脉冲神经网络的高能效计算方式以及巨大的边缘部署潜力.然后介绍当下常见的脉冲神经网络硬件实现工具链,并重点对脉冲神经网络在各类神经形态硬件平台的部署情况做详细的整理与分析.最后,考虑到硬件故障行为已发展为当下研究中不可避免的问题,对脉冲神经网络边缘部署时的故障与容错研究进行概述.从软件模型原理到硬件平台实现,全面系统地介绍神经形态计算的最新进展,分析脉冲神经网络边缘部署时遇到的困难与挑战,并针对这些挑战给出未来可能的解决方向. 展开更多
关键词 神经网络 脉冲神经网络 神经形态计算 边缘智能
在线阅读 下载PDF
结合主动学习和半监督学习的软件可追踪性恢复框架
4
作者 董黎明 张贺 +1 位作者 孟庆龙 匡宏宇 《软件学报》 北大核心 2025年第5期1924-1948,共25页
软件可追踪性被认为是软件开发过程可信的一个重要因素,确保对软件开发过程的可见性并进行全面追踪,从而提高软件的可信度和可靠性.近年来,自动化的软件可追踪性恢复方法取得了显著进展,但在企业项目中的应用仍面临挑战.通过调研研究和... 软件可追踪性被认为是软件开发过程可信的一个重要因素,确保对软件开发过程的可见性并进行全面追踪,从而提高软件的可信度和可靠性.近年来,自动化的软件可追踪性恢复方法取得了显著进展,但在企业项目中的应用仍面临挑战.通过调研研究和实验案例分析,发现工业界场景中可追踪性模型表现不佳的3个关键挑战:原始数据低质量、样本稀疏性和不平衡性,并提出一种结合主动学习和半监督学习的软件可追踪性恢复框架STRACE(AL+SSL).该框架通过选择有价值的标注样本和生成高质量的伪标签样本,有效利用未标注的样本,克服数据低质量和稀疏性挑战.实验基于10个样本规模在几万至近百万个issue-commit跟踪对实例的企业项目,进行多组对比实验,结果表明该框架在当前真实企业项目软件可追踪性恢复任务上具有有效性.其中消融实验结果表明STRACE(AL+SSL)中主动学习模块所选择的无标签样本在可追踪性恢复任务中发挥了更为重要的作用.此外,还验证各个模块最佳的样本选择策略组合,包括调整后的半监督类平衡自训练样本选择策略CBST-Adjust和低成本高效率的主动学习子模块互信息SMI_Flqmi样本选择策略. 展开更多
关键词 软件可追踪性 主动学习 半监督学习
在线阅读 下载PDF
云计算环境中基于朴素贝叶斯算法的负载均衡技术 被引量:14
5
作者 蔡嵩 张建明 +1 位作者 陈继明 潘金贵 《计算机应用》 CSCD 北大核心 2014年第2期360-364,共5页
针对云计算环境中任务调度算法复杂度高、任务分配不够合理等问题,提出一种基于朴素贝叶斯分类的负载均衡技术。该技术利用云计算环境的心跳机制全面地收集各节点负载信息,并采用朴素贝叶斯算法对各节点负载状态进行分类;然后,根据节点... 针对云计算环境中任务调度算法复杂度高、任务分配不够合理等问题,提出一种基于朴素贝叶斯分类的负载均衡技术。该技术利用云计算环境的心跳机制全面地收集各节点负载信息,并采用朴素贝叶斯算法对各节点负载状态进行分类;然后,根据节点状态分类结果,实现任务和资源分配的合理调度。实验结果表明,基于朴素贝叶斯算法的负载均衡技术能提高任务的分配效率,避免任务在各节点间频繁迁移,快速有效地实现云计算环境中各节点间的负载均衡。 展开更多
关键词 云计算环境 负载均衡 朴素贝叶斯 负载信息 任务调度
在线阅读 下载PDF
面向持续软件工程的微服务架构技术专题前言 被引量:8
6
作者 张贺 王忠杰 +1 位作者 陈连平 彭鑫 《软件学报》 EI CSCD 北大核心 2021年第5期1229-1230,共2页
随着软件互联网化和服务化的高度发展,持续性(continuity)成为现代软件系统的基本特性之一,覆盖从商业策划、软件开发、运维、演化的所有环节,使得软件系统在持续稳定提供功能和服务的同时,软件系统的边界和内部结构始终处于不断变化、... 随着软件互联网化和服务化的高度发展,持续性(continuity)成为现代软件系统的基本特性之一,覆盖从商业策划、软件开发、运维、演化的所有环节,使得软件系统在持续稳定提供功能和服务的同时,软件系统的边界和内部结构始终处于不断变化、持续更新和适应之中,持续软件工程(continuous software engineering)由此被提出并迅速得到广泛的实践应用.微服务(microservice)架构作为一种全新的去中心化分布式架构,在软件架构层面成为适应持续软件工程发展的必然趋势,而领域驱动设计(domain-driven design,简称DDD)伴随着微服务架构的兴起也重新获得了业界的广泛关注,二者共同关注服务自顶向下的合理设计和分解.微服务架构与领域驱动设计共同支持实现现代软件系统的持续性特征.为了反映中国学者和实践者在求解以微服务架构为代表的持续软件工程所面临的架构难题和挑战过程中取得的理论、技术或实验方面的创新性、突破性的高水平研究成果,特设立此专题. 展开更多
关键词 微服务架构 领域驱动设计 软件工程 软件系统 软件架构 分布式架构 互联网化 去中心化
在线阅读 下载PDF
嵌入式系统软件设计方法与技术专刊前言 被引量:3
7
作者 李宣东 于戈 《软件学报》 EI CSCD 北大核心 2014年第2期177-178,共2页
随着计算机硬件设备性能的迅速提高以及嵌入式系统应用领域的不断拓宽,嵌入式系统软件的规模和复杂性急剧增加,软件已经成为嵌入式系统的主要使能部件.近年来,物联网、移动计算、信息物理融合系统等嵌入式系统领域的相关热点不断出... 随着计算机硬件设备性能的迅速提高以及嵌入式系统应用领域的不断拓宽,嵌入式系统软件的规模和复杂性急剧增加,软件已经成为嵌入式系统的主要使能部件.近年来,物联网、移动计算、信息物理融合系统等嵌入式系统领域的相关热点不断出现,对嵌入式系统软件设计方法和技术提出了一系列新的挑战.本专刊收录的16篇论文反映了近年来我国学者在嵌入式系统软件设计方法和技术领域的部分研究成果. 展开更多
关键词 嵌入式系统软件 软件设计方法 技术 硬件设备 移动计算 融合系统 研究成果 计算机
在线阅读 下载PDF
众包软件测试技术研究进展 被引量:24
8
作者 章晓芳 冯洋 +2 位作者 刘頔 陈振宇 徐宝文 《软件学报》 EI CSCD 北大核心 2018年第1期69-88,共20页
众包测试是一种新兴的软件测试方式,得到了学术界和工业界的广泛关注.系统地总结了近年来众包软件测试研究的学术文献以及工业界实践进展:首先,从学术文献涉及的研究主题演变、涵盖的软件测试问题和众包测试流程、采用的实验对象及测试... 众包测试是一种新兴的软件测试方式,得到了学术界和工业界的广泛关注.系统地总结了近年来众包软件测试研究的学术文献以及工业界实践进展:首先,从学术文献涉及的研究主题演变、涵盖的软件测试问题和众包测试流程、采用的实验对象及测试人员规模等多个角度对相关文献中提出的技术和方法进行了汇总;然后,从测试领域、测试对象、工人召集方式、绩效考核方式等方面分析对比了当前应用最广泛的20个众包测试商业平台;最后,探讨了众包软件测试的未来发展趋势、机遇和挑战. 展开更多
关键词 软件工程 软件测试 众包 众包测试 众包平台
在线阅读 下载PDF
AI软件系统工程化技术与规范专题前言
9
作者 张贺 夏鑫 +2 位作者 蒋振鸣 祝立明 李宣东 《软件学报》 EI CSCD 北大核心 2023年第9期3939-3940,共2页
近年来,人工智能产业的热度逐步提升,市场规模持续扩大,全球各行各业的组织机构都正在或试图通过人工智能对原有的产品和服务赋予新的能力.最先进的人工智能系统正在迅速从实验室环境迁移到工业环境,并主要以软件为承载形式渗透到社会... 近年来,人工智能产业的热度逐步提升,市场规模持续扩大,全球各行各业的组织机构都正在或试图通过人工智能对原有的产品和服务赋予新的能力.最先进的人工智能系统正在迅速从实验室环境迁移到工业环境,并主要以软件为承载形式渗透到社会应用的方方面面.然而开发、测试和运维工业化的人工智能软件系统会遇到一些不同于传统软件系统的工程问题.例如,在基于人工智能的系统中,规则和系统行为是从训练数据中推断出来的,而不是被开发者编写的程序代码所定义;人工智能系统的需求具有较大的不明确性;人工智能系统的演化过程中需要关注不断变化的数据集和相关的基础设施;人工智能系统开发和运维需要数据科学家和软件工程师的跨专业协作;人工智能系统的开发面临伦理、道德和法律的约束,且这些约束的更新速度正受到飞速发展的人工智能技术和产业的挑战. 展开更多
关键词 人工智能系统 软件系统 人工智能技术 软件工程师 更新速度 训练数据 专业协作 基础设施
在线阅读 下载PDF
软件缺陷预测模型间的比较实验:问题、进展与挑战 被引量:8
10
作者 刘旭同 郭肇强 +3 位作者 刘释然 张鹏 卢红敏 周毓明 《软件学报》 EI CSCD 北大核心 2023年第2期582-624,共43页
近年来,研究者提出了大量的软件缺陷预测模型,新模型往往通过与过往模型进行比较实验来表明其有效性.然而,研究者在设计新旧模型间的比较实验时并没有达成共识,不同的工作往往采用不完全一致的比较实验设置,这可能致使在对比模型时得到... 近年来,研究者提出了大量的软件缺陷预测模型,新模型往往通过与过往模型进行比较实验来表明其有效性.然而,研究者在设计新旧模型间的比较实验时并没有达成共识,不同的工作往往采用不完全一致的比较实验设置,这可能致使在对比模型时得到误导性结论,最终错失提升缺陷预测能力的机会.对近年来国内外学者所做的缺陷预测模型间的比较实验进行系统性的总结:首先,阐述缺陷预测模型间的比较实验的研究问题;然后,分别从缺陷数据集、数据集划分、基线模型、性能指标、分类阈值这5个方面对现有的比较实验进行总结;最后,指出目前在进行缺陷预测模型间比较实验时面临的挑战,并给出建议的研究方向. 展开更多
关键词 缺陷预测 比较实验 软件维护 质量保障
在线阅读 下载PDF
环境感知自适应软件的运行时输入验证技术综述 被引量:3
11
作者 王慧妍 徐经纬 许畅 《计算机科学》 CSCD 北大核心 2020年第6期1-7,共7页
随着软件智能化与大数据时代的到来,环境感知自适应软件作为智能软件中的代表趋于流行。环境感知自适应软件有两大特征:1)“环境感知”,即能够通过传感器等设备感知周围环境并采集环境数据;2)“自适应”,即能够基于采集的环境数据自适... 随着软件智能化与大数据时代的到来,环境感知自适应软件作为智能软件中的代表趋于流行。环境感知自适应软件有两大特征:1)“环境感知”,即能够通过传感器等设备感知周围环境并采集环境数据;2)“自适应”,即能够基于采集的环境数据自适应地进行软件决策。这类软件的主要表现特征为在运行时刻能够动态感知周边环境的变化并进行交互,从而做出决策。此外,随着大数据时代的到来,越来越多的人工智能模型被使用并被期望能够帮助环境感知自适应软件更好地实现自适应机制,使其能够更加智能地通过与环境的感知交互来做决策。一方面,由于运行时环境复杂,该类软件的运行时环境情况往往难以估计和预料,使得其在实际部署后运行在复杂环境中的可靠性很难通过事先测试得到有效保障,这也成为了这类软件在运行时得到有效质量保障所面临的一大挑战。而另一方面,此类软件对人工智能模型的应用与人工智能模型基于统计的核心特征,使得其在运行时刻选择应用人工智能模型来进行辅助决策也存在一定的局限性,这更加剧了保障此类软件在运行时刻质量的难度。因此,如何能够在此类软件的实际部署运行时更好地保障其运行质量与可靠性成为了当今智能软件工程的一个广泛研究的问题。与此同时,输入验证被认为是保障运行时刻软件质量的一大常用手段,它通过对软件输入进行有效识别,来避免不合适的输入在运行时刻被输入软件而影响软件行为。基于此,文中对环境感知自适应软件的运行时输入验证技术进行总结与综述,基于此类软件的两大特征,从“环境感知”方面的环境数据感知模块的输入验证及“自适应”方面决策模块的输入验证两个方面,分别对已有技术进行调研与综述。同时,文中还探讨了对环境感知自适应软件的运行时输入验证技术问题中的主要性能挑战,为实现更加高效的输入验证做框架性总结。最后,还对人工智能技术广泛应用于环境感知自适应软件的现状带来的对此类软件额外决策的挑战做了讨论与分析,已有工作对此挑战的探索也让此类软件进一步成熟,并为其未来集成决策逻辑演化从而达到软件自成长的理想提供支撑。通过对相关技术的综述,试图为相关领域的科研工作者勾画一个对环境感知自适应软件在运行时刻较清晰的质量保障框架,为未来的相关研究提供可能的方向与角度。 展开更多
关键词 环境感知自适应软件 运行时质量保障 输入验证 软件可靠性 约束检查
在线阅读 下载PDF
融合信息检索和深度模型特征的软件缺陷定位方法 被引量:3
12
作者 申宗汶 牛菲菲 +4 位作者 李传艺 陈翔 李奇 葛季栋 骆斌 《软件学报》 EI CSCD 北大核心 2024年第7期3245-3264,共20页
构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利... 构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利用深度模型特征的缺陷定位方法也取得了一定效果.然而,由于深度模型训练的时间成本和耗费资源相对较高,现有基于深度模型的缺陷定位研究方法存在实验搜索空间和真实情况不符的情况.这些研究方法在测试时并没有将项目下的所有代码作为搜索空间,而仅仅搜索了与已有缺陷相关的代码,例如DNNLOC方法、DeepLocator方法、DreamLoc方法.这种做法和现实中程序员进行缺陷定位的搜索场景是不一致的.致力于模拟缺陷定位的真实场景,提出了一种融合信息检索和深度模型特征的TosLoc方法进行缺陷定位.TosLoc方法首先通过信息检索的方式检索真实项目的所有源代码,确保已有特征的充分利用;再利用深度模型挖掘源代码和缺陷报告的语义,获取最终定位结果.通过两阶段的检索,TosLoc方法能够对单个项目的所有代码实现快速缺陷定位.通过在4个常用的真实Java项目上进行实验,TosLoc方法能够在检索速度和准确性上超越已有基准方法.与最优基准方法DreamLoc相比,TosLoc方法在消耗DreamLoc方法35%的检索时间下,平均MRR值比DreamLoc方法提高了2.5%,平均MAP值提高了6.0%. 展开更多
关键词 缺陷定位 缺陷报告 信息检索 深度学习 检索空间
在线阅读 下载PDF
基于混合图表示的软件变更预测方法 被引量:1
13
作者 杨馨悦 刘安 +2 位作者 赵雷 陈林 章晓芳 《软件学报》 EI CSCD 北大核心 2024年第8期3824-3842,共19页
软件变更预测旨在识别出具有变更倾向的模块,可以帮助软件管理者和开发人员有效地分配资源,降低维护开销.从代码中提取有效的特征在构建准确的预测模型中起着重要作用.近年来,研究人员从利用传统的手工特征进行预测转向具有强大表示能... 软件变更预测旨在识别出具有变更倾向的模块,可以帮助软件管理者和开发人员有效地分配资源,降低维护开销.从代码中提取有效的特征在构建准确的预测模型中起着重要作用.近年来,研究人员从利用传统的手工特征进行预测转向具有强大表示能力的语义特征,他们从抽象语法树(abstract syntax tree,AST)的节点序列中提取语义特征构建模型.但已有研究忽略了AST的结构信息以及代码中丰富的语义信息,如何提取代码的语义特征仍然是一个具有挑战性的问题.为此,提出一种基于混合图表示的变更预测方法.该模型首先结合AST、控制流图(control flow graph,CFG)、数据流图(data flow graph,DFG)等结构信息构建代码的程序图表示,接着利用图神经网络学习出程序图的语义特征,根据该特征预测变更倾向性.所提模型能够融合各种语义信息以更好地表征代码.在多组变更数据集上开展与最新变更预测方法的对比实验,验证了所提方法的有效性. 展开更多
关键词 软件变更预测 图神经网络 AST 控制流图 数据流图
在线阅读 下载PDF
Patch-Locator:一种基于排序学习的开源软件漏洞补丁定位方法
14
作者 杨云帆 薄莉莉 +2 位作者 魏颖 吴潇雪 孙小兵 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2551-2560,共10页
日益增多的开源软件漏洞对软件安全带来了巨大的风险,补丁在应对这一风险的过程中扮演了非常重要的角色.不幸的是,尽管大部分漏洞的补丁在被披露前就已经开发完毕,但仅有部分补丁会随漏洞同步公开.现有的研究发现了漏洞与其补丁之间存... 日益增多的开源软件漏洞对软件安全带来了巨大的风险,补丁在应对这一风险的过程中扮演了非常重要的角色.不幸的是,尽管大部分漏洞的补丁在被披露前就已经开发完毕,但仅有部分补丁会随漏洞同步公开.现有的研究发现了漏洞与其补丁之间存在一定的相关性,并基于这些相关性特征对提交进行了排序,以定位漏洞的补丁,但仍旧存在漏洞数据部分缺失、定位准确率不佳等问题.本文提出了Patch-Locator,一种新的基于排序学习的补丁定位方法,通过扩展漏洞数据源对漏洞数据进行补充,并根据漏洞与补丁文本的相似性、漏洞产生的原因和导致的结果等更能反映漏洞与补丁间关联的因素提取了更具有针对性的相关性特征,并使用LambdaMart排序学习模型对提交基于其具有的相关性特征进行排序以定位安全补丁.本文用来自10个开源软件项目的1669个漏洞来评估Patch-Locator.实验结果表明,Patch-Locator的Recall@1指标为92.22%,Recall@5指标为95.51%,Manual Effort@5指标为1.2455,均优于现有方法. 展开更多
关键词 开源软件 安全补丁 排序学习 补丁定位
在线阅读 下载PDF
高维贝叶斯优化研究综述 被引量:2
15
作者 陈泉霖 陈奕宇 +4 位作者 霍静 曹宏业 高阳 李栋 郝建业 《软件学报》 北大核心 2025年第6期2576-2603,共28页
贝叶斯优化是一种优化黑盒函数的技术,高效的样本利用率使其在众多科学和工程领域中得到了广泛应用,如深度模型调参、化合物设计、药物开发和材料设计等.然而,当输入空间维度较高时,贝叶斯优化的性能会显著下降.为了克服这一限制,许多... 贝叶斯优化是一种优化黑盒函数的技术,高效的样本利用率使其在众多科学和工程领域中得到了广泛应用,如深度模型调参、化合物设计、药物开发和材料设计等.然而,当输入空间维度较高时,贝叶斯优化的性能会显著下降.为了克服这一限制,许多研究对贝叶斯优化方法进行了高维扩展.为了深入剖析高维贝叶斯优化的研究方法,根据不同工作的假设与特征将高维贝叶斯优化方法分为3类:基于有效低维度假设的方法、基于加性假设的方法以及基于局部搜索的方法,并对这些方法进行阐述和分析.首先着重分析这3类方法的研究进展,然后比较各类方法在贝叶斯优化应用中的优劣势,最后总结当前阶段高维贝叶斯优化的主要研究趋势,并对未来发展方向展开讨论. 展开更多
关键词 高维贝叶斯优化 贝叶斯优化 黑盒优化 降维 变量选择
在线阅读 下载PDF
面向深度学习的图像数据增强综述 被引量:7
16
作者 杨锁荣 杨洪朝 +1 位作者 申富饶 赵健 《软件学报》 北大核心 2025年第3期1390-1412,共23页
深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用... 深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用于图像数据的必要环节.系统地回顾不同的图像数据增强方法,并提出一个新的分类方法,为研究图像数据增强提供了新的视角.从不同的类别出发介绍各类数据增强方法的优势和局限性,并阐述各类方法的解决思路和应用价值.此外,还介绍语义分割、图像分类和目标检测这3种典型计算机视觉任务中常用的公共数据集和性能评价指标,并在这3个任务上对数据增强方法进行实验对比分析.最后,讨论当前数据增强所面临的挑战和未来的发展趋势. 展开更多
关键词 深度学习 图像数据增强 图像识别 泛化性能 计算机视觉
在线阅读 下载PDF
混合博弈问题的求解与应用综述 被引量:3
17
作者 董绍康 李超 +7 位作者 杨光 葛振兴 曹宏业 陈武兵 杨尚东 陈兴国 李文斌 高阳 《软件学报》 北大核心 2025年第1期107-151,共45页
近年来,随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展,围棋、游戏、德扑和麻将等领域取得了巨大的进步,例如,AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达... 近年来,随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展,围棋、游戏、德扑和麻将等领域取得了巨大的进步,例如,AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达到或超过人类专家水平.这些应用集中在双人、两队或者多人的零和博弈问题中,而对于混合博弈问题的研究缺乏实质性的进展与突破.区别于零和博弈,混合博弈需要综合考虑个体收益、集体收益和均衡收益等诸多目标,被广泛应用于公共资源分配、任务调度和自动驾驶等现实场景.因此,对于混合博弈问题的研究至关重要.通过梳理当前混合博弈领域中的重要概念和相关工作,深入分析国内外研究现状和未来发展方向.具体地,首先介绍混合博弈问题的定义与分类;其次详细阐述博弈解概念和求解目标,包含纳什均衡、相关均衡、帕累托最优等解概念,最大化个体收益、最大化集体收益以及兼顾公平等求解目标;接下来根据不同的求解目标,分别对博弈论方法、强化学习方法以及这两种方法的结合进行详细探讨和分析;最后介绍相关的应用场景和实验仿真环境,并对未来研究的方向进行总结与展望. 展开更多
关键词 混合博弈 博弈论 强化学习
在线阅读 下载PDF
面向参数化动作空间的多智能体中心化策略梯度分解及其应用 被引量:2
18
作者 田树聪 谢愈 +2 位作者 张远龙 周正春 高阳 《软件学报》 北大核心 2025年第2期590-607,共18页
近年来,多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的多智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化... 近年来,多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的多智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化动作空间.这类动作空间的复杂性结构使得传统单一针对离散型或连续型的多智能体强化学习算法不在适用,因此研究能用于参数化动作空间的多智能体强化学习算法具有重要的现实意义.提出一种面向参数化动作空间的多智能体中心化策略梯度分解算法,利用中心化策略梯度分解算法保证多智能体的有效协同,结合参数化深度确定性策略梯度算法中双头策略输出实现对参数化动作空间的有效耦合.通过在Hybrid Predator-Prey场景中不同参数设置下的实验结果表明该算法在经典的多智能体参数化动作空间协作任务上具有良好的性能.此外,在多巡航导弹协同突防场景中进行算法效能验证,实验结果表明该算法在多巡航导弹突防这类具有高动态、行为复杂化的协同任务中有效性和可行性. 展开更多
关键词 参数化动作空间 多智能体强化学习 中心化策略梯度分解 多巡航导弹突防
在线阅读 下载PDF
影响预训练语言模型数据泄露的因素研究 被引量:1
19
作者 钱汉伟 彭季天 +4 位作者 袁明 高光亮 刘晓迁 王群 朱景羽 《信息安全研究》 北大核心 2025年第2期181-188,共8页
当前广泛使用的预训练语言模型是从海量训练语料中学习通用的语言表示.自然语言处理领域的下游任务在使用预训练语言模型后性能得到显著提升,但是深度神经网络过拟合现象使得预训练语言模型可能存在泄露训练语料隐私的风险.选用T5,GPT-2... 当前广泛使用的预训练语言模型是从海量训练语料中学习通用的语言表示.自然语言处理领域的下游任务在使用预训练语言模型后性能得到显著提升,但是深度神经网络过拟合现象使得预训练语言模型可能存在泄露训练语料隐私的风险.选用T5,GPT-2,OPT等广泛使用的预训练语言模型作为研究对象,利用模型反演攻击探索影响预训练语言模型数据泄露的因素.实验过程中利用预训练语言模型生成大量样本,以困惑度等指标选取最有可能发生数据泄露风险的样本进行验证,证明了T5等不同模型均存在不同程度的数据泄露问题;同一种模型,模型规模越大数据泄露可能性越大;添加特定前缀更容易获取泄露数据等问题.对未来数据泄露问题及其防御方法进行了展望. 展开更多
关键词 自然语言处理 预训练语言模型 隐私数据泄露 模型反演攻击 模型架构
在线阅读 下载PDF
静态软件缺陷预测方法研究 被引量:126
20
作者 陈翔 顾庆 +2 位作者 刘望舒 刘树龙 倪超 《软件学报》 EI CSCD 北大核心 2016年第1期1-25,共25页
静态软件缺陷预测是软件工程数据挖掘领域中的一个研究热点.通过分析软件代码或开发过程,设计出与软件缺陷相关的度量元;随后,通过挖掘软件历史仓库来创建缺陷预测数据集,旨在构建出缺陷预测模型,以预测出被测项目内的潜在缺陷程序模块... 静态软件缺陷预测是软件工程数据挖掘领域中的一个研究热点.通过分析软件代码或开发过程,设计出与软件缺陷相关的度量元;随后,通过挖掘软件历史仓库来创建缺陷预测数据集,旨在构建出缺陷预测模型,以预测出被测项目内的潜在缺陷程序模块,最终达到优化测试资源分配和提高软件产品质量的目的.对近些年来国内外学者在该研究领域取得的成果进行了系统的总结.首先,给出了研究框架并识别出了影响缺陷预测性能的3个重要影响因素:度量元的设定、缺陷预测模型的构建方法和缺陷预测数据集的相关问题;接着,依次总结了这3个影响因素的已有研究成果;随后,总结了一类特殊的软件缺陷预测问题(即,基于代码修改的缺陷预测)的已有研究工作;最后,对未来研究可能面临的挑战进行了展望. 展开更多
关键词 软件质量保障 软件缺陷预测 软件度量元 机器学习 数据集预处理
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部