期刊文献+
共找到15,592篇文章
< 1 2 250 >
每页显示 20 50 100
基于大语言模型的需求歧义检测方法
1
作者 高俊涛 刘芳 杨溢龙 《计算机研究与发展》 北大核心 2026年第4期827-853,共27页
在现代软件开发中,需求歧义是导致项目失败、成本超支和质量问题的关键因素,因此,人们对需求歧义的自动化检测进行了广泛的研究。虽然这些方法降低了人工审查的时间成本,但歧义检测解决方案类型不全,难以全面覆盖语言歧义对应的6种歧义... 在现代软件开发中,需求歧义是导致项目失败、成本超支和质量问题的关键因素,因此,人们对需求歧义的自动化检测进行了广泛的研究。虽然这些方法降低了人工审查的时间成本,但歧义检测解决方案类型不全,难以全面覆盖语言歧义对应的6种歧义类型。传统方法缺乏深层次的语义理解、逻辑关系识别以及引用/指代关系识别能力,这限制了其对语义的处理能力,无法对语用歧义以及语言错误歧义进行检测。为此,提出了一种基于大语言模型的方法(称为LMAdetect),用于自动检测需求歧义。对于给定的需求,LMAdetect根据启发式规则和大语言模型进行分析,将该需求检测分类为对应的歧义类型。然而,大语言模型经常会分类出不同的歧义类型,针对大语言模型的分类结果,LMAdetect利用基于规则的算法,将不同歧义类型分配给不同专家进行检测。最后对这些检测结果根据置信度进行汇总并输出置信度高的分类结果。对6种歧义类型共1192个数据进行了实验,结果表明,相较传统基于规则的方法,LMAdetect的F1分数提升了34.4个百分点,相较仅使用基于大语言模型的方法,F1分数提升了31.6个百分点,对于语用歧义和语言错误歧义的检测,F1分数分别达到了0.6950和0.8889,展示了其在需求歧义检测方面的优势。 展开更多
关键词 需求歧义 检测 大语言模型 分类 语义理解
在线阅读 下载PDF
GoldMiner-AI:大数据与人工智能找矿系统的设计与实现
2
作者 周永章 朱彪彪 +9 位作者 童小畅 李丹 张彤 牛露佳 于新慧 张玙情 王郑哲 郭亦嘉 李文佳 张灿 《地学前缘》 北大核心 2026年第4期1-11,共11页
针对当前地质找矿智能化转型中“从数据接入到智能分析的全流程自动化”以及“贯穿数据获取、融合处理、异常识别与智能预测的全流程端到端系统”仍属关键瓶颈的现实挑战,本文介绍笔者近年来围绕构建大数据与人工智能找矿新范式所持续... 针对当前地质找矿智能化转型中“从数据接入到智能分析的全流程自动化”以及“贯穿数据获取、融合处理、异常识别与智能预测的全流程端到端系统”仍属关键瓶颈的现实挑战,本文介绍笔者近年来围绕构建大数据与人工智能找矿新范式所持续性开展的研究成果,重点阐述面向找矿任务的全流程智能系统——GoldMiner-AI的构建与应用。该平台基于RuoYi-Cloud-Plus微服务架构,采用PostGIS、Neo4j、Milvus与MySQL协同的多数据库体系,实现对地质、地球化学、地球物理、钻孔、野外观察及文本报告等多源异构地学数据的统一管理。在智能化核心模块方面,系统集成了KAR-Graph异常识别框架与MAF-Net多源特征融合深度学习模型,并结合知识图谱与检索增强生成技术,构建了面向找矿垂直领域的大语言模型,形成了从异常识别、靶区圈定、知识推理到智能问答的完整智能工作流。在右江盆地、钦杭成矿带南段等矿区的验证结果表明:(1)系统能够有效识别卡林型金矿的Au-As-Sb-Hg异常组合,并深入挖掘与矿床成因相关的地球化学指纹;(2)通过多源图层叠加分析,系统可准确预测铅锌矿化带的空间位置;(3)垂直领域大语言模型能够显著减轻通用模型的“幻觉”现象,提升地学知识问答的准确性。GoldMiner-AI为矿产预测提供了一个可复现、可扩展、可工程化部署的系统平台,推动了找矿工作向全面智能化方向发展。 展开更多
关键词 智能找矿 大数据挖掘 大语言模型 深度学习 检索增强生成 知识图谱
在线阅读 下载PDF
基于加权PageRank特征选择的软件缺陷预测集成分类方法
3
作者 王炜清 范洪旗 +1 位作者 严远亭 张以文 《计算机集成制造系统》 北大核心 2026年第3期1025-1048,共24页
基于机器学习方法的软件缺陷预测(SDP)是软件工程中的一项关键技术。随着软件规模的扩大,利用不同的软件度量指标从源代码中提取的度量元迅速增加,软件缺陷数据维数呈现出高维趋势,给训练高效的SDP模型带来了巨大挑战。鉴于此,提出了一... 基于机器学习方法的软件缺陷预测(SDP)是软件工程中的一项关键技术。随着软件规模的扩大,利用不同的软件度量指标从源代码中提取的度量元迅速增加,软件缺陷数据维数呈现出高维趋势,给训练高效的SDP模型带来了巨大挑战。鉴于此,提出了一种基于加权PageRank的双评估特征选择方法(DEFS)。DEFS同时考虑特征之间的组合效应和全局关系,将所有特征建模为完整的加权图。然后利用加权PageRank算法计算特征的重要性以实现优质特征的选择。最后为了融合多种特征选择算法的优势,将DEFS嵌入到集成框架中实现基于加权PageRank的双评估特征选择集成方法(E-DEFS),进一步提高预测性能。在6个软件缺陷数据库的30个数据集上的实验结果表明,DEFS和E-DEFS相较于经典的特征选择方法取得了更优的性能表现。 展开更多
关键词 软件缺陷预测 特征选择 集成学习 完全加权图 PAGERANK算法 机器学习
在线阅读 下载PDF
基于代码感知与双阶段优化融合的README生成大语言模型框架
4
作者 崔星 吴敬征 +2 位作者 罗天悦 凌祥 王旭 《计算机研究与发展》 北大核心 2026年第4期918-942,共25页
随着开源软件生态的蓬勃发展,使用开源已成为当前开发的主流模式。其中,README是理解、复用开源软件的关键要素。然而,部分开源软件存在README文件缺失、信息不全以及结构不清晰等不规范问题,导致开发者难以理解和使用,降低开发效率。... 随着开源软件生态的蓬勃发展,使用开源已成为当前开发的主流模式。其中,README是理解、复用开源软件的关键要素。然而,部分开源软件存在README文件缺失、信息不全以及结构不清晰等不规范问题,导致开发者难以理解和使用,降低开发效率。研究人员提出了多种README自动生成、补全方法,但这些方法仍然面临跨语言适用性不足、忽视代码结构信息、生成结果存在幻觉和主观性等挑战。因此,提出结合大语言模型与代码结构建模的双阶段README自动生成框架RMancer。第1个阶段中,RMancer设计了基于提示引导的结构化信息抽取方法,结合静态分析生成高质量训练数据,提升模型对文件级功能摘要、依赖关系和主程序入口等结构要素的感知能力。第2个阶段设计了基于调用图的拓扑排序策略,重构模块间的执行逻辑顺序,以构建结构化文档生成的上下文信息;同时,引入多任务监督机制,引导大模型联合学习文档段落结构与内容生成,提升输出文本的逻辑一致性与客观性;最后,RMancer通过标准化约束策略对生成结果进行格式规整与内容审校,确保文档的规范性与准确性。在包含16692个开源软件的测试集中,RMancer在信息抽取与README生成2个子任务上均显著优于现有方法,具体而言,在信息抽取任务中,其在calls、entry和description字段的F1-score相较最佳基线模型平均提升2.34%;在文档生成任务中,BLEU、METEOR和ROUGE-L三项指标相较最佳基线模型平均提升幅度为1.37%。此外,RMancer在AlignScore和G-Eval两种自动评估指标上表现最佳。同时,在内容客观性与冗余控制等关键维度上,RMancer仍保持领先表现,进一步验证了其结构感知与多任务优化策略的有效性。 展开更多
关键词 开源软件 README生成 大语言模型 代码结构建模 双阶段优化
在线阅读 下载PDF
基于定理证明的UML多视图模型良构一致性验证方法
5
作者 吴润方 杜晔 黎妹红 《计算机应用研究》 北大核心 2026年第2期577-587,共11页
针对复杂系统中UML多视图模型良构一致性验证的难题,提出了一种融合结构映射与定理证明的双层验证框架,以系统性地解决跨视图语义交织与结构耦合引发的建模质量风险。该方法通过结构映射验证算法(SMIVA)自动抽取3种视图模型间的结构匹... 针对复杂系统中UML多视图模型良构一致性验证的难题,提出了一种融合结构映射与定理证明的双层验证框架,以系统性地解决跨视图语义交织与结构耦合引发的建模质量风险。该方法通过结构映射验证算法(SMIVA)自动抽取3种视图模型间的结构匹配关系,生成良构一致性断言集以保障类型、命名与拓扑闭合性;同时,基于交互式定理证明器Coq构建形式化断言体系,将行为语义与状态迁移转换为可判定命题,实现语义一致性的逻辑推导。实验以电子商务系统为例,完成了13条良构一致性约束定理的形式化证明。结果表明,该方法能有效提升断言提取的覆盖性、自动化验证能力和验证效率,对提升UML建模质量具有重要意义。 展开更多
关键词 UML模型 多视图一致性 结构映射 定理证明 形式化验证
在线阅读 下载PDF
基于半监督主动学习的日志异常检测方法
6
作者 吴茜雅 张晨曦 彭鑫 《计算机应用与软件》 北大核心 2026年第3期354-360,368,共8页
为了保证复杂系统的可靠性,基于日志的异常检测方法成为研究的重点。现有的日志异常检测监督方法需要大量标记数据训练,半监督方法容易受到噪声数据的负面影响,无法有效应对日志概念偏移导致的性能下降问题。针对这种情况,提出基于半监... 为了保证复杂系统的可靠性,基于日志的异常检测方法成为研究的重点。现有的日志异常检测监督方法需要大量标记数据训练,半监督方法容易受到噪声数据的负面影响,无法有效应对日志概念偏移导致的性能下降问题。针对这种情况,提出基于半监督主动学习的日志异常检测方法(SSLALog),输入少量标记数据,采用有监督的Transformer异常分类模型,结合半监督自训练学习和主动学习的方式训练模型。实验结果表明,在F1分数上该方法优于其他半监督方法,通过讨论效率,进一步证实了实用性。 展开更多
关键词 日志 日志异常检测 半监督学习 主动学习 伪标签
在线阅读 下载PDF
考虑工作量不确定性的软件项目策略梯度超启发式调度
7
作者 申晓宁 施江熠 +2 位作者 马燕昭 陈文言 佘娟 《电子与信息学报》 北大核心 2026年第2期794-805,共12页
该文围绕软件项目开发过程中存在的不确定因素,建立一种考虑任务工作量不确定性的多目标软件项目调度模型。该模型采用非对称三角区间二型模糊数描述工作量的不确定性。为了提高不确定环境下的决策质量,提出一种基于策略梯度的超启发式... 该文围绕软件项目开发过程中存在的不确定因素,建立一种考虑任务工作量不确定性的多目标软件项目调度模型。该模型采用非对称三角区间二型模糊数描述工作量的不确定性。为了提高不确定环境下的决策质量,提出一种基于策略梯度的超启发式算法求解该模型。该算法将强化学习中的一种策略梯度算法(即Actor-Critic算法)作为高层策略,根据算法的当前运行状态选择合适的低层启发式策略。同时引入优先经验回放法,以利用历史经验信息更新网络参数,加快收敛速度并降低学习成本。将所提算法与6种代表性算法在12个人工合成算例和3个实例上进行了对比。实验结果表明,所提算法在不确定调度环境中能够搜索到一组收敛性和多样性更好的非支配解。 展开更多
关键词 软件项目调度 工作量不确定性 策略梯度 超启发式算法 多目标优化
在线阅读 下载PDF
局部信息下的分布式无人集群自组织编队框架
8
作者 崔梓涵 刘玮 +1 位作者 谢宛真 胡棣威 《计算机应用研究》 北大核心 2026年第1期216-226,共11页
针对分布式无人集群在动态复杂环境中因通信受限导致的局部信息传递效率低下、个体响应迟缓及全局协调困难等问题,提出一种融合复杂网络理论与多智能体强化学习的双层自适应编队框架。该框架构建通信层与结构层相结合的分布式网络模型,... 针对分布式无人集群在动态复杂环境中因通信受限导致的局部信息传递效率低下、个体响应迟缓及全局协调困难等问题,提出一种融合复杂网络理论与多智能体强化学习的双层自适应编队框架。该框架构建通信层与结构层相结合的分布式网络模型,在通信层采用基于局部邻域信息的多智能体强化学习与去中心化策略优化,实现局部邻域信息下的高效信息共享与策略更新;结构层引入分布式拓扑重构机制,支持编队在受损恢复与任务拆分场景下的灵活调整与重构;同时在通信层与结构层间嵌入动态扰动处理机制,实现对节点失效、任务变化等事件的快速适应与重构。仿真实验表明,该方法在多种网络拓扑下的抗攻击恢复与编队拆分任务中均显著提升了任务成功率与收敛速度,具备较强的鲁棒性与适应性,为局部信息约束条件下无人集群的高效协同与稳定编队提供了有效途径与理论支持。 展开更多
关键词 分布式无人集群 局部邻域信息 复杂网络 多智能体强化学习 去中心化策略优化 自组织编队
在线阅读 下载PDF
基于大语言模型的数据库管理系统模糊测试方法
9
作者 张瑞宸 张亚东 +3 位作者 兰文尉 岳清 王正武 崔展齐 《计算机研究与发展》 北大核心 2026年第4期884-899,共16页
数据库管理系统(database management system,DBMS)作为数据管理与存储的关键软件,其可靠性直接影响数据密集型系统的安全稳定运行。近年来,模糊测试因其具备人工成本低、测试效率高等特点,成为DBMS测试方法之一。然而现有的DBMS模糊测... 数据库管理系统(database management system,DBMS)作为数据管理与存储的关键软件,其可靠性直接影响数据密集型系统的安全稳定运行。近年来,模糊测试因其具备人工成本低、测试效率高等特点,成为DBMS测试方法之一。然而现有的DBMS模糊测试方法面临测试用例覆盖能力不足与多DBMS适配性差两大问题,限制了测试的效果和泛用性。为此,CLCC(curated LLM case construct)是一种基于大语言模型(large language model,LLM)的DBMS模糊测试方法。该方法在模糊测试前,利用LLM对初始种子进行构建,并在模糊测试过程中,根据边覆盖情况筛选种子,引导LLM生成测试用例。与SQUIRREL、SQLRight和ParserFuzz进行的对比实验表明,CLCC测试SQLite、MySQL、MariaDB、DuckDB和PostgreSQL的边覆盖数量比SQUIRREL增加了14.96%~49.31%;测试SQLite、MySQL和PostgreSQL的边覆盖数量比SQLRight增加了6.09%~17.10%;测试SQLite、MySQL和MariaDB的边覆盖数量比ParserFuzz增加了17.95%~41.20%。 展开更多
关键词 数据库管理系统 模糊测试 大语言模型 漏洞检测 覆盖率分析
在线阅读 下载PDF
分布式测震实时流数据容错系统应用研究
10
作者 李杨 冯兵 +2 位作者 蔡寅 张秀萍 许利娜 《计算机应用与软件》 北大核心 2026年第2期64-70,146,共8页
为增强测震流式数据采集的容错纠错能力,提高数据处理的稳定性和可靠性,提出基于ZooKeeper的分布式测震实时流数据处理方法。构建ZooKeeper分布式服务架构;通过监听动作完成整个流程中的主备切换,并继续进行数据消费行为,实现服务注册... 为增强测震流式数据采集的容错纠错能力,提高数据处理的稳定性和可靠性,提出基于ZooKeeper的分布式测震实时流数据处理方法。构建ZooKeeper分布式服务架构;通过监听动作完成整个流程中的主备切换,并继续进行数据消费行为,实现服务注册、服务加载、服务容错、策略调度功能。测试结果表明该方法下系统平均每小时服务修复时间(MTTR)降低98.4%,平均每小时故障间隔时间(MTTF)提升33.5%,对于故障场景下数据完整率提升20%,能够较好解决测震流式数据面临的稳定性和可靠性困难,具备区域地震台网技术推广应用潜力。 展开更多
关键词 实时流数据 容错纠错 协调服务 服务模型
在线阅读 下载PDF
基于SEDS的星载业务描述工具设计
11
作者 张梁 吕良庆 何睿 《计算机工程与设计》 北大核心 2026年第3期817-824,共8页
为解决星载业务的即插即用问题,对航天器星载接口业务电子数据单(SEDS)和欧空局包应用标准(PUS)进行了研究,提出了一种专注于星载业务层面的接口信息及其关系的描述方法。基于该方法,设计了模板生成工具、文件生成工具和格式转换工具,... 为解决星载业务的即插即用问题,对航天器星载接口业务电子数据单(SEDS)和欧空局包应用标准(PUS)进行了研究,提出了一种专注于星载业务层面的接口信息及其关系的描述方法。基于该方法,设计了模板生成工具、文件生成工具和格式转换工具,供用户实现对星载业务的设计定义。以星载事件表业务为例,对工具链开展了实例验证,实验结果验证了其可行性和有效性。本文提出的星载业务描述方法及其工具链系统实现为业务数据的标准化描述和处理提供了支持,能够提升星载信息系统的即插即用能力。 展开更多
关键词 空间数据系统 即插即用 电子数据单 工具链 包应用标准 星载业务 可扩展标记语言
在线阅读 下载PDF
Android SDK安全性研究综述
12
作者 许腾 刘路遥 +3 位作者 姜灏宇 罗畅 李珩 袁巍 《计算机科学》 北大核心 2026年第1期285-297,共13页
Android SDK是Android应用开发所使用的软件工具包。由于单个Android SDK可以被集成至多个应用,给Android生态带来的安全性影响是链式的,因此Android生态安全面临着来自SDK的全面威胁。近年来一系列与Android SDK有关的安全问题,如SDK... Android SDK是Android应用开发所使用的软件工具包。由于单个Android SDK可以被集成至多个应用,给Android生态带来的安全性影响是链式的,因此Android生态安全面临着来自SDK的全面威胁。近年来一系列与Android SDK有关的安全问题,如SDK跨库调用隐私数据、SDK库资源合并覆盖等,引起了工业界和学术界的高度重视。但目前对于Android SDK的安全性研究缺乏完备性综述,对此,对现有相关工作进行详细整理,从Android SDK的内部组件代码安全与运行数据交互安全展开,在内部组件代码安全上整理了系统SDK层面和三方SDK层面的研究,在运行数据交互安全上整理了SDK本体违规和SDK外部入侵方面的研究,并分析了近年来的Android SDK安全性工作,引入了性能指标进行横向对比,梳理了其发展脉络和演化过程。最后展望了该领域与如今AI大模型等新兴技术结合使用的未来研究方向。 展开更多
关键词 Android SDK 安全性分析 代码安全 数据交互安全
在线阅读 下载PDF
面向流域防洪的水利数据图谱化建模技术
13
作者 徐学军 黄瓅瑶 +2 位作者 冯快乐 李琪 周超 《人民长江》 北大核心 2026年第2期250-256,共7页
现有的防洪调度业务应用常采用硬编码方式将水利对象、属性、拓扑关系等数据与水利专业模型直接耦合,严重制约了不同业务功能间的数据资源共享。为实现流域水信息的灵活组织与高效管理,支撑防洪调度业务场景下水利专业模型与水利数据的... 现有的防洪调度业务应用常采用硬编码方式将水利对象、属性、拓扑关系等数据与水利专业模型直接耦合,严重制约了不同业务功能间的数据资源共享。为实现流域水信息的灵活组织与高效管理,支撑防洪调度业务场景下水利专业模型与水利数据的快速适配,提出了一种水利数据图谱化建模技术。基于标准化水利对象数据,将业务涉及的实体和非实体对象进行高度抽象概化,形成基础对象、映射关系和业务逻辑数据3种范式;利用知识构建技术完成图谱化转换,并基于图数据模型查询效率高、互操作性强等优势,提取水利对象、属性及其相互关系,完成“模板-对象-属性”组态式构建,实现了水利数据图谱化建模。研究成果已成功应用于长江流域大洪水防汛智能指挥决策平台建设,通过构建规范化水利数据模型,有效提升了数据的松耦合组织与业务通用性能,在洪水智能调度场景中实现了不同水利专业模型与水利对象数据的灵活组织和动态适配。 展开更多
关键词 水利数据模型 标准化 知识图谱 防洪调度
在线阅读 下载PDF
融合多类特征的语句级缺陷定位方法
14
作者 李静雯 张佳乐 +1 位作者 袁智豪 崔展齐 《计算机工程与应用》 北大核心 2026年第3期377-390,共14页
现有基于深度学习的语句级缺陷定位方法通过深度学习模型学习各种传统缺陷定位方法计算出的可疑度值等特征来进行缺陷定位,其主要关注执行测试用例的动态信息,未关注缺陷语句与非缺陷语句之间的类不平衡问题,缺陷定位的准确性有待进一... 现有基于深度学习的语句级缺陷定位方法通过深度学习模型学习各种传统缺陷定位方法计算出的可疑度值等特征来进行缺陷定位,其主要关注执行测试用例的动态信息,未关注缺陷语句与非缺陷语句之间的类不平衡问题,缺陷定位的准确性有待进一步提高。为此,提出了一种融合多类特征的语句级缺陷定位方法SMSDFL(combining spectrum,mutation and semantic features for deep fault localization),该方法将多种基于频谱和变异的缺陷定位方法计算的可疑度值作为频谱特征和变异特征,利用数据流和控制流对代码语句进行切片,获取与对应语句存在依赖关系的代码片段,以计算Overlap、Tightness等度量元作为其语义特征;采用生成对抗网络扩增缺陷语句的特征数据来解决缺陷语句与非缺陷语句之间的类不平衡问题;将这三类特征进行融合输入到递归神经网络中计算语句的可疑度值,并根据可疑度值对语句进行降序排序,以定位缺陷语句。为评估SMSDFL的缺陷定位性能在Defects4J数据集上进行了实验。实验结果表明,SMSDFL取得了比现有方法更好的缺陷定位效果,其中,仅检查可疑语句排名中的第一条语句时,SMSDFL比Ochiai、MUSE、CGAN4FL和GRACE分别多定位到166、161、151、68条缺陷语句。 展开更多
关键词 缺陷定位 深度学习 神经网络 生成对抗网络
在线阅读 下载PDF
基于集成学习的汇编级故障注入设计
15
作者 范烁阳 王明亮 +2 位作者 施敏华 周华 常亮 《计算机工程与设计》 北大核心 2026年第1期120-125,共6页
为了解决传统软件故障注入中存在的特征提取困难、有效性低的问题,基于集成学习的汇编级故障注入设计(ALFIEL)被提出。集成深度学习模型对小尺度程序进行特征提取,并将提取到的特征进行早期融合。融合的特征将会被送到标签分类器进行训... 为了解决传统软件故障注入中存在的特征提取困难、有效性低的问题,基于集成学习的汇编级故障注入设计(ALFIEL)被提出。集成深度学习模型对小尺度程序进行特征提取,并将提取到的特征进行早期融合。融合的特征将会被送到标签分类器进行训练。利用训练后的模型对大尺度程序进行分析,对程序的脆弱性做出判断,筛选出汇编代码中可能会被故障注入所影响的部分。在MiBench数据集上对上述方法进行了验证,准确率达到了83.5%。ALFIEL在与SAFIRE和LLTFI的对比实验中表现出色。 展开更多
关键词 故障注入 集成学习 程序脆弱性 汇编代码 可靠性 特征融合 单比特翻转
在线阅读 下载PDF
Zstandard中LZ77压缩算法的高效匹配策略设计与实现
16
作者 韦芳宇 陈天韵 +2 位作者 周洋 谢雨来 王芳 《计算机研究与发展》 北大核心 2026年第3期597-614,共18页
在信息时代背景下,数据规模的急剧增长与压缩应用场景的多样化,对压缩策略的灵活性和效率提出了更高要求。LZ77算法是典型的无损压缩方法,广泛应用于Zstandard(ZSTD)等主流压缩工具中。然而,更高的压缩率指标要求应用更大的历史窗口与... 在信息时代背景下,数据规模的急剧增长与压缩应用场景的多样化,对压缩策略的灵活性和效率提出了更高要求。LZ77算法是典型的无损压缩方法,广泛应用于Zstandard(ZSTD)等主流压缩工具中。然而,更高的压缩率指标要求应用更大的历史窗口与更复杂的压缩策略,导致在实现ZSTD中的LZ77算法存在缓存频繁未命中与延迟匹配效率低下的问题。为此,提出2项优化策略:其一,多级区域搜索策略(multi-level region search strategy,MLRS),通过引入匹配区域分级与访问阈值控制机制灵活调整搜索深度,限制匹配过程中的数据访问范围,缓解缓存压力;其二,基于扩展搜索的延迟匹配策略(extended searchbased lazy matching strategy,ESLM),通过复用搜索路径并采用近似替代技术,降低冗余计算的同时提升匹配效率。上述优化策略基于ZSTD level 12配置在鲲鹏920服务器平台上实现并完成验证。实验结果表明:MLRS在多种数据集上能够显著降低压缩过程中的末级缓存未命中率,将压缩率保持在94.65%~99.58%的同时,使压缩吞吐量提升至原方案的118.34%~149.50%;ESLM可将压缩吞吐量提升至原方案的113.49%~117.46%,且在多数数据集上进一步提高压缩比;当两者联合应用时,压缩速度可提升至原方案的134.53%~171.17%,同时维持94.18%~99.80%的压缩率。 展开更多
关键词 数据压缩 LZ77算法 缓存优化 延迟匹配 吞吐量优化
在线阅读 下载PDF
基于应用程序接口依赖关系图路径搜索的工作流生成方法
17
作者 梁冬 史骁 +1 位作者 吕存驰 赵晓芳 《高技术通讯》 北大核心 2026年第1期41-52,共12页
工作流编程日益成为重要的软件开发模式,智能辅助工作流生成服务能够显著提升用户开发效率。然而,现有的工作流平台仅提供基本的辅助功能,如候选节点推荐或边连接的限制。尽管大语言模型驱动的智能编程服务在代码生成上取得了显著进展,... 工作流编程日益成为重要的软件开发模式,智能辅助工作流生成服务能够显著提升用户开发效率。然而,现有的工作流平台仅提供基本的辅助功能,如候选节点推荐或边连接的限制。尽管大语言模型驱动的智能编程服务在代码生成上取得了显著进展,但在工作流生成中仍然面临诸多挑战。本文分析了大语言模型在工作流生成过程中常见的幻觉问题,并提出了一种基于应用程序接口(application programming interface,API)依赖关系图路径搜索的工作流生成方法。通过引导模型沿API依赖关系图搜索生成路径,限制其输出解码空间,有效缓解了模型幻觉现象。此外,本文引入多种路径搜索策略,包括出边路径搜索和入边路径搜索,为工作流生成提供了全新的思维链方法。实验结果表明,本文方法在工作流生成质量上优于先前的思维链技术,并显著降低了模型幻觉率。 展开更多
关键词 工作流生成 思维链 路径搜索 大语言模型幻觉 应用程序接口依赖关系图
在线阅读 下载PDF
Android程序个人信息未去标识化检测方法研究
18
作者 刘晓建 李欣蕊 《现代电子技术》 北大核心 2026年第3期67-75,共9页
Android应用程序中存在的不合理行为,如用户个人信息未去标识化展示在一定程度上泄露了用户的身份信息,违反了国家关于个人信息安全规范的要求,因此有必要对APP中可能存在的个人信息未去标识化展示问题进行有效的检测。文中提出一种静... Android应用程序中存在的不合理行为,如用户个人信息未去标识化展示在一定程度上泄露了用户的身份信息,违反了国家关于个人信息安全规范的要求,因此有必要对APP中可能存在的个人信息未去标识化展示问题进行有效的检测。文中提出一种静态分析和测试技术相结合的个人信息未去标识化检测方法,首先通过静态分析获取APK的活动迁移图;然后在图上注入先验规则以缩小GUI检测区域,使用强化学习方法在活动迁移图中进一步搜索GUI状态空间,并使用大语言模型将GUI层次结构与布局文件进行匹配,从而搜索到可能存在身份信息的目标GUI页面;最后通过OCR技术对GUI上的身份信息是否去标识化进行判断。实验结果表明,该方法可以高效地搜索目标GUI区域并有效检测个人信息未去标识化展示漏洞,对于加强移动生态安全防护体系具有重要意义。 展开更多
关键词 个人信息 未去标识化展示 GUI测试 静态分析 强化学习 大语言模型
在线阅读 下载PDF
多代理协作实现缺陷报告补全和优化
19
作者 魏威 苑兴 +1 位作者 杜军威 李玉莹 《计算机研究与发展》 北大核心 2026年第4期900-917,共18页
缺陷报告是开发者定位和修复缺陷的关键依据,其质量直接影响软件维护效率。尽管已有研究证明高质量报告可显著缩短修复时间,但开源项目中仍普遍存在信息残缺问题。现有基于机器学习和大语言模型(LLM)的自动补全方法虽能提升完整性,但仍... 缺陷报告是开发者定位和修复缺陷的关键依据,其质量直接影响软件维护效率。尽管已有研究证明高质量报告可显著缩短修复时间,但开源项目中仍普遍存在信息残缺问题。现有基于机器学习和大语言模型(LLM)的自动补全方法虽能提升完整性,但仍存在明显不足:传统方法通过检索和拼接相似报告片段,易导致语义断裂和逻辑不一致;LLM生成内容虽流畅,却可能存在事实性幻觉。受人类专家“分阶段处理、多角色协同”的问题解决机制启发,提出一种多代理协作机制实现缺陷报告补全和优化。通过3个关键设计实现高质量补全:1)将补全任务分解为缺陷分析、报告补全和质量评估3个阶段,由不同代理负责以降低认知负荷;2)设计结构化提示模板,精准引导LLM扮演领域专家角色,确保各阶段输出准确;3)引入动态反馈机制,通过多轮迭代实现代理间的交叉验证和协同优化,有效控制语义漂移问题,确保逻辑连贯且补全内容与事实一致。在4个公开数据集上的实验表明,在BLEU,Sentence-BERT,ROUGE-L和METEOR指标上较基线分别提升10.41%,7.52%,13.55%和16.64%。人工评估进一步证实,所提方法补全的报告在完整性、清晰性与帮助性上均显著优于现有方法,可为开源社区缺陷治理提供可靠支持。 展开更多
关键词 软件维护 缺陷报告补全 大语言模型 多代理协作 迭代反馈机制
在线阅读 下载PDF
基于随机Petri网的软件测试业务流程建模及多环节效能分析方法
20
作者 薛可涵 韩强 +2 位作者 韩晟 乔依昕 石智超 《计算机集成制造系统》 北大核心 2026年第3期1113-1127,共15页
软件测试是确保软件产品质量的关键业务流程,具有高投入、高风险的特点,研究测试实施流程有助于推动测试工作的有序进行,从而保证软件产品质量符合行业标准并降低测试成本。现有研究缺乏对测试流程形式化建模和效能分析方法的探讨,因此... 软件测试是确保软件产品质量的关键业务流程,具有高投入、高风险的特点,研究测试实施流程有助于推动测试工作的有序进行,从而保证软件产品质量符合行业标准并降低测试成本。现有研究缺乏对测试流程形式化建模和效能分析方法的探讨,因此,无法有效识别并评估流程中的关键环节。为解决上述问题,研究结合随机Petri网和模糊理论,提出一种模糊参数的随机Petri网(SPN_FP)建模与分析方法,并以非对称加密算法(RSA)计时攻击任务为场景构建测试流程仿真模型。通过建立与之同构的连续时间马尔可夫链(CTMC)进行性能分析,识别出流程的关键环节。集成Shapley可加性解释(SHAP)的敏感性分析,揭示多环节与系统运行效率之间的影响,为多环节视角下的流程优化与决策支持提供理论依据。结果表明,RSA计时攻击任务和修复软件缺陷是流程中耗时且对系统整体性能影响较大的关键环节,应作为优化的重点。此外,在实现同等系统运行效率提升的前提下,仅提升单一环节的速率相比于协同优化多个环节,会更大程度地牺牲系统鲁棒性,从而影响测试流程的完整性与可靠性。 展开更多
关键词 随机PETRI网 模糊理论 软件测试流程建模 SHAP分析 多环节效能优化
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部