期刊文献+
共找到1,955篇文章
< 1 2 98 >
每页显示 20 50 100
大语言模型安全的技术治理:对抗测试与评估审计 被引量:2
1
作者 周辉 郭烘佑 《西安交通大学学报(社会科学版)》 北大核心 2025年第2期78-88,共11页
人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风... 人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风险,为大语言模型的安全应用提供了关键保障。但是,目前缺少充足的算力保障、技术治理流程和标准缺乏统一性、平台技术治理易受商业利益影响等困境影响了技术治理方案的稳步实施。从优化技术治理框架、鼓励安全治理技术创新、明确流程与标准、构建多方参与的监督机制等方面提出完善安全技术治理机制的建议,以确保大语言模型的稳定与安全运行。 展开更多
关键词 人工智能 大语言模型 安全风险 技术治理 对抗测试 评估审计
在线阅读 下载PDF
基于大语言模型的智能汽车仿真测试
2
作者 朱冰 汤瑞 +4 位作者 赵健 张培兴 李文旭 李嘉胜 徐雪峰 《汽车工程》 北大核心 2025年第4期587-597,共11页
针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语... 针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语言模型的智能汽车仿真测试流程,针对知识问答型任务设计了知识挖掘、模型微调与知识库增强检索应用流程,针对场景生成任务设计了场景类型分析、场景要素生成、场景工具链调用的应用路径,针对测试评价型任务,设计了测试场景解析、评价体系构建与仿真测试执行综合应用框架;最后,对各任务进行了测试。结果证明,本文所提出的测试方法可以有效解决不同类型的测试任务,提升测试效率。 展开更多
关键词 智能汽车 仿真测试 大语言模型 场景生成 自动测试
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
3
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
移动应用GUI测试自动生成技术综述
4
作者 王博 陈冲 +3 位作者 邓明 董震 林友芳 郝丹 《软件学报》 北大核心 2025年第6期2713-2746,共34页
移动应用是近10年来兴起的新型计算模式,深刻地影响人民的生活方式.移动应用主要以图形用户界面(graphical user interface,GUI)方式交互,而对其进行人工测试需要消耗大量人力和物力.为此,研究者提出针对移动应用GUI的测试自动生成技术... 移动应用是近10年来兴起的新型计算模式,深刻地影响人民的生活方式.移动应用主要以图形用户界面(graphical user interface,GUI)方式交互,而对其进行人工测试需要消耗大量人力和物力.为此,研究者提出针对移动应用GUI的测试自动生成技术以提升测试效率并检测潜在缺陷.收集了145篇相关论文,系统地梳理、分析和总结现有工作.提出了“测试生成器-测试环境”研究框架,将该领域的研究按照所属模块进行分类.特别地,依据测试生成器所基于的方法,将现有方法大致分为基于随机、基于启发式搜索、基于模型、基于机器学习和基于测试迁移这5个类别.此外,还从缺陷类别和测试动作等其他分类维度梳理现有方法.收集了该领域中较有影响力的数据集和开源工具.最后,总结当前面临的挑战并展望未来的研究方向. 展开更多
关键词 软件测试 gui测试 测试生成 移动应用测试 安卓应用
在线阅读 下载PDF
大语言模型辅助的网络协议模糊测试 被引量:1
5
作者 颜晨 张翼 +2 位作者 龚汉文 薛吟兴 郭燕 《小型微型计算机系统》 北大核心 2025年第2期403-409,共7页
协议安全是保证互联网应用安全的基础,而模糊测试是验证协议安全的重要手段.协议测试的难点在于必须严格按照协议RFC中规定的结构和顺序生成数据包.为了生成能够满足协议需要的数据包,现有方法通常将一组记录的数据序列作为种子,但所记... 协议安全是保证互联网应用安全的基础,而模糊测试是验证协议安全的重要手段.协议测试的难点在于必须严格按照协议RFC中规定的结构和顺序生成数据包.为了生成能够满足协议需要的数据包,现有方法通常将一组记录的数据序列作为种子,但所记录的数据序列往往存在数量和多样性不足等问题,难以覆盖协议状态,而种子随机变异后的数据极有可能再次失效.为解决这一难题,本文探索了基于大语言模型(LLMs)进行网络协议模糊测试的方法,大语言模型充分理解了包括RFC协议在内的大量协议文本信息,从而获得了理解协议和生成测试所需的用例的能力.本文从状态获取、基于状态的种子生成和定向策略变异三方面,基于AFLNET探索了使用LLM进行网络协议模糊测试的方法 LLMAFL.为测试LLMAFL的效果,本文在ProfuzzBench中针对多项协议的测试,从代码覆盖和状态覆盖两方面,与当前领先的AFLNET和CHATAFL进行了对比,结果表明,相同测试时间内,LLMAFL的代码覆盖和状态覆盖相比AFLNET均有提升,部分协议中的效果也大幅超过了CHATAFL. 展开更多
关键词 网络协议模糊测试 大语言模型 种子生成 定向策略变异
在线阅读 下载PDF
基于电网演化模型的新型输电网测试系统生成方法
6
作者 黎博 魏光瑞 +1 位作者 钟海旺 刘辉 《电力系统自动化》 北大核心 2025年第10期135-144,共10页
IEEE算例已被广泛用于电力系统规划、运行等领域的仿真测试。然而,受限于数据隐私保护,研究人员难以获取实际电力系统发电与网架结构的公开数据集。为此,提出一种基于三代电网演化模型的新型输电网测试系统生成方法,构建反映实际电力系... IEEE算例已被广泛用于电力系统规划、运行等领域的仿真测试。然而,受限于数据隐私保护,研究人员难以获取实际电力系统发电与网架结构的公开数据集。为此,提出一种基于三代电网演化模型的新型输电网测试系统生成方法,构建反映实际电力系统特征的输电网测试算例。首先,建立基于N-1安全校核的输电网扩展规划模型。然后,针对电网不同发展阶段特征设置相应优化目标与约束条件,以模拟电网的演化历程。为提高模型求解效率,建立输电走廊待建线路的二进制表征方法,以减少模型0-1变量。最后,以某省电网为例,构建开源电力测试系统,并根据复杂网络的统计特性验证所构建算例的有效性。此外,将该算例应用于输电网结构优化中以验证算例的合理性。 展开更多
关键词 输电网 扩展规划模型 测试系统 N-1安全约束 电网演化模型
在线阅读 下载PDF
面向测试用例生成的大模型高效微调方法 被引量:1
7
作者 曹鹏 温广琪 +3 位作者 杨金柱 陈刚 刘歆一 季学纯 《计算机应用》 北大核心 2025年第3期725-731,共7页
基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这... 基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这2个挑战。为了解决这些问题,提出将编码风格和功能风格同步迁移微调的思想,并开发一种高效的LLM微调训练方法用于单元测试用例生成。首先,利用广泛使用的指令数据集对LLM进行指令对齐,并按任务类型对指令集分类;同时,提取并存储具有任务特征的权重增量;其次,设计一个自适应风格提取模块,该模块包含抗噪声干扰学习和编码风格回溯学习,以应对不同的代码编写风格;最后,在目标域分别对功能风格增量和编码风格增量进行联合训练,以实现在目标域低资源情况下的高效适配和微调。在SF110 Corpus of Classes数据集上的测试用例生成实验结果表明,所提方法的结果均优于对比方法,与主流代码生成LLM Codex、Code Llama和DeepSeek-Coder相比,所提方法的编译率分别提高0.8%、43.5%和33.8%、分支覆盖率分别提高3.1%、1.0%和17.2%;行覆盖率分别提高4.1%、6.5%和15.5%,验证了所提方法在代码生成任务上的优越性。 展开更多
关键词 单元测试 代码生成 大语言模型 权重增量学习 微调学习
在线阅读 下载PDF
基于大语言模型的模糊测试研究综述
8
作者 李岩 杨文章 +1 位作者 张翼 薛吟兴 《软件学报》 北大核心 2025年第6期2404-2431,共28页
模糊测试是一种自动化的软件测试方法,通过向目标软件系统输入大量自动生成的测试数据,以发现系统潜在的安全漏洞、软件缺陷或异常行为.然而,传统模糊测试技术受限于自动化程度低、测试效率低、代码覆盖率低等因素,无法应对现代的大型... 模糊测试是一种自动化的软件测试方法,通过向目标软件系统输入大量自动生成的测试数据,以发现系统潜在的安全漏洞、软件缺陷或异常行为.然而,传统模糊测试技术受限于自动化程度低、测试效率低、代码覆盖率低等因素,无法应对现代的大型软件系统.近年来,大语言模型的迅猛发展不仅为自然语言处理领域带来重大突破,也为模糊测试领域带来了新的自动化方案.因此,为了更好地提升模糊测试技术的效果,现有的工作提出了多种结合大语言模型的模糊测试方法,涵盖了测试输入生成、缺陷检测、后模糊处理等模块.但是现有工作缺乏对基于大语言模型的模糊测试技术的系统性调研和梳理讨论,为了填补上述综述方面的空白,对现有的基于大语言模型的模糊测试技术的研究发展现状进行全面的分析和总结.主要内容包括:(1)概述模糊测试的整体流程和模糊测试研究中常用的大语言模型相关技术;(2)讨论大模型时代之前的基于深度学习的模糊测试方法的局限性;(3)分析大语言模型在模糊测试方法中不同环节的应用方式;(4)探讨大语言模型技术在模糊测试中的主要挑战和今后可能的发展方向. 展开更多
关键词 大语言模型 模糊测试 测试输入生成 缺陷检测 后模糊处理
在线阅读 下载PDF
深水测试平台地面管道冲蚀速率预测模型 被引量:1
9
作者 李长俊 陈宇恒 +4 位作者 吴瑕 王静 张可欣 张财功 张洋 《中国海上油气》 CAS CSCD 北大核心 2024年第4期212-220,共9页
深水测试平台地面管道易受高压携砂介质冲蚀损伤,准确预测其冲蚀速率,对保障其运维安全具有重要意义,但常用Tulsa冲蚀预测模型主要针对碳钢和铝材,不适用于深水测试平台地面管材为低合金钢AISI4130特殊材质的冲蚀预测。为了扩大Tulsa模... 深水测试平台地面管道易受高压携砂介质冲蚀损伤,准确预测其冲蚀速率,对保障其运维安全具有重要意义,但常用Tulsa冲蚀预测模型主要针对碳钢和铝材,不适用于深水测试平台地面管材为低合金钢AISI4130特殊材质的冲蚀预测。为了扩大Tulsa模型在深水测试平台地面管道冲蚀速率预测的适用性,采用显示动力学方法建立了颗粒冲击靶材的有限元模型,考虑颗粒冲击速度与冲击角度对冲蚀预测模型关键参数的影响,从而改进Tulsa模型中的关键参数,最后将改进后的冲蚀速率预测模型计算结果与文献实验数据以及Tulsa模型计算结果进行了对比。结果表明:①颗粒冲蚀靶材的机理主要是切削和变形磨损,冲蚀速率随颗粒冲击角度增大呈先升高后下降趋势,最大值出现在30°;冲击速度增加引起冲蚀速率呈幂函数升高;②通过模拟颗粒多角度冲击靶材的情况,得到了更加准确的颗粒冲击靶材的分段多项式函数,相较原Tulsa模型仅通过10°与15°两种冲击角度试验,拓宽了Tulsa模型在深水测试平台地面管道冲蚀速率预测的适用性,其中分段角度为30°,与冲蚀速率最大值出现在30°的冲击角度相对应;③颗粒冲击速度较大时(大于10m/s),改进后的预测模型计算结果优于Tulsa模型计算结果,且相对误差随冲击速度的升高而减小,表明本文预测模型适用于深水测试平台介质高速流动的实际工况。 展开更多
关键词 深水测试平台 管道冲蚀 Tulsa模型 有限元分析 冲蚀速率预测模型 影响参数
在线阅读 下载PDF
GUI测试中多级形态模型的分割与应用
10
作者 王皓亮 高建华 《计算机科学》 CSCD 北大核心 2017年第9期190-194,199,共6页
基于模型的GUI测试方法(MBGT)可自动化生成测试用例,在MBGT中引入多级形态模型(Multilevel Morphology Model,MMM)可以实现从不同的形态角度考察系统,可控地提高模型的错误检测效力。但多级形态模型只能整体扩展到高阶,且随着模型的扩展... 基于模型的GUI测试方法(MBGT)可自动化生成测试用例,在MBGT中引入多级形态模型(Multilevel Morphology Model,MMM)可以实现从不同的形态角度考察系统,可控地提高模型的错误检测效力。但多级形态模型只能整体扩展到高阶,且随着模型的扩展,测试用例的长度与数量急剧增长,极大地影响了测试效率。对此提出一种可进行局部扩展的多级形态模型的分割方法以及相应的测试用例生成策略。该方法通过GUI事件的分类,实现了对基础模型的分割与化简,并采用广度优先搜索(BFS)与中国邮递员问题(CPP)求解算法生成测试用例。该方法使得GUI模型的表达更为清晰直观,在有效区分测试重点的同时,缩小了测试集规模,极大地提高了多级形态模型在GUI测试中的灵活性与测试效率。实验证明,经模型分割后的多级形态模型具有与未分割模型基本等同的错误检测效力,且随着模型级数的提高,模型分割对测试效率的提升增大。 展开更多
关键词 gui测试 基于模型的gui测试 多级形态模型
在线阅读 下载PDF
面向车载相机采集图像的智能汽车测试场景关键性量化模型
11
作者 朱冰 黄殷梓 +2 位作者 赵健 张培兴 薛经纬 《汽车工程》 EI CSCD 北大核心 2024年第4期557-563,576,共8页
车载相机图像是构建智能汽车测试场景库的主要数据来源,但其中关键测试场景发生概率低,大部分场景的测试价值小,若将其直接应用于智能汽车测试会浪费大量测试资源。本文提出一种面向车载相机采集图像的智能汽车测试场景关键性量化模型... 车载相机图像是构建智能汽车测试场景库的主要数据来源,但其中关键测试场景发生概率低,大部分场景的测试价值小,若将其直接应用于智能汽车测试会浪费大量测试资源。本文提出一种面向车载相机采集图像的智能汽车测试场景关键性量化模型。首先,基于实车相机参数对实车采集的图像进行处理,输出对行车安全具有影响的参数;其次,基于风险场理论将参数整合,输出测试场景关键性量化结果;最后,对实车采集的图像进行测试场景关键性量化验证,结果表明本文模型可以精确输出测试场景关键性的具体数值,进而对比不同场景的测试价值,证明本文提出的模型可以有效筛选智能汽车关键测试场景。 展开更多
关键词 智能汽车 测试场景 关键性量化模型 车载相机图像 风险场理论
在线阅读 下载PDF
直流充电桩快速变化波形模态的动态电能参比测试信号建模 被引量:2
12
作者 王学伟 李松竹 +3 位作者 袁瑞铭 焦东翔 巨汉基 孟静 《电网技术》 北大核心 2025年第2期759-770,I0102,共13页
针对直流充电桩快速变化直流电流和电压的波形模态描述尚不完善、可用样本数据不足、波形特性不清楚、缺少波形模态数学模型的问题,首先,建立充电桩直流电流和电压信号的离散随机数学模型和时频域表征模型;然后,针对实测充电直流信号,提... 针对直流充电桩快速变化直流电流和电压的波形模态描述尚不完善、可用样本数据不足、波形特性不清楚、缺少波形模态数学模型的问题,首先,建立充电桩直流电流和电压信号的离散随机数学模型和时频域表征模型;然后,针对实测充电直流信号,提取30种波形模态,提出三大类波形模态及其对应的特征参量,并据此建立三大类波形模态的波形特征库;其次,采用时频原子的方法建立3类波形模态的数学模型,给出实际波形对应的人工测试信号模型,解决了反映实际波形模态重要波形特征问题;最后,提出构建测试电能表计量误差的直流信号参比模型的原则,据此,建立动态电能计量参比测试信号模型,表征了动态直流测试信号的特征信息,用于提升直流电能表动态试验和改进直流电能表的测试标准。 展开更多
关键词 直流充电桩 快速变化波形模态 波形特征参量 动态电能 参比测试信号模型
在线阅读 下载PDF
基于虚拟仿真模型的轻型车在用RDE排放预测
13
作者 苏庆鹏 赵华 +2 位作者 胡雨馨 张帆 裴毅强 《内燃机学报》 北大核心 2025年第1期55-63,共9页
为进一步准确预测在用乘用车实时驾驶排放,搭建了以发动机-后处理虚拟仿真为核心的在用排放预测模型.首先建立了发动机一维模型,与稳态和瞬态发动机原排测试数据进行了对比和标定.结果表明:在用实际行驶排放测试(RDE)工况下,CO和NO的原... 为进一步准确预测在用乘用车实时驾驶排放,搭建了以发动机-后处理虚拟仿真为核心的在用排放预测模型.首先建立了发动机一维模型,与稳态和瞬态发动机原排测试数据进行了对比和标定.结果表明:在用实际行驶排放测试(RDE)工况下,CO和NO的原排累积质量相对误差分别为9.2%、5.8%;其次进行后处理性能试验,对后处理温度、起燃和老化模型进行标定验证,在全球轻型车测试循环工况(WLTC)前35 s,三元催化转化器轴向最大温度误差为52℃,CO、NO的排放累积质量误差为0.0385 g(5.90%)和0.0011 g(0.75%);最后利用RDE排放预测模型在不同催化器老化状态下,进行WLTC、RDE和95%分位的激烈驾驶参考循环(RTS-95)工况的排放规律探究.研究发现:NO排放对工况更加敏感,超限风险更高.设定NO瞬时质量排放阈值为8 mg/s,以RTS-95循环在分散因子为0.6条件下的NO仿真结果为例,对催化器分散因子进行预警窗口宽度探究,结果表明:增加预警窗口宽度将会降低误判率和冷启动超限的识别概率. 展开更多
关键词 虚拟仿真模型 催化转化器老化 在用实际行驶排放测试 排放预测
在线阅读 下载PDF
GPT-4大语言模型对护理知识理解的测试研究 被引量:3
14
作者 徐文博 陈凤敏 +2 位作者 王超 陈洁 侯辉 《护理学杂志》 CSCD 北大核心 2024年第19期93-96,共4页
目的探讨GPT-4大语言模型在护理教育中的应用潜力。方法选用GPT-4对主管护师考试真题进行量化测试,并对答案准确率进行分类评价。结果GPT-4的整体准确率为81.00%。在知识记忆和简单选项题目上准确率较高,分别为82.64%和82.52%;在解答知... 目的探讨GPT-4大语言模型在护理教育中的应用潜力。方法选用GPT-4对主管护师考试真题进行量化测试,并对答案准确率进行分类评价。结果GPT-4的整体准确率为81.00%。在知识记忆和简单选项题目上准确率较高,分别为82.64%和82.52%;在解答知识应用和复杂选项题目时,GPT-4的准确率较低,分别为76.60%和70.97%。结论GPT-4展现出作为护理教学和临床护理辅助工具的巨大潜力。未来研究应探索如何将大语言模型与外部知识源结合并创新应用方法,提升大模型生成内容的准确性。同时,护理教育工作者还应积极探索大模型提升学生自学能力和自我评价能力的方法。 展开更多
关键词 大语言模型 人工智能 GPT-4 护理教育 护理教学 护理知识 试题 测试
在线阅读 下载PDF
引黄济青明渠段输水控制系统的MIL测试系统设计与实现
15
作者 何立新 曹辰宇 +2 位作者 张峥 雷晓辉 李翔 《南水北调与水利科技(中英文)》 北大核心 2025年第1期1-9,58,共10页
针对现有输水工程中闸泵站控制模型测试体系不完善的问题展开探索,旨在进一步提升渠道输水控制模型在不同工况下的准确性和稳定性,以确保输水工程现场的安全与高效运行。将引黄济青工程明渠段作为研究区,将渠道输水控制系统中的控制模... 针对现有输水工程中闸泵站控制模型测试体系不完善的问题展开探索,旨在进一步提升渠道输水控制模型在不同工况下的准确性和稳定性,以确保输水工程现场的安全与高效运行。将引黄济青工程明渠段作为研究区,将渠道输水控制系统中的控制模型作为测试对象,并基于LabVIEW(laboratory virtual instrument engineering workbench)开发系统组态,以水动力模型作为环境仿真模型,搭建模型在环(model-in-the-loop,MIL)测试系统,实现了闭环测试,验证所开发模型在环仿真系统和模型开发阶段对模型进行测试的可行性。本研究为渠道输水工程领域内的控制模型开发与测试工作提供关键的技术支撑,为提升输水工程的运行效率及增强其安全性奠定了坚实的基础。 展开更多
关键词 渠道输水 模型在环(MIL)测试 水动力数值模拟 控制系统 LABVIEW
在线阅读 下载PDF
基于自然语言需求的SCADE模型测试用例自动生成方法 被引量:1
16
作者 邵温欣 杨志斌 +1 位作者 李维 周勇 《计算机科学》 CSCD 北大核心 2024年第7期29-39,共11页
随着安全关键软件规模和复杂性不断增加,模型驱动开发方法在安全关键领域得到了广泛应用。SCADE作为一种重要的建模方法和工具,能够表达确定性并发行为且具有精确时间语义等特性,适用于安全关键软件的建模、测试与验证。目前,已有方法... 随着安全关键软件规模和复杂性不断增加,模型驱动开发方法在安全关键领域得到了广泛应用。SCADE作为一种重要的建模方法和工具,能够表达确定性并发行为且具有精确时间语义等特性,适用于安全关键软件的建模、测试与验证。目前,已有方法主要采用手工方式构造SCADE模型测试用例,存在需求与测试用例不一致、成本代价高且容易出错的问题。文中提出了一种基于自然语言需求的SCADE模型测试用例自动生成方法。首先,给出了基于模型检测的测试用例自动生成方法,通过自然语言需求处理生成原子命题,用于生成前提假设Assume和观察者模型,同时给出了陷阱性质(Trap Properties)生成规则来生成陷阱性质用于模型检测;其次,给出了基于覆盖分析和变异测试的测试用例质量评估方法,并在SCADE模型上进行变异测试;最后,设计和实现了原型工具,并基于一个工业界案例飞行员弹射座椅控制系统进行了案例分析,验证了所提方法的有效性。 展开更多
关键词 安全关键软件 模型驱动开发 SCADE 测试用例自动生成 模型检测
在线阅读 下载PDF
基于混合模型修正的在役海洋钻机井架实时承载能力评估
17
作者 闫天红 周国强 董浩轩 《天然气工业》 北大核心 2025年第6期170-181,共12页
随着海上油气资源勘探开发的不断深入,在役钻机井架作业安全就显得尤为重要。由于钻机井架面临海洋环境腐蚀、结构损伤及苛刻钻井作业条件,在役海洋钻机井架不可避免出现结构损伤和性能退化,进而降低承载能力并可能导致耐久性失效,给海... 随着海上油气资源勘探开发的不断深入,在役钻机井架作业安全就显得尤为重要。由于钻机井架面临海洋环境腐蚀、结构损伤及苛刻钻井作业条件,在役海洋钻机井架不可避免出现结构损伤和性能退化,进而降低承载能力并可能导致耐久性失效,给海洋钻井作业带来巨大风险,实时评估井架实际承载能力已迫在眉睫。为此,基于测试模型实测数据与有限元模型计算数据相关性分析建立了贝叶斯模型修正方法,形成了基于混合模型修正的海洋钻机井架承载能力实时评估方法,并开发了集钻井载荷—应变测试—振动测试一体化的海洋钻机井架结构响应测试系统,最后以南海某平台海洋钻机井架结构损伤识别算例,验证了该算法的可靠性。研究结果表明:①井架测试模型实测响应与有限元模型计算响应相关性分析可以实现测点与节点匹配、实测响应与计算响应匹配;②基于实测模态参数与应变的混合有限元模型修正建立的在役钻机井架测评基准模型进一步减小了计算数据与实测数据的误差,实测频率与计算频率最大误差由模型修正前的34.35%降低为0.56%,实测应变与计算应变最大误差由模型修正前的53.7%降低为13.3%;③经现场实测响应与计算响应相关性分析的混合模型修正,按照评估准则海上钻机实例井架承载力下降8.44%。结论认为,形成的在役钻机井架性能退化及承载能力评估技术解决了原有单一工况测点值线性外推评估方法难以满足复杂工况带来的不确定性问题,该方法对于准确评估海上在役钻机井架实际承载能力具有重要借鉴和指导意义。 展开更多
关键词 海洋钻机井架 响应测试与数值计算 相关性分析 混合模型修正 承载能力评估
在线阅读 下载PDF
如何测试ChatGPT的语义理解与常识推理水平?——兼谈大语言模型时代语言学的挑战与机会 被引量:16
18
作者 袁毓林 《语言战略研究》 CSSCI 北大核心 2024年第1期49-63,共15页
ChatGPT等大语言模型在语义理解和常识推理方面表现优秀,其技术奥秘在于模型开发者在对词语进行向量表示时,遵循分布式语义学原理,采用了“嵌入”这种代数方法。但是,经典的测试语言运用等智能水平的“图灵测试”,难以识别欺骗和回避等... ChatGPT等大语言模型在语义理解和常识推理方面表现优秀,其技术奥秘在于模型开发者在对词语进行向量表示时,遵循分布式语义学原理,采用了“嵌入”这种代数方法。但是,经典的测试语言运用等智能水平的“图灵测试”,难以识别欺骗和回避等作弊手段,因此,计算机科学家设计了“新图灵测试”,其中的威诺格拉德模式挑战与语言学关系密切。这一模式以代词消歧为测试点设计句子对和问题,但是经过大规模语料训练的语言模型可以凭借词汇上的统计相关性,而不是靠真正理解句子的意义来给出正确答案。为克服这一缺陷,学者们又发展出WinoGrande数据集,提高了数据的规模和难度,确保它们无法通过网络搜索等手段来得到正确答案。我们用威诺格拉德模式设计了无偏向双重句子对测试ChatGPT,展示了大语言模型在语义理解和常识推理方面已达到接近人类的水平。当然,从具身模拟假说来看,大语言模型不可能像人一样富有体验性地理解人类自然语言。最后,我们呼吁:语言学家应该积极参与构建WinoGrade测试集之类的工作,在人工智能时代扩展自身的学术研究领域。 展开更多
关键词 ChatGPT 大语言模型 新图灵测试 威诺格拉德模式挑战 WinoGrande数据集
在线阅读 下载PDF
基于EBAPS的光响应非均匀性测试方法研究
19
作者 刘秀娟 杨晔 +1 位作者 郑舟 刘欢 《应用光学》 北大核心 2025年第3期682-688,共7页
电子轰击有源像素传感器(electron bombardment active pixel sensor,EBAPS)的光响应非均匀性是指EBAPS中光电阴极被均匀光源照射时,不同像素输出灰度不一致的现象,尤其是在低光环境下,图像的非均匀性会使细节识别变得困难,影响后续图... 电子轰击有源像素传感器(electron bombardment active pixel sensor,EBAPS)的光响应非均匀性是指EBAPS中光电阴极被均匀光源照射时,不同像素输出灰度不一致的现象,尤其是在低光环境下,图像的非均匀性会使细节识别变得困难,影响后续图像处理和分析的准确性。光响应非均匀性主要由光电阴极不同区域对光响应的差异、电子敏感互补金属氧化物半导体不同区域的电子倍增特性差异、各像素间对同一激励的响应差异以及读出电路中传输信道的差异性等因素导致。针对EBAPS的非均匀性问题,提出了一种基于EBAPS光电阴极响应、电子倍增以及像素响应非均匀性协同适配的测试方法。实验结果表明,该方法能够有效评价EBAPS的非均匀性,并且能够对器件的测试筛选和算法校正起到指导作用。 展开更多
关键词 电子轰击有源像素传感器 非均匀性 光响应 测试方法 测试模型
在线阅读 下载PDF
云边端内核竞态漏洞大模型分析方法研究
20
作者 陈平 骆明宇 《信息网络安全》 北大核心 2025年第7期1007-1020,共14页
随着云边端场景的广泛应用,操作系统内核竞态条件检测面临新的挑战,其复杂性日益提升。针对这一问题,文章提出一种基于大语言模型的内核竞态条件分析方法Log Fuzz。该方法通过知识注入机制,实现对系统调用依赖关系的动态学习与精准分析... 随着云边端场景的广泛应用,操作系统内核竞态条件检测面临新的挑战,其复杂性日益提升。针对这一问题,文章提出一种基于大语言模型的内核竞态条件分析方法Log Fuzz。该方法通过知识注入机制,实现对系统调用依赖关系的动态学习与精准分析,有效缓解云边端环境下内核漏洞分析的难题。研究首先利用崩溃日志进行系统调用模式提取与分析,解决传统方法在复杂依赖关系建模中的局限性。在此基础上,引入大语言模型的领域知识,通过参数高效微调框架深度挖掘系统调用的语义与语法特征,指导模糊测试。实验结果表明,在Linux内核测试中,文章所提方法在18 h后的分支覆盖率较传统方法提升3.31%,并成功触发7个系统崩溃。该方法有助于提升系统安全,为云边端内核竞态条件检测提供一种技术路径。 展开更多
关键词 内核竞态条件 系统调用序列 模糊测试 大语言模型 云边端安全
在线阅读 下载PDF
上一页 1 2 98 下一页 到第
使用帮助 返回顶部