期刊文献+
共找到328篇文章
< 1 2 17 >
每页显示 20 50 100
Key Elements to a Valid Language Test
1
作者 王彦 《陕西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2001年第S1期303-305,共3页
In developing and using measures of Language abilities, the most important consideration is the use of a language test, so that the most important quality of a test is its usefulness. A model of test usefulness is reg... In developing and using measures of Language abilities, the most important consideration is the use of a language test, so that the most important quality of a test is its usefulness. A model of test usefulness is regarded as the essential basis for quality control throughout the entire test development process. A model of test usefulness includes following qualities--validity, reliability, discrimination and backwash effects. 展开更多
关键词 ENGLISH TEACHING language STUDY language test
在线阅读 下载PDF
Design and Implementation of Test Flow Description Language
2
作者 孟晨 王成 杨锁昌 《Defence Technology(防务技术)》 SCIE EI CAS 2009年第2期158-160,共3页
A test flow description language is designed for the description of test flow.The design concept,composition,program structure and syntax structure of statement are presented.The development and impletementation proce... A test flow description language is designed for the description of test flow.The design concept,composition,program structure and syntax structure of statement are presented.The development and impletementation processes of the language are also described.This language is independent of hardware,which can be used for different platforms,and can be extended.The language is used to describe the test flow easily.It simplifies the development process of test software and reduces the difficulty of software maintenance greatly. 展开更多
关键词 描述语言 测试流程 设计概念 语法结构 程序结构 测试软件 开发过程 软件维护
在线阅读 下载PDF
基于大语言模型的智能汽车仿真测试 被引量:2
3
作者 朱冰 汤瑞 +4 位作者 赵健 张培兴 李文旭 李嘉胜 徐雪峰 《汽车工程》 北大核心 2025年第4期587-597,共11页
针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语... 针对现有智能汽车基于场景测试方法严重依赖人力、效率瓶颈凸显的问题,本文提出了一种基于大语言模型的智能汽车仿真测试方法。首先,设计基于大语言模型的智能汽车仿真测试架构,建立了对应的数据层和仿真层;在此基础上,构建了基于大语言模型的智能汽车仿真测试流程,针对知识问答型任务设计了知识挖掘、模型微调与知识库增强检索应用流程,针对场景生成任务设计了场景类型分析、场景要素生成、场景工具链调用的应用路径,针对测试评价型任务,设计了测试场景解析、评价体系构建与仿真测试执行综合应用框架;最后,对各任务进行了测试。结果证明,本文所提出的测试方法可以有效解决不同类型的测试任务,提升测试效率。 展开更多
关键词 智能汽车 仿真测试 大语言模型 场景生成 自动测试
在线阅读 下载PDF
基于认知诊断与大模型优化遗传算法的自动组卷方法 被引量:1
4
作者 刘凡 崔金凤 +1 位作者 吴铭 沈荣 《实验技术与管理》 北大核心 2025年第4期233-238,共6页
为了提高教师组卷的质量及教学效率,优化教学资源,国内外许多学者对自动组卷技术进行了深入的研究。传统的自动组卷算法并未考虑班级整体认知水平,且组卷效率低,组卷质量参差不齐,影响了对学生学习效果的正确评估。针对以上问题,该文提... 为了提高教师组卷的质量及教学效率,优化教学资源,国内外许多学者对自动组卷技术进行了深入的研究。传统的自动组卷算法并未考虑班级整体认知水平,且组卷效率低,组卷质量参差不齐,影响了对学生学习效果的正确评估。针对以上问题,该文提出了基于认知诊断与大模型优化遗传算法的自动组卷方法。首先借助预训练大模型所具备的强大数据处理和分析能力,提出了利用大语言模型的微调技术和问答机制进行自动组卷,通过实验选择在7B(7 Billion)参数规模的Qwen大模型上使用Q-LoRA微调进行自动组卷,可以高效率地生成试卷。同时,提出基于认知诊断与大模型优化遗传算法的自动组卷方法提升试卷质量,利用Qwen大模型生成的试卷作为初始种群,并且设计组卷适应度计算方法,采用“精英保留”的思想设计遗传算子,改进选择、交叉、变异算子的设计,始终保留种群中最好的个体。实验结果显示,传统遗传算法组卷需要34.586 s,成功率为83%,大模型自动组卷算法则能在8.565 s内完成,但成功率略降至81%。相比之下,该文提出的基于认知诊断与大模型优化的遗传算法自动组卷方法,不仅将组卷效率大幅提升至0.673 s,而且成功率高达100%,完全满足了实际应用的需求。这一方法显著优于前述两种算法,展现出在效率和成功率上的双重优势。 展开更多
关键词 自动组卷 认知诊断 大语言模型 遗传算法
在线阅读 下载PDF
一种基于高阶测试语言的虚实融合测试方法
5
作者 孙波 李雪瑶 金钊 《航天器工程》 北大核心 2025年第5期149-158,共10页
针对传统方法环境单一、数据调度难、自动化低、跨域适配弱等问题,文章提出基于高阶测试语言的虚实融合测试方法。该方法通过脚本化语言对测试流程进行统一建模与资源调度,使仿真模型、传感器仿真与物理设备在同一框架下协同运行。依托... 针对传统方法环境单一、数据调度难、自动化低、跨域适配弱等问题,文章提出基于高阶测试语言的虚实融合测试方法。该方法通过脚本化语言对测试流程进行统一建模与资源调度,使仿真模型、传感器仿真与物理设备在同一框架下协同运行。依托该语言,构建了虚实融合测试平台,设计了测试语句集和执行机制,并以月球车避障任务为例,展示了方法在复杂环境下的应用效果。结果表明:该方法提高了测试的自动化水平和跨域适配能力,为智能无人系统的验证提供了可扩展的技术路径。 展开更多
关键词 高阶测试语言 虚实融合 智能装备 自动化测试
在线阅读 下载PDF
云边端内核竞态漏洞大模型分析方法研究
6
作者 陈平 骆明宇 《信息网络安全》 北大核心 2025年第7期1007-1020,共14页
随着云边端场景的广泛应用,操作系统内核竞态条件检测面临新的挑战,其复杂性日益提升。针对这一问题,文章提出一种基于大语言模型的内核竞态条件分析方法Log Fuzz。该方法通过知识注入机制,实现对系统调用依赖关系的动态学习与精准分析... 随着云边端场景的广泛应用,操作系统内核竞态条件检测面临新的挑战,其复杂性日益提升。针对这一问题,文章提出一种基于大语言模型的内核竞态条件分析方法Log Fuzz。该方法通过知识注入机制,实现对系统调用依赖关系的动态学习与精准分析,有效缓解云边端环境下内核漏洞分析的难题。研究首先利用崩溃日志进行系统调用模式提取与分析,解决传统方法在复杂依赖关系建模中的局限性。在此基础上,引入大语言模型的领域知识,通过参数高效微调框架深度挖掘系统调用的语义与语法特征,指导模糊测试。实验结果表明,在Linux内核测试中,文章所提方法在18 h后的分支覆盖率较传统方法提升3.31%,并成功触发7个系统崩溃。该方法有助于提升系统安全,为云边端内核竞态条件检测提供一种技术路径。 展开更多
关键词 内核竞态条件 系统调用序列 模糊测试 大语言模型 云边端安全
在线阅读 下载PDF
基于大语言模型的C程序单元测试方法 被引量:1
7
作者 李博诺 王博 +4 位作者 陈明达 林友芳 江云松 陈睿 李鹏宇 《空间控制技术与应用》 北大核心 2025年第1期115-122,共8页
单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近... 单元测试用于检验软件单一模块的功能是否正确,是软件开发过程中的重要步骤,可以及时发现代码中的缺陷,提升软件的质量和可信度.由于手动编写单元测试费时费力,经常遗漏覆盖重要的代码逻辑.为此,研究者提出单元测试用例自动生成技术.近来,预训练大语言模型(large language models,LLM)已经广泛应用于代码生成相关任务.然而,当前在重要的系统级编程语言C上,还没有相关工作.为了填补这一空白,本文面向C程序设计并实现了基于LLM的单元测试用例生成方法LLM4CUTCG.该方法结合LLM多智能体交互和程序分析技术,客服了LLM内在问题.为了验证方法效果,收集了125个C语言目标程序,并针对这些程序生成测试用例.实验结果表明,LLM4CUTCG生成的测试行覆盖率为91.71%,测试预言正确率为50.05%.其覆盖率优于传统方法符号执行. 展开更多
关键词 软件测试 单元测试 测试自动生成 代码自动生成 大语言模型 测试预言
在线阅读 下载PDF
智能化芯片设计程序测试研究综述 被引量:1
8
作者 李晓鹏 闫明 +5 位作者 樊兴宇 唐振韬 开昰雄 郝建业 袁明轩 陈俊洁 《软件学报》 北大核心 2025年第6期2453-2476,共24页
在当今智能化的时代背景下,芯片作为智能电子设备的核心组件,在人工智能、物联网、5G通信等诸多领域发挥着关键作用,保障芯片的正确性、安全性和可靠性至关重要.在芯片的开发流程中,开发人员首先需要利用硬件描述语言,将芯片设计实现成... 在当今智能化的时代背景下,芯片作为智能电子设备的核心组件,在人工智能、物联网、5G通信等诸多领域发挥着关键作用,保障芯片的正确性、安全性和可靠性至关重要.在芯片的开发流程中,开发人员首先需要利用硬件描述语言,将芯片设计实现成软件形式(即芯片设计程序),然后再进行物理设计并最终流片(即生产制造).作为芯片设计制造的基础,芯片设计程序的质量直接影响了芯片的质量.因此,针对芯片设计程序的测试具有重要研究意义.早期的芯片设计程序测试方法主要依赖开发人员人工设计测试用例来测试芯片设计程序,往往需要大量的人工成本和时间代价.随着芯片设计程序复杂度的日益增长,诸多基于仿真的自动化芯片设计程序测试方法被提出,提升了芯片设计程序测试效率及有效性.近年来,越来越多的研究者致力于将机器学习、深度学习和大语言模型(LLM)等智能化方法应用于芯片设计程序测试领域.调研88篇智能化芯片设计程序测试相关的学术论文,从测试输入生成、测试预言构造及测试执行优化这3个角度对智能化芯片设计程序测试已有成果进行整理归纳,重点梳理芯片设计程序测试方法从机器学习阶段、深度学习阶段到大语言模型阶段的演化,探讨不同阶段方法在提高测试效率和覆盖率、降低测试成本等方面的潜力.同时,介绍芯片设计程序测试领域的研究数据集和工具,并展望未来的发展方向和挑战. 展开更多
关键词 芯片设计程序测试 大语言模型 测试用例生成
在线阅读 下载PDF
基于大语言模型的模糊测试研究综述 被引量:1
9
作者 李岩 杨文章 +1 位作者 张翼 薛吟兴 《软件学报》 北大核心 2025年第6期2404-2431,共28页
模糊测试是一种自动化的软件测试方法,通过向目标软件系统输入大量自动生成的测试数据,以发现系统潜在的安全漏洞、软件缺陷或异常行为.然而,传统模糊测试技术受限于自动化程度低、测试效率低、代码覆盖率低等因素,无法应对现代的大型... 模糊测试是一种自动化的软件测试方法,通过向目标软件系统输入大量自动生成的测试数据,以发现系统潜在的安全漏洞、软件缺陷或异常行为.然而,传统模糊测试技术受限于自动化程度低、测试效率低、代码覆盖率低等因素,无法应对现代的大型软件系统.近年来,大语言模型的迅猛发展不仅为自然语言处理领域带来重大突破,也为模糊测试领域带来了新的自动化方案.因此,为了更好地提升模糊测试技术的效果,现有的工作提出了多种结合大语言模型的模糊测试方法,涵盖了测试输入生成、缺陷检测、后模糊处理等模块.但是现有工作缺乏对基于大语言模型的模糊测试技术的系统性调研和梳理讨论,为了填补上述综述方面的空白,对现有的基于大语言模型的模糊测试技术的研究发展现状进行全面的分析和总结.主要内容包括:(1)概述模糊测试的整体流程和模糊测试研究中常用的大语言模型相关技术;(2)讨论大模型时代之前的基于深度学习的模糊测试方法的局限性;(3)分析大语言模型在模糊测试方法中不同环节的应用方式;(4)探讨大语言模型技术在模糊测试中的主要挑战和今后可能的发展方向. 展开更多
关键词 大语言模型 模糊测试 测试输入生成 缺陷检测 后模糊处理
在线阅读 下载PDF
题目自动生成的技术革新与现实挑战
10
作者 韩雨婷 王文轩 +1 位作者 刘红云 游晓锋 《心理科学进展》 北大核心 2025年第10期1766-1782,I0001-I0007,共24页
题目自动生成(Automatic Item Generation,AIG)技术通过自动化生成测验题目,旨在解决心理与教育测验中题目开发成本高、效率低、维护困难和安全风险等问题。该技术经历了从规则驱动方法到大语言模型(Large Language Model,LLM)的演进历... 题目自动生成(Automatic Item Generation,AIG)技术通过自动化生成测验题目,旨在解决心理与教育测验中题目开发成本高、效率低、维护困难和安全风险等问题。该技术经历了从规则驱动方法到大语言模型(Large Language Model,LLM)的演进历程,虽显著提升了生成效率与内容多样性,但在应用过程中面临专业知识表达准确性、文化公平性与构念效度、多模态内容生成、开放性题目发展、智能化质量控制、资源环境适应及技术可访问性等现实挑战。针对这些挑战,有效应对策略包括检索增强生成技术和多模态生成模型应用、多阶段心理测量学验证、云算力资源整合及用户友好型系统开发等。这些方法为提升自动生成题目的科学性与实用性提供了可行路径。 展开更多
关键词 题目自动生成 心理与教育测量 大语言模型 知识增强技术 测验质量
在线阅读 下载PDF
面向联锁功能测试的模型转换方法
11
作者 叶晨雨 梁志国 +2 位作者 张宏扬 齐志华 王海峰 《铁道学报》 北大核心 2025年第11期127-135,共9页
基于模型的测试是保障计算机联锁系统质量的自动化测试手段。为解决基于模型的测试中形式化建模的问题,提出一种基于模型转换间接构建联锁测试模型的方法。采用直观易理解的统一建模语言(UML)序列图对进路处理功能建模,描述联锁软件子... 基于模型的测试是保障计算机联锁系统质量的自动化测试手段。为解决基于模型的测试中形式化建模的问题,提出一种基于模型转换间接构建联锁测试模型的方法。采用直观易理解的统一建模语言(UML)序列图对进路处理功能建模,描述联锁软件子模块之间的交互以及联锁条件的执行顺序;采用ATLAS转换语言将UML序列图转换为分层时间自动机,得到形式化的联锁功能模型;将分层时间自动机导入UPPAAL工具生成测试用例。研究结果表明,该方法具备通用性,可以实现多个联锁功能模型的自动化转换,生成有效的联锁测试用例,且测试用例覆盖了UML序列图的所有场景。 展开更多
关键词 模型转换 计算机联锁 基于模型的测试 UML序列图 自动机
在线阅读 下载PDF
面向测试用例生成的大模型高效微调方法 被引量:1
12
作者 曹鹏 温广琪 +3 位作者 杨金柱 陈刚 刘歆一 季学纯 《计算机应用》 北大核心 2025年第3期725-731,共7页
基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这... 基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题,难以应对日益增长的测试需求。大语言模型(LLM)在代码生成任务中显示了极大的潜力,然而由于代码数据的功能风格和编码风格的差异,LLM面临灾难性遗忘和资源受限这2个挑战。为了解决这些问题,提出将编码风格和功能风格同步迁移微调的思想,并开发一种高效的LLM微调训练方法用于单元测试用例生成。首先,利用广泛使用的指令数据集对LLM进行指令对齐,并按任务类型对指令集分类;同时,提取并存储具有任务特征的权重增量;其次,设计一个自适应风格提取模块,该模块包含抗噪声干扰学习和编码风格回溯学习,以应对不同的代码编写风格;最后,在目标域分别对功能风格增量和编码风格增量进行联合训练,以实现在目标域低资源情况下的高效适配和微调。在SF110 Corpus of Classes数据集上的测试用例生成实验结果表明,所提方法的结果均优于对比方法,与主流代码生成LLM Codex、Code Llama和DeepSeek-Coder相比,所提方法的编译率分别提高0.8%、43.5%和33.8%、分支覆盖率分别提高3.1%、1.0%和17.2%;行覆盖率分别提高4.1%、6.5%和15.5%,验证了所提方法在代码生成任务上的优越性。 展开更多
关键词 单元测试 代码生成 大语言模型 权重增量学习 微调学习
在线阅读 下载PDF
FADEC软件需求形式化建模与测试用例生成的实例研究
13
作者 董泽华 胡军 +3 位作者 沈翔宇 熊波 董亚炯 戴嘉磊 《南京航空航天大学学报(自然科学版)》 北大核心 2025年第5期999-1012,共14页
研发具有安全关键特征的全权限数字化发动机控制(Full authority digital engine control,FADEC)软件是当前大飞机航空发动机控制系统研制的重要任务。本文工作面向大飞机FADEC软件研发中的需求分析与测试挑战,基于变量关系模型(Variabl... 研发具有安全关键特征的全权限数字化发动机控制(Full authority digital engine control,FADEC)软件是当前大飞机航空发动机控制系统研制的重要任务。本文工作面向大飞机FADEC软件研发中的需求分析与测试挑战,基于变量关系模型(Variable relation model,VRM)提出了对条目化自然语言描述的FADEC软件需求形式化建模、分析和基于模型测试用例生成的技术方法,并对FADEC中启动燃油控制软件(Start fuel control,SFC)功能实例进行了研究。研究包括对FADEC自然语言需求文档开展结构化预处理,生成领域概念库;通过需求规范化生成形式化建模框架;基于变量关系模型开展多范式的分析;基于需求模型自动生成测试用例;对FADEC需求建模分析中的领域特征问题进行总结分析等。本文对FADEC软件需求提供了建模与测试的工程经验。 展开更多
关键词 计算机软件与理论 机载软件形式化建模 变量关系模型 自然语言需求建模 测试用例自动生成
在线阅读 下载PDF
QAAttack:基于文本特征分析的问答系统模糊测试方法
14
作者 符海阔 乔塬心 +2 位作者 陈菁菁 崔展齐 王志伟 《计算机工程与应用》 北大核心 2025年第20期194-205,共12页
传统问答系统测试方法依赖预先标注的数据集,但人工标注成本较高,且某些测试场景中通常缺少标注数据。为应对这一问题,研究人员提出通过构建蜕变关系生成测试数据以评估系统鲁棒性。然而,现有方法在测试用例生成过程中缺乏测试指导和选... 传统问答系统测试方法依赖预先标注的数据集,但人工标注成本较高,且某些测试场景中通常缺少标注数据。为应对这一问题,研究人员提出通过构建蜕变关系生成测试数据以评估系统鲁棒性。然而,现有方法在测试用例生成过程中缺乏测试指导和选择策略,导致生成大量冗余或无效的测试数据,可能影响测试结果有效性。针对上述问题,提出基于文本特征分析的问答系统模糊测试方法QAAttack,采用多种蜕变关系进行种子变异,计算问题句中单词的TF-IDF分数以确定优先变异顺序,并引入基于答案语义相似度的种子选择策略,在每轮迭代中优先选择最可能触发系统错误的种子。实验结果表明,与现有方法相比,QAAttack显著提升了检测问答系统错误行为的有效性,其检测的错误行为数量较QAAskeR多出14236个;此外,其触发错误行为的成功率相较于QATest提升了37.08%。 展开更多
关键词 问答系统 模糊测试 蜕变测试 自然语言处理
在线阅读 下载PDF
武器装备软件测试用例复用技术
15
作者 邹诗苑 张龙 +2 位作者 丁小芩 王丽娜 刘佳 《兵工自动化》 北大核心 2025年第6期82-85,共4页
为提高测试的效率和质量,对武器装备软件测试用例的复用进行了探讨。提出测试项、测试用例的概念及用例库的基本构架,采用Z规格说明语言对测试用例进行统一描述,描述方法运用在武器装备软件的测试用例复用实例中,能保证软件测试的有效... 为提高测试的效率和质量,对武器装备软件测试用例的复用进行了探讨。提出测试项、测试用例的概念及用例库的基本构架,采用Z规格说明语言对测试用例进行统一描述,描述方法运用在武器装备软件的测试用例复用实例中,能保证软件测试的有效性及测试用例的通用性、独立性、规范化和易修改性。通过测试用例的复用,结果表明:该研究能加快测试用例的设计进度,减少测试人员的负担,提高武器装备软件测试的效率和质量。 展开更多
关键词 测试用例 复用 武器装备软件 Z语言
在线阅读 下载PDF
大模型在软件缺陷检测与修复的应用发展综述
16
作者 香佳宏 徐霄阳 +3 位作者 孔繁初 彭湃 张钊 张煜群 《软件学报》 北大核心 2025年第4期1489-1529,共41页
随着信息化的深入,大量应用程序的开发和功能迭代不可避免引入软件缺陷,并潜在地对程序可靠性和安全性造成了严重的威胁.检测与修复软件漏洞,已经成为开发者维护软件质量必要的任务,同时也是沉重的负担.对此,软件工程的研究者在过去的... 随着信息化的深入,大量应用程序的开发和功能迭代不可避免引入软件缺陷,并潜在地对程序可靠性和安全性造成了严重的威胁.检测与修复软件漏洞,已经成为开发者维护软件质量必要的任务,同时也是沉重的负担.对此,软件工程的研究者在过去的数十年中提出大量相关技术,帮助开发者解决缺陷相关问题.然而这些技术都面对着一些严峻的挑战,在工业实践落地上鲜有进展.大模型,如代码大模型CodeX和对话大模型ChatGPT,通过在海量数据集上进行训练,能够捕捉代码中的复杂模式和结构,处理大量上下文信息并灵活地适应各种任务,以其优秀的性能吸引了大量研究人员的关注.在诸多软件工程任务中,基于大模型的技术展现出显著的优势,有望解决不同领域过去所面对的关键挑战.因此,尝试对目前已经存在基于大模型相关成熟技术的3个缺陷检测领域:深度学习库的缺陷检测、GUI自动化测试、测试用例的自动生成,与软件缺陷修复的成熟领域:缺陷自动化修复,进行分析和探究,在阐述其发展脉络的同时对不同技术流派的特性和挑战进行深入的探讨.最后,基于对已有研究的分析,总结这些领域和技术所面临的关键挑战及对未来研究的启示. 展开更多
关键词 大模型 缺陷检测 深度学习库缺陷检测 测试用例自动生成 GUI自动化测试 缺陷自动修复
在线阅读 下载PDF
基于SilkTest和XML的通用高效的用户界面测试方法 被引量:5
17
作者 何浩 程春玲 +1 位作者 张征宇 张登银 《计算机应用》 CSCD 北大核心 2013年第1期258-261,共4页
在软件测试中,用户界面(UI)测试是保证软件质量、提高软件可靠性的不可或缺的一部分。针对句柄识别UI的测试方法缺乏稳定性和通用性,通过引入可扩展标记语言(XML),提出了一种基于XML对UI控件识别并测试的改进方法。利用XML处理数据便捷... 在软件测试中,用户界面(UI)测试是保证软件质量、提高软件可靠性的不可或缺的一部分。针对句柄识别UI的测试方法缺乏稳定性和通用性,通过引入可扩展标记语言(XML),提出了一种基于XML对UI控件识别并测试的改进方法。利用XML处理数据便捷的特点,结合自动化测试工具SilkTest,对传统UI测试进行了改进。并且根据所提方法,针对AutoCAD产品多语言多版本的特点,设计了对其系列产品对话框的自动化测试方案。实验结果表明,改进后的方法能够缩短控件的识别时间,减少了测试脚本的冗余量,提高了测试的效率,也提高了UI识别的稳定性。 展开更多
关键词 软件测试 自动化 用户界面测试 Silktest工具 可扩展标记语言
在线阅读 下载PDF
基于变异的正则表达式反例测试串生成算法 被引量:1
18
作者 郑黎晓 余李林 +3 位作者 陈海明 陈祖希 骆翔宇 汪小勇 《软件学报》 EI CSCD 北大核心 2024年第7期3355-3376,共22页
正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些... 正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些字符串,并检查它们是否符合预期.现有的测试数据生成大多只关注正例串,而研究表明,实际开发中存在的错误大部分在于定义的语言比预期语言小,这类错误只能通过反例串才能发现.研究基于变异的正则表达式反例测试串生成.首先通过变异向被测表达式中注入缺陷得到一组变异体,然后在被测表达式所定义语言的补集中选取反例字符串揭示相应变异体所模拟的错误.为了能够模拟复杂缺陷类型,以及避免出现变异体特化而无法获得反例串的问题,引入二阶变异机制.同时采取冗余变异体消除、变异算子选择等优化技术对变异体进行约简,从而控制最终生成的测试集规模.实验结果表明,与已有工具相比,所提算法生成的反例测试串规模适中,并且具有较强的揭示错误能力. 展开更多
关键词 正则表达式 正则语言 字符串生成 变异测试 变异体约简
在线阅读 下载PDF
基于SysML的空间有效载荷测试路径自动生成方法
19
作者 金鑫 贺宇峰 《系统工程与电子技术》 EI CSCD 北大核心 2024年第10期3416-3426,共11页
为简化对空间有效载荷这一复杂系统的集成测试工作,引入基于模型的系统工程(model-based sytems engineering,MBSE)思想,提出一种基于系统建模语言(system modeling language,SysML)的测试路径自动生成方法。所提方法所需的信息全部来... 为简化对空间有效载荷这一复杂系统的集成测试工作,引入基于模型的系统工程(model-based sytems engineering,MBSE)思想,提出一种基于系统建模语言(system modeling language,SysML)的测试路径自动生成方法。所提方法所需的信息全部来源于载荷设备在数字设计阶段所构建的SysML数字模型。首先,对载荷的SysML活动图进行预处理;之后,根据载荷运行特性与活动图特性构建测试路径搜索模型,并以此提出改进蚁群算法以搜索全部测试路径;最后,基于SysML用例图在全部测试路径中进一步进行搜索,从而获取指定功能的测试路径。以空间燃烧科学实验载荷为例展示所提方法的详细过程,并对算法性能进行分析。在200次重复实验中,所提方法所得测试路径的覆盖率达到100%,最大迭代次数为27。实验结果表明,所提方法不会产生大量的无效测试路径,大大提高测试路径规划工作的效率。 展开更多
关键词 系统建模语言 测试路径生成 蚁群算法 空间有效载荷
在线阅读 下载PDF
GPT-4大语言模型对护理知识理解的测试研究 被引量:6
20
作者 徐文博 陈凤敏 +2 位作者 王超 陈洁 侯辉 《护理学杂志》 CSCD 北大核心 2024年第19期93-96,共4页
目的探讨GPT-4大语言模型在护理教育中的应用潜力。方法选用GPT-4对主管护师考试真题进行量化测试,并对答案准确率进行分类评价。结果GPT-4的整体准确率为81.00%。在知识记忆和简单选项题目上准确率较高,分别为82.64%和82.52%;在解答知... 目的探讨GPT-4大语言模型在护理教育中的应用潜力。方法选用GPT-4对主管护师考试真题进行量化测试,并对答案准确率进行分类评价。结果GPT-4的整体准确率为81.00%。在知识记忆和简单选项题目上准确率较高,分别为82.64%和82.52%;在解答知识应用和复杂选项题目时,GPT-4的准确率较低,分别为76.60%和70.97%。结论GPT-4展现出作为护理教学和临床护理辅助工具的巨大潜力。未来研究应探索如何将大语言模型与外部知识源结合并创新应用方法,提升大模型生成内容的准确性。同时,护理教育工作者还应积极探索大模型提升学生自学能力和自我评价能力的方法。 展开更多
关键词 大语言模型 人工智能 GPT-4 护理教育 护理教学 护理知识 试题 测试
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部