期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
大语言模型安全的技术治理:对抗测试与评估审计 被引量:2
1
作者 周辉 郭烘佑 《西安交通大学学报(社会科学版)》 北大核心 2025年第2期78-88,共11页
人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风... 人工智能大语言模型在提供跨任务和跨领域泛化性能的同时,由于数据驱动和技术复杂等原因产生了多重风险,增加了企业和个人面临的安全威胁,并带来了伦理和法律问题。以对抗测试和评估审计为核心的技术治理能够有效辨识和缓解安全漏洞及风险,为大语言模型的安全应用提供了关键保障。但是,目前缺少充足的算力保障、技术治理流程和标准缺乏统一性、平台技术治理易受商业利益影响等困境影响了技术治理方案的稳步实施。从优化技术治理框架、鼓励安全治理技术创新、明确流程与标准、构建多方参与的监督机制等方面提出完善安全技术治理机制的建议,以确保大语言模型的稳定与安全运行。 展开更多
关键词 人工智能 大语言模型 安全风险 技术治理 对抗测试 评估审计
在线阅读 下载PDF
基于多目标演化优化的SVM对抗仿真测试算法
2
作者 李飞行 邢立宁 周宇 《系统仿真学报》 CAS CSCD 北大核心 2024年第9期2016-2031,共16页
机器学习通常从数据中挖掘潜在的模式与规则,容易受到数据的影响而产生诸如过拟合、欠拟合等现象,进而影响学习模型的泛化与鲁棒性能。从对抗仿真测试的角度考察SVM可能存在的脆弱不稳定性,采用的对抗仿真策略是通过选择性地污染训练样... 机器学习通常从数据中挖掘潜在的模式与规则,容易受到数据的影响而产生诸如过拟合、欠拟合等现象,进而影响学习模型的泛化与鲁棒性能。从对抗仿真测试的角度考察SVM可能存在的脆弱不稳定性,采用的对抗仿真策略是通过选择性地污染训练样本标签,模拟攻击SVM分类器使其性能退化,以测试其对训练样本的依赖性。为探究SVM分类器在不同样本组合攻击下的性能损失上限,设计了最小攻击代价-最大攻击成效这一对矛盾目标,构建了SVM仿真测试的多目标优化模型。该模型本质上是一种典型的多目标组合优化问题,可采用适当的多目标演化算法求解目标间的一组非支配解集,揭示分类器在不同样本组合攻击下的分类性能表现。在人工及真实数据集上的仿真对比实验结果表明:所提方法能够一次性生成不同攻击水平下的最优攻击样本组合,取得最大的分类性能损失,更能全面测试SVM分类器性能的稳定性。 展开更多
关键词 对抗仿真测试 污染标签 支持向量机 性能损失 多目标优化 非支配解集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部