期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
多视角看大模型安全及实践 被引量:14
1
作者 王笑尘 张坤 张鹏 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1104-1112,共9页
随着人工智能领域大模型(large model)的广泛应用,大模型,尤其是大语言模型(large language model,LLM)的安全问题受到了广泛关注.大模型作为一种新兴技术,与之相关的安全态势分析以及安全体系建设均亟待挖掘与探索.从社会关系以及技术... 随着人工智能领域大模型(large model)的广泛应用,大模型,尤其是大语言模型(large language model,LLM)的安全问题受到了广泛关注.大模型作为一种新兴技术,与之相关的安全态势分析以及安全体系建设均亟待挖掘与探索.从社会关系以及技术应用2个视角,分析了大模型安全的整体趋势.同时,基于大模型自身的特点,梳理了大模型安全能力建设的实践思路,为大模型研发、大模型应用构建提供了安全体系构建的参考方案.介绍的大模型安全能力实践方案包括安全评估基准建设、模型价值观对齐方法、模型线上服务安全系统建设3个部分. 展开更多
关键词 大模型 大模型线上服务 安全系统 人工智能伦理 大模型安全形势分析
在线阅读 下载PDF
大模型红队测试研究综述
2
作者 包泽芃 钱铁云 《计算机科学》 北大核心 2025年第1期34-41,共8页
大模型红队测试(Large Model Red Teaming)旨在让大语言模型(Large Language Model, LLM)接收对抗测试,从而诱使模型输出有害的测试用例,进而发现模型中的漏洞并提高其鲁棒性。大模型红队测试是大模型领域的前沿课题,近年来受到学术界... 大模型红队测试(Large Model Red Teaming)旨在让大语言模型(Large Language Model, LLM)接收对抗测试,从而诱使模型输出有害的测试用例,进而发现模型中的漏洞并提高其鲁棒性。大模型红队测试是大模型领域的前沿课题,近年来受到学术界和工业界的广泛关注。研究者们针对大模型红队测试提出了众多解决方案,并在模型对齐上取得了一定进展。然而,受限于大模型红队数据的短缺和评价标准的模糊,现有研究大多局限于针对特定的场景进行评估。文中首先从与大模型安全相关的定义出发,对其所涉及的各种风险进行阐述;其次,针对大模型红队测试的重要性及其主要类别进行了阐述,综述和分析了相关红队技术的发展历程,并介绍了已有的数据集和评价指标;最后,对大模型红队测试的未来发展趋势进行了展望和总结。 展开更多
关键词 红队 大模型安全 强化学习 语言模型 越狱
在线阅读 下载PDF
大模型关键技术与应用 被引量:16
3
作者 韩炳涛 刘涛 《中兴通讯技术》 北大核心 2024年第2期76-88,共13页
介绍了自ChatGPT发布以来,大模型关键技术和应用的主要进展。在大模型设计方面,模型规模不断增加,但已有放缓趋势,更长的上下文以及多模态已经成为主流,计算效率明显提升;在模型训练方面,从单纯追求数据数量逐渐转变为关注数据的多样性... 介绍了自ChatGPT发布以来,大模型关键技术和应用的主要进展。在大模型设计方面,模型规模不断增加,但已有放缓趋势,更长的上下文以及多模态已经成为主流,计算效率明显提升;在模型训练方面,从单纯追求数据数量逐渐转变为关注数据的多样性和质量,特别是如何使用合成数据训练大模型成为主流探索方向,这是迈向通用人工智能(AGI)的关键;在模型推理方面,模型量化和推理引擎优化极大降低了模型使用成本,诸如投机采样等新兴算法逐渐成熟。在应用层,Agent技术获得了重大进展,在克服大模型固有缺陷方面发挥了不可替代的作用。越来越多的企业开始规划、研发以及使用大模型,企业级大模型应用架构日益成熟完善,并以场景、技术、算法三要素为抓手加速大模型商业价值闭环。 展开更多
关键词 大模型 模型训练 推理加速 大模型安全 智能体
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部