期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度语义挖掘的大语言模型越狱检测方法研究
1
作者
刘会
朱正道
+2 位作者
王淞鹤
武永成
黄林荃
《信息网络安全》
2025年第9期1377-1384,共8页
对用户提示词进行伪装是大语言模型(LLM)越狱攻击中常见的手段,常见形式包括语义编码和前缀注入等,旨在绕过LLM的安全审查机制,从而诱导其生成违反伦理规范的内容。为应对这一挑战,文章提出一种基于深度语义挖掘的LLM越狱检测方法,通过...
对用户提示词进行伪装是大语言模型(LLM)越狱攻击中常见的手段,常见形式包括语义编码和前缀注入等,旨在绕过LLM的安全审查机制,从而诱导其生成违反伦理规范的内容。为应对这一挑战,文章提出一种基于深度语义挖掘的LLM越狱检测方法,通过挖掘用户提示词的潜在真实意图,有效激活模型内置的安全审查机制,实现对越狱攻击的准确识别。文章针对3种典型的越狱攻击方式在3个主流LLM上开展了广泛实验。实验结果表明,文章所提方法的平均准确率达到了96.48%,将越狱攻击的平均攻击成功率从33.75%降至1.38%,相比于当前较优检测方法,该方法将防御能力提升了4%,展现出较强的越狱防护能力。
展开更多
关键词
大语言模型
深度语义挖掘
安全审查
越狱攻击
在线阅读
下载PDF
职称材料
基于深度学习的艺术家特性表示
被引量:
1
2
作者
费加磊
陈宁
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2019年第1期119-124,共6页
传统的艺术家相似性模型均采用艺术家标签的相似性表示艺术家的相似性,不够准确和全面。为了解决这一问题,本文提出了一种基于艺术家简介深度语义挖掘的艺术家特性表示模型。该模型分别利用Word2Vec和GloVe对艺术家简介进行词向量映射,...
传统的艺术家相似性模型均采用艺术家标签的相似性表示艺术家的相似性,不够准确和全面。为了解决这一问题,本文提出了一种基于艺术家简介深度语义挖掘的艺术家特性表示模型。该模型分别利用Word2Vec和GloVe对艺术家简介进行词向量映射,并利用卷积神经网络提取词向量上下文语义相关性,最后利用全连接网络验证艺术家特征的准确性。以Pandora网站提供的5 101个艺术家简介为实验对象,对算法的性能进行测试。实验结果表明,该算法取得了比传统算法更高的准确性。
展开更多
关键词
词向量
艺术家特性
深度语义挖掘
卷积神经网络
在线阅读
下载PDF
职称材料
题名
基于深度语义挖掘的大语言模型越狱检测方法研究
1
作者
刘会
朱正道
王淞鹤
武永成
黄林荃
机构
华中师范大学计算机学院
出处
《信息网络安全》
2025年第9期1377-1384,共8页
基金
国家资助博士后研究人员计划[GZC20230922]
中国博士后科学基金[2024M751050]
+1 种基金
湖北省博士后创新人才培养项目[2024HBBHCXB042]
人工智能与智慧学习湖北省重点实验室2025年度开放研究基金[2025AISL007]。
文摘
对用户提示词进行伪装是大语言模型(LLM)越狱攻击中常见的手段,常见形式包括语义编码和前缀注入等,旨在绕过LLM的安全审查机制,从而诱导其生成违反伦理规范的内容。为应对这一挑战,文章提出一种基于深度语义挖掘的LLM越狱检测方法,通过挖掘用户提示词的潜在真实意图,有效激活模型内置的安全审查机制,实现对越狱攻击的准确识别。文章针对3种典型的越狱攻击方式在3个主流LLM上开展了广泛实验。实验结果表明,文章所提方法的平均准确率达到了96.48%,将越狱攻击的平均攻击成功率从33.75%降至1.38%,相比于当前较优检测方法,该方法将防御能力提升了4%,展现出较强的越狱防护能力。
关键词
大语言模型
深度语义挖掘
安全审查
越狱攻击
Keywords
large language model
deep semantic mining
safety protocol
jailbreak attack
分类号
TP309 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
基于深度学习的艺术家特性表示
被引量:
1
2
作者
费加磊
陈宁
机构
华东理工大学信息科学与工程学院
出处
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2019年第1期119-124,共6页
基金
国家自然科学基金面上项目(61771196)
文摘
传统的艺术家相似性模型均采用艺术家标签的相似性表示艺术家的相似性,不够准确和全面。为了解决这一问题,本文提出了一种基于艺术家简介深度语义挖掘的艺术家特性表示模型。该模型分别利用Word2Vec和GloVe对艺术家简介进行词向量映射,并利用卷积神经网络提取词向量上下文语义相关性,最后利用全连接网络验证艺术家特征的准确性。以Pandora网站提供的5 101个艺术家简介为实验对象,对算法的性能进行测试。实验结果表明,该算法取得了比传统算法更高的准确性。
关键词
词向量
艺术家特性
深度语义挖掘
卷积神经网络
Keywords
word vector
the artist's characteristics representation
deep semantic mining
convolutional neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度语义挖掘的大语言模型越狱检测方法研究
刘会
朱正道
王淞鹤
武永成
黄林荃
《信息网络安全》
2025
在线阅读
下载PDF
职称材料
2
基于深度学习的艺术家特性表示
费加磊
陈宁
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2019
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部