期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度语义挖掘的大语言模型越狱检测方法研究
1
作者 刘会 朱正道 +2 位作者 王淞鹤 武永成 黄林荃 《信息网络安全》 2025年第9期1377-1384,共8页
对用户提示词进行伪装是大语言模型(LLM)越狱攻击中常见的手段,常见形式包括语义编码和前缀注入等,旨在绕过LLM的安全审查机制,从而诱导其生成违反伦理规范的内容。为应对这一挑战,文章提出一种基于深度语义挖掘的LLM越狱检测方法,通过... 对用户提示词进行伪装是大语言模型(LLM)越狱攻击中常见的手段,常见形式包括语义编码和前缀注入等,旨在绕过LLM的安全审查机制,从而诱导其生成违反伦理规范的内容。为应对这一挑战,文章提出一种基于深度语义挖掘的LLM越狱检测方法,通过挖掘用户提示词的潜在真实意图,有效激活模型内置的安全审查机制,实现对越狱攻击的准确识别。文章针对3种典型的越狱攻击方式在3个主流LLM上开展了广泛实验。实验结果表明,文章所提方法的平均准确率达到了96.48%,将越狱攻击的平均攻击成功率从33.75%降至1.38%,相比于当前较优检测方法,该方法将防御能力提升了4%,展现出较强的越狱防护能力。 展开更多
关键词 大语言模型 深度语义挖掘 安全审查 越狱攻击
在线阅读 下载PDF
基于深度学习的艺术家特性表示 被引量:1
2
作者 费加磊 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期119-124,共6页
传统的艺术家相似性模型均采用艺术家标签的相似性表示艺术家的相似性,不够准确和全面。为了解决这一问题,本文提出了一种基于艺术家简介深度语义挖掘的艺术家特性表示模型。该模型分别利用Word2Vec和GloVe对艺术家简介进行词向量映射,... 传统的艺术家相似性模型均采用艺术家标签的相似性表示艺术家的相似性,不够准确和全面。为了解决这一问题,本文提出了一种基于艺术家简介深度语义挖掘的艺术家特性表示模型。该模型分别利用Word2Vec和GloVe对艺术家简介进行词向量映射,并利用卷积神经网络提取词向量上下文语义相关性,最后利用全连接网络验证艺术家特征的准确性。以Pandora网站提供的5 101个艺术家简介为实验对象,对算法的性能进行测试。实验结果表明,该算法取得了比传统算法更高的准确性。 展开更多
关键词 词向量 艺术家特性 深度语义挖掘 卷积神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部