-
题名基于序列到隐写序列的约束型自然语言信息隐藏方法
被引量:5
- 1
-
-
作者
向凌云
杨双辉
王蓉
刘宇航
章登勇
-
机构
长沙理工大学综合交通运输大数据智能处理湖南省重点实验室
长沙理工大学计算机与通信工程学院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第8期1650-1669,共20页
-
基金
国家自然科学基金(61972057)
湖南省自然科学基金项目(2022JJ30623)
+1 种基金
湖南省教育厅科研基金(21A0211)
河南省网络空间态势感知重点实验室开放课题基金(IINT2022018)资助。
-
文摘
已有的基于文本生成的无约束型自然语言信息隐藏方法主要利用不同的文本生成模型在秘密信息的控制下实现隐写文本的生成,它们生成的隐写文本质量较好且嵌入容量高.但这些方法大都局限于生成短隐写文本,整体的文本质量和句间语义相关性会随着句子长度增加而急剧下降.与无约束型方法不同,已有的约束型自然语言信息隐藏方法能针对特定场景实现长文本生成任务下的信息隐藏,具有更高的语言隐蔽性和安全性.为提高约束型方法面对各类应用场景的普适性,本文提出了一种通用的序列到隐写序列模型框架,该框架包含语言编码器和隐写器两部分,能实现从一种约束信息序列到另一种隐写文本序列的变换.以摘要生成为例,本文以序列到隐写序列模型为基本框架,提出了一种新颖的约束型自然语言信息隐藏方法.该方法在语言编码器中引入注意力优化单元以提升特征学习性能,在隐写器中融合复制机制和新设计的基于多候选优化的自适应隐写编码方法,使得隐写器可以根据候选单词序列的概率分布情况和待嵌入的秘密信息自适应地选择不同的输出优化策略,通过输出多个候选序列以及仅在嵌入时刻选择合适位置嵌入信息的方式来提高隐写文本质量.实验结果表明,本文提出的方法能够通过优化语言编码器和隐写器的设计,提高隐写摘要文本与原始摘要文本的语义相似度以及隐写摘要文本的质量,其质量甚至还优于基于基础语言编码器生成的正常摘要文本的质量,具有极强的隐蔽性.此外,本文方法生成的隐写摘要文本安全性高,利用多种隐写分析方法进行检测的各项指标基本低于60%,难以从正常文本中识别出本文方法生成的隐写摘要文本.
-
关键词
自然语言信息隐藏
文本生成
约束型自然语言隐藏
序列到隐写序列
隐写编码
-
Keywords
linguistic steganography
text generation
constrained linguistic steganography
sequence to steganographic sequence
steganographic encoding
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于神经网络机器翻译的自然语言信息隐藏
被引量:4
- 2
-
-
作者
周小诗
张梓葳
文娟
-
机构
中国农业大学信息与电气工程学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第S02期557-564,584,共9页
-
基金
国家自然科学基金(61802410)
中国高校科学基金(2019TC047)。
-
文摘
生成式自然语言信息隐藏在自然语言生成过程中嵌入秘密信息。目前主流的生成式自然语言隐藏方法采用一个简单的循环神经网络(Recurrent Neural Networks,RNN)或长短时记忆网络(Long Short-Term Memory,LSTM)进行载密文本的生成。这种方法生成的载密文本长度有限,且句子和句子之间没有语义关联。为了解决这个问题,提出了能够生成长句且句与句之间能保持语义关系的机器翻译隐写算法Seq2Seq-Stega。采用序列到序列(Sequence to Sequence,Seq2Seq)模型作为文本隐写的编码器和解码器,源语句的信息可以保证目标载密句的语义关联性。此外,根据每一时刻模型计算的单词概率分布,设计了候选池的选词策略,并引入了平衡源语句与目标句的贡献度的注意力超参数。通过实验比较了不同选词阈值和注意力参数下模型的隐藏容量和生成文本的质量。与其他3种生成式模型的对比实验表明,该算法能够保持长距离语义关联,并具有较好的抗隐写分析能力。
-
关键词
自然语言信息隐藏
文本生成
语义距离
自注意力机制
机器翻译
-
Keywords
Natural language steganography
Text generation
Semantic relevance
Self-attention mechanism
Machine translation
-
分类号
G316
[文化科学]
-
-
题名自然语言水印鲁棒性分析与评估
被引量:7
- 3
-
-
作者
何路
桂小林
田丰
武睿峰
房鼎益
-
机构
西安交通大学计算机科学与技术系
陕西省网络重点实验室
西北大学信息学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2012年第9期1971-1982,共12页
-
基金
国家科技计划重大专项(2012ZXD3002001)
国家自然科学基金(61172090)
+1 种基金
陕西省科技攻关项目(2012K06-30)
陕西省教育厅科学研究计划(12JK0742)资助~~
-
文摘
自然语言与图像、音频信号的性质截然不同,图像水印等的鲁棒性分析方法不适用于自然语言水印,但是直到目前还没有专门针对自然语言水印鲁棒性的研究和评估工作.文中针对自然语言的特点,提出适合自然语言水印的敌手模型.然后将现有的自然语言水印分类,并总结各类的一般算法模型.利用文本提出的敌手模型分析自然语言水印编码算法的鲁棒性,并通过实验验证鲁棒性的理论模型.本项工作为对比、评估自然语言水印算法的鲁棒性提供了理论依据.
-
关键词
自然语言水印
鲁棒性
主动攻击
水印攻击
自然语言信息隐藏
-
Keywords
natural language watermarking
robustness
active attack
attacking watermarking
natural language information hiding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-