-
题名基于变分自编码器的无监督文本风格转换
被引量:4
- 1
-
-
作者
聂锦燃
魏蛟龙
唐祖平
-
机构
华中科技大学电子信息与通信学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第7期79-88,共10页
-
基金
国家重点研发计划(2018YFB1004600)
-
文摘
近年来,文本风格转换作为一种可控的文本生成任务受到学者们越来越多的关注。该文基于变分自编码器模型,通过鉴别器与变分自编码器的对抗性训练,将源端句子的内容和风格在隐变量空间进行分离,从而实现无监督的文本风格转换。针对文本语义内容和风格的解纠缠过程中利用固定的二进制向量通过线性变换来对风格进行表征的方法的不足,该文提出更具细腻度的联合表征方法:利用独立的编码器从原句中提取风格的连续隐向量,再和标签向量结合作为最终风格的表征,以提升风格转换的准确率。该文提出的联合表征方法在常用数据集Yelp上进行评测,与两个基线方法相比,风格转换准确率均有显著提升。
-
关键词
文本风格转换
变分自编码器
对抗性训练
联合表征
-
Keywords
text style transfer
variational auto-encoder
adversarial training
joint representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名文本风格转换综述
- 2
-
-
作者
贾熹滨
刘思良
胡长建
李让
-
机构
北京工业大学信息学部
联想集团北京研究院
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2022年第4期443-456,共14页
-
基金
北京市自然科学基金资助项目(4202004)。
-
文摘
自然语言生成是人工智能系统中的重要组成部分,随着人工智能技术逐渐融入人们的生活,人们对自然语言生成技术有了更高的要求,可控自然语言生成成为新的研究热点.文本风格转换任务作为可控自然语言生成的重要研究方向,受到学术界和工业界的广泛关注.文本风格转换任务指的是在保留文本原有内容的基础上,有目的地生成目标风格的句子.为了进一步展示该任务中的发展进程,首先,介绍了当前文本风格转换任务的定义及发展脉络;然后,基于模型方法将当前的研究工作总结成3类,即基于隐空间解耦、基于显性解耦和基于一步映射,在简述这些工作的基础上,着重介绍了一些具有启发意义的工作;接着,梳理和分析了文本风格转换任务中的公共数据集和评估方法;最后,对文本风格转换任务的未来发展趋势提出展望.
-
关键词
自然语言生成
人工智能
文本风格转换
显性解耦
隐空间解耦
一步映射
-
Keywords
natural language generation
artificial intelligence
text style transfer
explicit disentangled
latent space disentangled
one-step mapping
-
分类号
U461
[机械工程—车辆工程]
TP308
[自动化与计算机技术—计算机系统结构]
-
-
题名文本风格转换模型的平衡性改进方法研究
- 3
-
-
作者
刘延飞
李慧
何玉杰
-
机构
火箭军工程大学电子信息技术教研室
-
出处
《兵器装备工程学报》
CSCD
北大核心
2021年第11期163-168,共6页
-
基金
国家自然科学基金项目(62006240)。
-
文摘
针对现有的文本风格转换模型语句内容保留度较低、内容与风格间平衡性较差,提出了基于文本属性可控转换模型(CTAT)的平衡性改进模型Balance-CTAT。在提出的模型中,改进的优化算法和结构加强了内容保留程度,即在对抗性风格干扰算法上添加显著性操作将干扰影响局部化;在自编码器结构上构造递进式解码器,逐层增加注意力头数对信息进行渐进式融合。提出的模型与现有的文本风格转换模型(如Cross、CTAT、FGST)进行了对比分析,并从风格转换精度、内容保留度和几何平均值进行评价。实验结果表明:提出的模型明显优于现有的文本风格转换模型,具有很好的内容保留度,综合性能显著提升。
-
关键词
文本风格转换
快速梯度攻击算法
注意力机制
渐进式融合
Transformer模型
-
Keywords
text style transfer
fast gradient sign method
attention mechanism
gradual stylistic fusion
transformer model
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP311
[自动化与计算机技术—计算机软件与理论]
-