期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于双路视觉Transformer的图像风格迁移
1
作者 纪宗杏 贝佳 +1 位作者 刘润泽 任桐炜 《北京航空航天大学学报》 北大核心 2025年第7期2488-2497,共10页
图像风格迁移旨在根据风格图像调整内容图像的视觉属性,使其保留原始内容的同时呈现出特定风格样式,从而生成具有视觉吸引力的风格化图像。针对现有代表性方法大多未考虑不同图像域间的编码差异,专注提取图像局部特征而忽视了全局上下... 图像风格迁移旨在根据风格图像调整内容图像的视觉属性,使其保留原始内容的同时呈现出特定风格样式,从而生成具有视觉吸引力的风格化图像。针对现有代表性方法大多未考虑不同图像域间的编码差异,专注提取图像局部特征而忽视了全局上下文信息的重要性,提出一种新型的基于双路视觉Transformer的图像风格迁移方法Bi-Trans,对内容图像域和风格图像域进行独立编码,提取风格参数向量以离散化表征图像风格,通过交叉注意力机制与条件实例归一化(CIN)将内容图像标定至目标域风格,从而生成风格化图像。实验结果表明,该方法无论是内容保留度还是风格还原度均优于现有方法。 展开更多
关键词 图像风格迁移 视觉Transformer 任意风格化 条件实例归一化 注意力机制
在线阅读 下载PDF
基于多领域条件生成的语音情感转换 被引量:1
2
作者 姚文翰 柯登峰 +3 位作者 黄良杰 胡睿欣 项敏特 张劲松 《郑州大学学报(理学版)》 CAS 北大核心 2023年第5期67-72,共6页
语音情感转换是在不改变话者声纹、语义的情况下,将一种情感语音转换成另一种情感语音的技术,本质是实现语音的风格迁移。主流的风格迁移技术有对抗生成技术(如CycleGAN,StarGAN)和实例规一化技术(如IN,CIN)。CIN相对于IN添加了均值方... 语音情感转换是在不改变话者声纹、语义的情况下,将一种情感语音转换成另一种情感语音的技术,本质是实现语音的风格迁移。主流的风格迁移技术有对抗生成技术(如CycleGAN,StarGAN)和实例规一化技术(如IN,CIN)。CIN相对于IN添加了均值方差选择性模块,具有更强的风格迁移能力。提出了将StarGAN和CIN结合的语音情感转换模型CIN-StarGAN,将CIN模块嵌入到StarGAN生成器。在ESD数据集上的实验结果表明,CINStarGAN比基于CycleGAN的情感转换模型收敛速度快28%,具有较好的风格转换能力。在多领域情感转换方法上具有潜在研究价值。 展开更多
关键词 语音情感转换 域转换 条件实例归一化 生成对抗网络
在线阅读 下载PDF
基于条件流的人脸正面化生成对抗模型
3
作者 张鹏升 解易 刘钊 《计算机应用与软件》 北大核心 2019年第12期156-161,183,共7页
根据侧面人脸合成正面人脸一直是计算机视觉领域中的一个难题。对此设计基于条件流的人脸正面化生成对抗网络模型。采用Glow模型作为生成网络实现高效的推理和合成;采用条件实例归一化层(CIN)来控制正面人脸的生成;采用变分判别器瓶颈(V... 根据侧面人脸合成正面人脸一直是计算机视觉领域中的一个难题。对此设计基于条件流的人脸正面化生成对抗网络模型。采用Glow模型作为生成网络实现高效的推理和合成;采用条件实例归一化层(CIN)来控制正面人脸的生成;采用变分判别器瓶颈(VDB),以潜在变量对身份进行判别,生成身份一致的正面人脸。在Multi PIE数据集上进行实验,实验分析表明,该网络模型可以生成更具真实性和多样性的正面人脸图片。 展开更多
关键词 人脸正面化 流模型 生产对抗网络 条件实例归一化 变分判别器瓶颈
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部