期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
采用表示分离自编码器的任意说话人语音转换
被引量:
1
1
作者
简志华
章子旭
《通信学报》
EI
CSCD
北大核心
2024年第2期162-172,共11页
针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将...
针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将内容信息视为时变,利用编码器中的实例归一化和激活引导层将两者进行分离,再由解码器将源语音的内容信息与目标语音的个性特征进行合成,从而生成转换后的语音。实验结果表明,RSAE-VC在梅尔倒谱距离上比现有的AGAIN-VC转换方法平均降低了3.11%,在基音频率均方根误差上降低了2.41%,MOS分和ABX值分别提升了5.22%和8.45%。RSAE-VC方法通过自内容损失进行约束使语音更好地保留内容信息,通过自说话人损失将说话人个性特征更好地从语音中分离,可以确保说话人个性特征尽少地遗留在内容信息中,从而提高语音转换性能。
展开更多
关键词
语音转换
表示分离
自适应实例归一化
自内容损失
自说话人损失
在线阅读
下载PDF
职称材料
基于CLIP和双空间自适应归一化的图像翻译
被引量:
2
2
作者
李田芳
普园媛
+2 位作者
赵征鹏
徐丹
钱文华
《计算机工程》
CAS
CSCD
北大核心
2024年第5期229-240,共12页
现有的图像翻译方法大多依赖数据集域标签来完成翻译任务,这种依赖往往限制了它们的应用范围。针对完全无监督图像翻译任务的方法能够解决域标签的限制问题,但是普遍存在源域信息丢失的现象。为了解决上述2个问题,提出一种基于对比学习...
现有的图像翻译方法大多依赖数据集域标签来完成翻译任务,这种依赖往往限制了它们的应用范围。针对完全无监督图像翻译任务的方法能够解决域标签的限制问题,但是普遍存在源域信息丢失的现象。为了解决上述2个问题,提出一种基于对比学习语言-图像预训练(CLIP)的无监督图像翻译模型。首先,引入CLIP相似性损失对图像的风格特征施加约束,以在不使用数据集域标签的情况下增强模型传递图像风格信息的能力和准确性;其次,对自适应实例归一化(AdaIN)进行改进,设计一个新的双空间自适应归一化(DSAdaIN)模块,在特征的风格化阶段添加网络的学习和自适应交互过程,以加强对内容源域信息的保留;最后,设计一个鉴别器对比损失来平衡对抗网络损失的训练和优化过程。在多个公开数据集上的实验结果表明,与Star GANv2、Style DIS等模型相比,该模型可在准确传递图像风格信息的同时保留一定的源域信息,且在定量评估指标FID分数和KID分数上分别提升了近3.35和0.57×102,实现了较好的图像翻译性能。
展开更多
关键词
图像翻译
生成对抗网络
对比学习语言-图像预训练模型
自适应实例归一化
对比学习
在线阅读
下载PDF
职称材料
基于字形约束和注意力的艺术字体风格迁移
被引量:
1
3
作者
吕文锐
普园媛
+2 位作者
赵征鹏
张衡
阳秋霞
《计算机工程》
CAS
CSCD
北大核心
2024年第12期306-317,共12页
艺术字体的风格迁移是一项非常有趣但又十分具有挑战性的任务,具体来说就是将目标字体的艺术风格通过某种映射方式迁移到源字体上。现有方法在字形风格迁移方面存在鲁棒性有限的不足,且当2种不同风格的字形相差较大时不能很好地将风格...
艺术字体的风格迁移是一项非常有趣但又十分具有挑战性的任务,具体来说就是将目标字体的艺术风格通过某种映射方式迁移到源字体上。现有方法在字形风格迁移方面存在鲁棒性有限的不足,且当2种不同风格的字形相差较大时不能很好地将风格内容迁移到目标字体上。针对以上问题,提出一种端到端的通用网络框架模型,并在模型中引入自注意力机制和自适应实例归一化,用于实现在给定的多个文本效果域之间进行任意字体的艺术风格迁移。该模型主要包括1个生成器和2个鉴别器,还有1个额外的风格编码器。为了更好地做到字形约束以及提升网络的性能,设计几种损失函数来优化生成对抗网络(GAN)的训练。为了验证该模型的有效性,采用了FET-GAN任务中公开的艺术字体数据集。实验对比了6种先进的方法,并从定量和定性2个方面进行了比较。实验结果表明,所提模型能够实现带有字体变换的字形图像风格迁移,迁移结果能够保持很好的字形结构,并且FID值为72.355,低于对比实验中最好的结果91.435。
展开更多
关键词
字体风格迁移
自注意力
自适应实例归一化
生成对抗网络
字形约束
在线阅读
下载PDF
职称材料
融合时间卷积网络的空间自适应运动风格迁移方法
4
作者
张凤全
李凭辙
雷劼睿
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2024年第10期1653-1662,共10页
针对人体运动生成方法严重依赖有监督学习和成对数据集的问题,受图像风格迁移方法启发,提出一个融合时间卷积网络的空间自适应运动风格迁移模型,通过输入虚拟角色运动行为,生成不同的运动风格运动序列.首先,从时序性和空间性考虑,设计...
针对人体运动生成方法严重依赖有监督学习和成对数据集的问题,受图像风格迁移方法启发,提出一个融合时间卷积网络的空间自适应运动风格迁移模型,通过输入虚拟角色运动行为,生成不同的运动风格运动序列.首先,从时序性和空间性考虑,设计以时间卷积网络为主干的神经网络框架,从无配对的数据集中准确地提取运动数据的内容特征和风格特征.其次,基于空间自适应归一化方法,将其改进并适配到运动解码器中,提出一种适用于运动风格迁移的自适应方法.最后,针对运动迁移中的误差问题,在网络中引入正向运动学对沿运动链传递的关节误差进行约束,实现了对足部运动行为的约束.为验证所提方法性能,使用CMU和Xia开源数据集依次从主成分分析、数据聚类、可视化等指标进行实验.结果表明,提出的模型可以有效实现多类非配对数据的风格迁移,所生成的动画效果自然真实,具有良好的互动性和扩展性,可广泛应用于数字动画相关的虚拟人建模中.
展开更多
关键词
深度学习
运动风格迁移
时间卷积网络
空间自适应实例归一化
在线阅读
下载PDF
职称材料
选择性传输与铰链对抗的多图像域人脸属性迁移
被引量:
1
5
作者
林泓
陈壮源
+2 位作者
任硕
李琳
李玉强
《计算机工程》
CAS
CSCD
北大核心
2022年第4期179-190,共12页
在基于生成对抗网络的人脸属性迁移过程中,存在图像域表达形式单一、图像域迁移细节失真的问题。提出一种结合选择性传输单元与铰链对抗损失的多图像域人脸属性迁移方法。在生成器中,利用自适应实例归一化融合图像的内容信息与图像域控...
在基于生成对抗网络的人脸属性迁移过程中,存在图像域表达形式单一、图像域迁移细节失真的问题。提出一种结合选择性传输单元与铰链对抗损失的多图像域人脸属性迁移方法。在生成器中,利用自适应实例归一化融合图像的内容信息与图像域控制器生成的样式信息,增加图像域表达方式的多样性,同时通过选择性传输单元将下采样提取的内容特征根据相对属性标签选择性地传输到上采样,形成融合特征以增强图像的细节信息。在判别器中,通过增加双尺度判别,协同鉴定人脸图像的真伪及类别,从而提高判定的准确度。在此基础上,设计融合相对鉴别和铰链损失的对抗损失函数,增强真伪图像域之间的联系。在CelebA数据集上的实验结果表明,与StarGAN、STGAN等主流的多图像域人脸属性迁移方法相比,该方法能够建立更准确的多图像域映射关系,提高迁移图像的质量同时增加迁移图像表达的多样性。
展开更多
关键词
生成对抗网络
多图像域属性迁移
自适应实例归一化
选择性传输单元
相对属性标签
域控制器
双尺度判别
在线阅读
下载PDF
职称材料
基于参考图语义匹配的花卉线稿工笔效果上色算法
6
作者
李媛
陈昭炯
叶东毅
《计算机研究与发展》
EI
CSCD
北大核心
2022年第6期1271-1285,共15页
研究基于参考图像的花卉线稿图的工笔效果上色问题.现有的基于参考图像的线稿图上色算法对工笔花卉画特有的色彩渐变的特点难以学习和模拟;此外通常还要求参考图像与线稿图具有相似的几何布局结构,这也限制了算法的适用性,故而直接采用...
研究基于参考图像的花卉线稿图的工笔效果上色问题.现有的基于参考图像的线稿图上色算法对工笔花卉画特有的色彩渐变的特点难以学习和模拟;此外通常还要求参考图像与线稿图具有相似的几何布局结构,这也限制了算法的适用性,故而直接采用现有算法难以实现线稿图的工笔效果上色.基于条件生成对抗网(conditional generative adversarial network,CGAN)框架,提出了一种将参考图像与线稿图进行语义匹配的花卉线稿图工笔效果上色算法RBSM-CGAN.该算法在网络结构设计方面,以U型网络(简称U-Net)为生成器基础,设计了2个附加子模块:1)语义定位子模块.该模块预训练了一个语义分割网络,以生成花卉线稿图的语义标签图,该标签图编码后作为自适应实例归一化的仿射参数引入到上色模型中,提升对不同语义区域的识别能力,进而提高颜色定位的准确性.2)颜色编码子模块.该模块提取参考图像的颜色特征,而后将该特征拼接到生成网络解码层的前3层,利用这种方式将颜色信息注入上色模型,与语义定位模块相配合加强算法对渐变色的学习和模拟.另外,算法在网络训练方面改变传统的“工笔花卉原作-花卉线稿图”数据对的训练方式,通过打乱原作的几何结构等摄动操作生成原作摄动图,采用“原作摄动图-花卉线稿图”数据对进行网络训练,降低了模型对原作空间几何结构的依赖性,提升了算法的适用性.实验结果表明:该算法对用户选择的参考图像的颜色语义具有正确的响应,所引入的“语义定位+颜色编码”的结构设计提升了对渐变色的模拟效果,实现了在不同参考图像指导下的花卉线稿图的工笔效果上色,可快速生成多样化的上色结果.
展开更多
关键词
工笔花卉上色
语义匹配
条件生成对抗网络
语义分割网络
自适应实例归一化
在线阅读
下载PDF
职称材料
基于字形感知和注意力归一化的字体迁移
被引量:
2
7
作者
吕文锐
普园媛
+2 位作者
赵征鹏
徐丹
钱文华
《计算机科学》
CSCD
北大核心
2023年第S01期398-403,共6页
字体迁移是一项十分具有挑战性的任务,其目的是将目标字体通过某种映射方式迁移到源字体,以实现字体的变换。现有的方法在字体迁移方面的鲁棒性有限,突出表现为对生成字体结构完整性的保持较差,尤其是当两种不同种类的字体差别较大时。...
字体迁移是一项十分具有挑战性的任务,其目的是将目标字体通过某种映射方式迁移到源字体,以实现字体的变换。现有的方法在字体迁移方面的鲁棒性有限,突出表现为对生成字体结构完整性的保持较差,尤其是当两种不同种类的字体差别较大时。针对这些问题,提出了一种端到端的字体迁移网络框架模型。该模型引入了注意力归一化以更好地提取字形图像的高级语义特征,从而提高生成图像的质量。此外,使用自适应实例归一化进行字体特征和内容特征融合,以实现字体的转换。在保持字形结构完整性方面,设计了感知损失和上下文损失来约束字形结构的生成。为了稳定GAN网络的训练,在对抗损失函数的设计中加入了正则化项。为了验证该模型的有效性,实验采用FET-GAN中公开的数据集进行了多组训练和测试,并与FET-GAN,CycleGAN和StarGANv2进行了对比。实验结果表明,该模型能够在给定的多个字体域之间实现相互的字体迁移,并且其迁移的效果和模型泛化能力与其他工作相比均具有一定的优势。
展开更多
关键词
字体迁移
自适应实例归一化
注意力归一化
上下文损失
感知损失
在线阅读
下载PDF
职称材料
题名
采用表示分离自编码器的任意说话人语音转换
被引量:
1
1
作者
简志华
章子旭
机构
杭州电子科技大学通信工程学院
出处
《通信学报》
EI
CSCD
北大核心
2024年第2期162-172,共11页
基金
国家自然科学基金资助项目(No.61201301,No.61772166)。
文摘
针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将内容信息视为时变,利用编码器中的实例归一化和激活引导层将两者进行分离,再由解码器将源语音的内容信息与目标语音的个性特征进行合成,从而生成转换后的语音。实验结果表明,RSAE-VC在梅尔倒谱距离上比现有的AGAIN-VC转换方法平均降低了3.11%,在基音频率均方根误差上降低了2.41%,MOS分和ABX值分别提升了5.22%和8.45%。RSAE-VC方法通过自内容损失进行约束使语音更好地保留内容信息,通过自说话人损失将说话人个性特征更好地从语音中分离,可以确保说话人个性特征尽少地遗留在内容信息中,从而提高语音转换性能。
关键词
语音转换
表示分离
自适应实例归一化
自内容损失
自说话人损失
Keywords
voice conversion
representation separation
adaptive
instance
normalization
self-content loss
selfspeaker loss
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于CLIP和双空间自适应归一化的图像翻译
被引量:
2
2
作者
李田芳
普园媛
赵征鹏
徐丹
钱文华
机构
云南大学信息学院
云南省高校物联网技术及应用重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第5期229-240,共12页
基金
国家自然科学基金(61163019,61271361,61761046,U1802271,61662087,62061049)
云南省科技厅项目(2014FA021,2018FB100)
+2 种基金
云南省科技厅应用基础研究计划重点项目(202001BB050043,2019FA044)
云南省重大科技专项计划项目(202002AD080001)
云南省中青年学术技术带头人后备人才(2019HB121)。
文摘
现有的图像翻译方法大多依赖数据集域标签来完成翻译任务,这种依赖往往限制了它们的应用范围。针对完全无监督图像翻译任务的方法能够解决域标签的限制问题,但是普遍存在源域信息丢失的现象。为了解决上述2个问题,提出一种基于对比学习语言-图像预训练(CLIP)的无监督图像翻译模型。首先,引入CLIP相似性损失对图像的风格特征施加约束,以在不使用数据集域标签的情况下增强模型传递图像风格信息的能力和准确性;其次,对自适应实例归一化(AdaIN)进行改进,设计一个新的双空间自适应归一化(DSAdaIN)模块,在特征的风格化阶段添加网络的学习和自适应交互过程,以加强对内容源域信息的保留;最后,设计一个鉴别器对比损失来平衡对抗网络损失的训练和优化过程。在多个公开数据集上的实验结果表明,与Star GANv2、Style DIS等模型相比,该模型可在准确传递图像风格信息的同时保留一定的源域信息,且在定量评估指标FID分数和KID分数上分别提升了近3.35和0.57×102,实现了较好的图像翻译性能。
关键词
图像翻译
生成对抗网络
对比学习语言-图像预训练模型
自适应实例归一化
对比学习
Keywords
image-to-image translation
Generative Adversarial Networks(GAN)
Contrastive Language-Image Pre-training(CLIP)model
adaptive
instance
normalization
(
adain
)
contrastive learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于字形约束和注意力的艺术字体风格迁移
被引量:
1
3
作者
吕文锐
普园媛
赵征鹏
张衡
阳秋霞
机构
云南大学信息学院
云南省高校物联网技术及应用重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第12期306-317,共12页
基金
国家自然科学基金(61271361,61761046,62162068)
国家自然科学基金(62362070)
+1 种基金
云南省科技厅应用基础研究计划重点项目(202001BB050043)
云南省科技重大专项(202302AF080006)。
文摘
艺术字体的风格迁移是一项非常有趣但又十分具有挑战性的任务,具体来说就是将目标字体的艺术风格通过某种映射方式迁移到源字体上。现有方法在字形风格迁移方面存在鲁棒性有限的不足,且当2种不同风格的字形相差较大时不能很好地将风格内容迁移到目标字体上。针对以上问题,提出一种端到端的通用网络框架模型,并在模型中引入自注意力机制和自适应实例归一化,用于实现在给定的多个文本效果域之间进行任意字体的艺术风格迁移。该模型主要包括1个生成器和2个鉴别器,还有1个额外的风格编码器。为了更好地做到字形约束以及提升网络的性能,设计几种损失函数来优化生成对抗网络(GAN)的训练。为了验证该模型的有效性,采用了FET-GAN任务中公开的艺术字体数据集。实验对比了6种先进的方法,并从定量和定性2个方面进行了比较。实验结果表明,所提模型能够实现带有字体变换的字形图像风格迁移,迁移结果能够保持很好的字形结构,并且FID值为72.355,低于对比实验中最好的结果91.435。
关键词
字体风格迁移
自注意力
自适应实例归一化
生成对抗网络
字形约束
Keywords
font style transfer
self-attention
adaptive
instance
normalization
Generative Adversarial Network(GAN)
the glyph constraints
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合时间卷积网络的空间自适应运动风格迁移方法
4
作者
张凤全
李凭辙
雷劼睿
机构
北京邮电大学数字媒体与设计艺术学院
北方工业大学信息学院
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2024年第10期1653-1662,共10页
基金
国家自然科学基金(61402016)
教育部人文社科基金(19YJC760150).
文摘
针对人体运动生成方法严重依赖有监督学习和成对数据集的问题,受图像风格迁移方法启发,提出一个融合时间卷积网络的空间自适应运动风格迁移模型,通过输入虚拟角色运动行为,生成不同的运动风格运动序列.首先,从时序性和空间性考虑,设计以时间卷积网络为主干的神经网络框架,从无配对的数据集中准确地提取运动数据的内容特征和风格特征.其次,基于空间自适应归一化方法,将其改进并适配到运动解码器中,提出一种适用于运动风格迁移的自适应方法.最后,针对运动迁移中的误差问题,在网络中引入正向运动学对沿运动链传递的关节误差进行约束,实现了对足部运动行为的约束.为验证所提方法性能,使用CMU和Xia开源数据集依次从主成分分析、数据聚类、可视化等指标进行实验.结果表明,提出的模型可以有效实现多类非配对数据的风格迁移,所生成的动画效果自然真实,具有良好的互动性和扩展性,可广泛应用于数字动画相关的虚拟人建模中.
关键词
深度学习
运动风格迁移
时间卷积网络
空间自适应实例归一化
Keywords
deep learning
motion style transfer
temporal convolutional network
spatially
adaptive
instance
normalization
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
选择性传输与铰链对抗的多图像域人脸属性迁移
被引量:
1
5
作者
林泓
陈壮源
任硕
李琳
李玉强
机构
武汉理工大学计算机科学与技术
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第4期179-190,共12页
基金
国家社会科学基金(15BGL048)。
文摘
在基于生成对抗网络的人脸属性迁移过程中,存在图像域表达形式单一、图像域迁移细节失真的问题。提出一种结合选择性传输单元与铰链对抗损失的多图像域人脸属性迁移方法。在生成器中,利用自适应实例归一化融合图像的内容信息与图像域控制器生成的样式信息,增加图像域表达方式的多样性,同时通过选择性传输单元将下采样提取的内容特征根据相对属性标签选择性地传输到上采样,形成融合特征以增强图像的细节信息。在判别器中,通过增加双尺度判别,协同鉴定人脸图像的真伪及类别,从而提高判定的准确度。在此基础上,设计融合相对鉴别和铰链损失的对抗损失函数,增强真伪图像域之间的联系。在CelebA数据集上的实验结果表明,与StarGAN、STGAN等主流的多图像域人脸属性迁移方法相比,该方法能够建立更准确的多图像域映射关系,提高迁移图像的质量同时增加迁移图像表达的多样性。
关键词
生成对抗网络
多图像域属性迁移
自适应实例归一化
选择性传输单元
相对属性标签
域控制器
双尺度判别
Keywords
Generative Adversarial Network(GAN)
attribute migration across multiple image domains
adaptive
instance
normalization
Selective Transfer Units(STU)
relative attributes label
domain controller
dual-scale discrimination
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于参考图语义匹配的花卉线稿工笔效果上色算法
6
作者
李媛
陈昭炯
叶东毅
机构
福州大学计算机与大数据学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第6期1271-1285,共15页
基金
国家自然科学基金项目(61672158)
福建省自然科学基金项目(2018J01798)。
文摘
研究基于参考图像的花卉线稿图的工笔效果上色问题.现有的基于参考图像的线稿图上色算法对工笔花卉画特有的色彩渐变的特点难以学习和模拟;此外通常还要求参考图像与线稿图具有相似的几何布局结构,这也限制了算法的适用性,故而直接采用现有算法难以实现线稿图的工笔效果上色.基于条件生成对抗网(conditional generative adversarial network,CGAN)框架,提出了一种将参考图像与线稿图进行语义匹配的花卉线稿图工笔效果上色算法RBSM-CGAN.该算法在网络结构设计方面,以U型网络(简称U-Net)为生成器基础,设计了2个附加子模块:1)语义定位子模块.该模块预训练了一个语义分割网络,以生成花卉线稿图的语义标签图,该标签图编码后作为自适应实例归一化的仿射参数引入到上色模型中,提升对不同语义区域的识别能力,进而提高颜色定位的准确性.2)颜色编码子模块.该模块提取参考图像的颜色特征,而后将该特征拼接到生成网络解码层的前3层,利用这种方式将颜色信息注入上色模型,与语义定位模块相配合加强算法对渐变色的学习和模拟.另外,算法在网络训练方面改变传统的“工笔花卉原作-花卉线稿图”数据对的训练方式,通过打乱原作的几何结构等摄动操作生成原作摄动图,采用“原作摄动图-花卉线稿图”数据对进行网络训练,降低了模型对原作空间几何结构的依赖性,提升了算法的适用性.实验结果表明:该算法对用户选择的参考图像的颜色语义具有正确的响应,所引入的“语义定位+颜色编码”的结构设计提升了对渐变色的模拟效果,实现了在不同参考图像指导下的花卉线稿图的工笔效果上色,可快速生成多样化的上色结果.
关键词
工笔花卉上色
语义匹配
条件生成对抗网络
语义分割网络
自适应实例归一化
Keywords
meticulous flower coloring
semantic matching
conditional generative adversarial network(CGAN)
semantic segmentation network
adaptive
instance
normalization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于字形感知和注意力归一化的字体迁移
被引量:
2
7
作者
吕文锐
普园媛
赵征鹏
徐丹
钱文华
机构
云南大学信息学院
云南省高校物联网技术及应用重点实验
出处
《计算机科学》
CSCD
北大核心
2023年第S01期398-403,共6页
基金
国家自然科学基金(62162068,61271361,61761046,62061049)
云南省应用基础研究面上项目(2018FB100)
云南省科技厅应用基础研究计划重点项目(202001BB050043,2019FA044)。
文摘
字体迁移是一项十分具有挑战性的任务,其目的是将目标字体通过某种映射方式迁移到源字体,以实现字体的变换。现有的方法在字体迁移方面的鲁棒性有限,突出表现为对生成字体结构完整性的保持较差,尤其是当两种不同种类的字体差别较大时。针对这些问题,提出了一种端到端的字体迁移网络框架模型。该模型引入了注意力归一化以更好地提取字形图像的高级语义特征,从而提高生成图像的质量。此外,使用自适应实例归一化进行字体特征和内容特征融合,以实现字体的转换。在保持字形结构完整性方面,设计了感知损失和上下文损失来约束字形结构的生成。为了稳定GAN网络的训练,在对抗损失函数的设计中加入了正则化项。为了验证该模型的有效性,实验采用FET-GAN中公开的数据集进行了多组训练和测试,并与FET-GAN,CycleGAN和StarGANv2进行了对比。实验结果表明,该模型能够在给定的多个字体域之间实现相互的字体迁移,并且其迁移的效果和模型泛化能力与其他工作相比均具有一定的优势。
关键词
字体迁移
自适应实例归一化
注意力归一化
上下文损失
感知损失
Keywords
Font transfer
adaptive
instance
normalization
Attentive
normalization
Context loss
Perception loss
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
采用表示分离自编码器的任意说话人语音转换
简志华
章子旭
《通信学报》
EI
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
2
基于CLIP和双空间自适应归一化的图像翻译
李田芳
普园媛
赵征鹏
徐丹
钱文华
《计算机工程》
CAS
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
3
基于字形约束和注意力的艺术字体风格迁移
吕文锐
普园媛
赵征鹏
张衡
阳秋霞
《计算机工程》
CAS
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
4
融合时间卷积网络的空间自适应运动风格迁移方法
张凤全
李凭辙
雷劼睿
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
5
选择性传输与铰链对抗的多图像域人脸属性迁移
林泓
陈壮源
任硕
李琳
李玉强
《计算机工程》
CAS
CSCD
北大核心
2022
1
在线阅读
下载PDF
职称材料
6
基于参考图语义匹配的花卉线稿工笔效果上色算法
李媛
陈昭炯
叶东毅
《计算机研究与发展》
EI
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
7
基于字形感知和注意力归一化的字体迁移
吕文锐
普园媛
赵征鹏
徐丹
钱文华
《计算机科学》
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部