-
题名文本风格迁移综述
- 1
-
-
作者
刘浦胜
吴连伟
饶元
高超
王震
-
机构
西北工业大学计算机学院空天地海一体化大数据应用技术国家工程实验室
西北工业大学深圳研究院
西北工业大学重庆科创中心
西安交通大学软件学院
西北工业大学光电与智能研究院
-
出处
《中文信息学报》
北大核心
2025年第4期1-29,共29页
-
基金
国家自然科学基金(U22B2036,62202381)
广东省基础与应用基础研究基金(2021A1515110717)
+4 种基金
博士后创新人才支持计划基金
广东省面上基金(2024A1515010087)
重庆市面上基金(CSTB2022NSCQ-MSX1284)
中央高校基本业务费(D5000220185)
中国人工智能学会-华为MindSpore学术奖励基金。
-
文摘
近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑战,从应用场景、目的需求两个视角详细阐述了该领域四大类型任务,并从数据来源、标签及数据规模三方面介绍了该领域常用平行数据集及非平行数据集。此外,该文从数据增强、词汇约束解码、解纠缠、非解缠、交叉投影、伪平行语料、其他特殊策略等七个层面对现有研究方法进行了对比并重点分析了各类方法的实现机制、优缺点及其性能,随后从风格迁移准确率、内容保留度及语言困惑度三个视角归纳了文本风格迁移领域的评价指标并剖析了其评价实现原理。最后,该文展望了文本风格迁移领域的未来发展趋势并进行了总结。
-
关键词
文本风格迁移
可控文本生成
自然语言生成
-
Keywords
text style transfer
controllable text generation
natural language generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名阅读眼动追踪语料库的构建与应用研究综述
被引量:5
- 2
-
-
作者
王晓明
赵歆波
-
机构
西北工业大学计算机学院空天地海一体化大数据应用技术国家工程实验室
-
出处
《计算机科学》
CSCD
北大核心
2020年第3期174-181,共8页
-
基金
国家自然科学基金(61231016,61871326)
教育部人文社会科学研究一般项目(18YJCZH180)
陕西省社会科学基金年度项目(2019M001)~~
-
文摘
阅读文字时眼球的运动反映了人类的认知过程。阅读眼动数据是认知心理学、应用语言学、计算机科学等领域中重要的基础数据,而我国在阅读眼动研究的基础数据方面较欠缺。针对这一现状,首先介绍了阅读眼动追踪语料库产生的背景以及国内外的相关文献;然后从影响阅读眼动的低水平视觉因素和高水平视觉因素角度介绍了阅读眼动追踪语料库的内容及所使用的各项眼动指标,如单一注视时间、首次注视时间、凝视时间、总注视时间、回视出次数、回视入次数等,并分析了使用语料库研究法进行阅读眼动研究相比传统阅读眼动研究具有的3个优势;最后从语料库眼动指标变量、语料规模、语料内容、语料语种、被试规模、被试特征、采集设备等方面介绍了国外已经建成的较有影响力的若干阅读眼动追踪语料库,以供阅读眼动研究者参考。在眼动追踪语料库应用研究方面,对认知心理学、应用语言学和计算机科学等相关领域已开展的主要研究进行述评,重点介绍了在计算机科学的眼动可计算模型、自然语言处理、模式识别3个领域中基于阅读眼动追踪语料库开展的典型研究。在中文阅读眼动追踪语料库的构建与应用研究方面,介绍了我国相关研究的开展现状,分析了我国在眼动基础数据方面欠缺的原因,并从国家、科研机构、科研工作者3个层面提出了解决此问题的对策和建议。
-
关键词
眼动追踪
眼动数据
阅读眼动
语料库
人工智能
计算语言学
-
Keywords
Eye-tracking
Eye movement data
Reading eye movement
Corpus
Artificial intelligence
Computational linguistics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-