期刊文献+
共找到212篇文章
< 1 2 11 >
每页显示 20 50 100
一种基于预训练的条件文本生成方法
1
作者 邵党国 孔宪媛 +3 位作者 马磊 安青 黄琨 相艳 《中文信息学报》 北大核心 2025年第7期127-137,共11页
随着电子商务的发展,人们需要从产品的评论中更加全面地了解产品信息,高质量的评论文本对于客户黏度和社会舆论发挥着重要作用。传统的中文文本生成模型表现良好,却不能有效结合先验知识并根据条件情感输入生成对应情感极性的文本。该... 随着电子商务的发展,人们需要从产品的评论中更加全面地了解产品信息,高质量的评论文本对于客户黏度和社会舆论发挥着重要作用。传统的中文文本生成模型表现良好,却不能有效结合先验知识并根据条件情感输入生成对应情感极性的文本。该文提出一种条件评论文本生成模型,将预训练语言模型与生成对抗网络结合起来,利用预训练模型较好的语言理解能力学习真实文本中概率分布。该文通过在生成器层标准化中引入条件层标准化,达到根据输入情感标签自动生成对应情感极性文本的目的。在电商评论数据集上的实验表明,该模型相较于传统的Seq2Seq模型和SeqGAN模型,不仅引入条件情感输入,并且生成效果更优、文本质量更高。 展开更多
关键词 BERT SeqGAN 条件层标准化 条件文本生成
在线阅读 下载PDF
对比学习改进文本生成图像方法的研究
2
作者 赵宏 王贺 李文改 《计算机工程与应用》 北大核心 2025年第14期264-273,共10页
针对现有文本生成图像方法中仅依赖图像和文本之间的语义相似度损失为约束,模型难以有效学习到图像与对应多个文本之间的关系,导致生成图像和文本之间语义匹配度低的问题,提出一种引入对比学习对文本生成图像模型改进的方法。在训练阶段... 针对现有文本生成图像方法中仅依赖图像和文本之间的语义相似度损失为约束,模型难以有效学习到图像与对应多个文本之间的关系,导致生成图像和文本之间语义匹配度低的问题,提出一种引入对比学习对文本生成图像模型改进的方法。在训练阶段,采用对比学习的方法,计算同一图像的不同文本生成图像之间的对比损失,使模型能够学习同一图像的不同文本表示,以提高生成图像和文本语义的一致性。同时,计算生成图像与真实图像之间的对比损失,保证生成图像向真实图像靠拢。在生成器中,设计一种新的特征融合模块,通过注意力图作为条件,引导图像特征与文本特征对齐,从而提高生成图像的细节表达。实验结果表明,与基准模型相比,在CUB数据集上的Inception Score分数提高了7.32%,Fréchet Inception Distance分数下降了21.06%;在COCO数据集上的Fréchet In-ception Distance分数下降了36.43%。证明该方法生成的图像具有更好的文本语义一致性和真实性。 展开更多
关键词 文本生成图像 生成对抗网络(GAN) 对比学习 特征融合 语义一致性
在线阅读 下载PDF
PromptVis:面向文本生成图片的提示词的交互式可视分析方法 被引量:2
3
作者 卢裕弘 封颖超杰 +4 位作者 朱琳 周海怡 朱航 喻晨昊 陈为 《计算机辅助设计与图形学学报》 北大核心 2025年第4期688-696,共9页
高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用... 高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用户输入的提示词语句进行成分解析,并提供改进提示词的建议,如推荐相关的提示词;然后将用户输入与系统推荐的提示词集合进行聚类呈现,并支持用户交互探索;第三,从多个维度自动评估文本提示词和生成的图片,为用户修改提示词提供参考;第四,根据推荐的提示词对现有图片进行局部调整,支持用户预览提示词的修改效果.通过用户对比实验,从提示词创作效率分析和实用性问卷评估2个角度,证明了所提方法在辅助用户进行提示词创作上的实用性与有效性. 展开更多
关键词 文本生成图片 提示词工程 提示词可视化
在线阅读 下载PDF
基于术语提示双路文本生成的方面情感三元组抽取
4
作者 李银强 蓝天 +4 位作者 刘瑶 向飛阳 孙丽纯 杜知涵 刘峤 《计算机研究与发展》 北大核心 2025年第4期915-929,共15页
方面情感三元组抽取(aspect sentiment triplet extraction,ASTE)是方面级情感分析(aspect based sentiment analysis,ABSA)中具有挑战性的子任务之一,旨在从文本中抽取方面术语、观点术语和情感极性三元组.近期基于生成式的抽取方法取... 方面情感三元组抽取(aspect sentiment triplet extraction,ASTE)是方面级情感分析(aspect based sentiment analysis,ABSA)中具有挑战性的子任务之一,旨在从文本中抽取方面术语、观点术语和情感极性三元组.近期基于生成式的抽取方法取得了出色的表现,这些方法通过顺序串联目标三元组来实现自回归式三元组生成.然而,这种串联方法可能导致无序三元组之间存在顺序依赖,从而在解码过程中引入错误累积.为解决这个问题,提出了基于术语提示双路文本生成(term-prompted and dual-path text generation,TePDuP)的方法.该方法首先利用机器阅读理解(machine reading comprehension,MRC)实现方面术语和观点术语的并行化抽取,然后将它们作为提示前缀来引导条件式三元组的生成,形成双路文本生成框架.同时,在训练阶段引入计划采样的方法来修正MRC抽取错误所带来的偏差.为进一步提高性能,引入生成概率将方面术语和观点术语引导的结果合并,以增强模型的鲁棒性.基于ASTE-DATA-V2数据集的实验结果表明,提出的方法是有效的且明显优于其他基线模型,并给出具体案例分析,证明该方法一定程度上解决了前述问题. 展开更多
关键词 方面级情感分析 三元组抽取 文本生成 机器阅读理解 计划采样
在线阅读 下载PDF
基于语义增强和特征融合的文本生成图像方法
5
作者 吴昊文 王鹏 +3 位作者 李亮亮 邸若海 李晓艳 吕志刚 《计算机工程与应用》 北大核心 2025年第15期229-240,共12页
文本生成图像是机器学习领域中非常具有挑战性的任务,虽然目前已有很大的突破,但仍然存在图像细粒度不够和语义一致性弱的问题,因此提出了一种基于语义增强和特征融合的文本生成图像方法(SEF-GAN)。针对初始特征表征不足问题,提出了空... 文本生成图像是机器学习领域中非常具有挑战性的任务,虽然目前已有很大的突破,但仍然存在图像细粒度不够和语义一致性弱的问题,因此提出了一种基于语义增强和特征融合的文本生成图像方法(SEF-GAN)。针对初始特征表征不足问题,提出了空间交叉重建模块,对不同信息量特征图进行分离与交叉重建,获得更精细化特征。为了提高文本属性信息的有效利用表征,设计了语义关联注意力模块,提高了文本描述和视觉内容之间的语义一致性。为了充分利用图像区域特征与文本语义标签之间的隐藏联系,构建了通道特征融合模块,将区域图像特征与文本隐层特征进行仿射,对目标区域重构并保留图像中与文本无关内容,并连接反残差结构进一步增强特征表达能力。在CUB和COCO数据集上实验结果表明,相对于现有先进方法,该方法将IS指标分别提高了18.8%和6.3%,FID指标分别提高了33.9%和14.6%,RP指标分别提高了10.9%和3.3%。证实所提方法能有效生成细节更丰富的图像,与文本描述更加吻合。 展开更多
关键词 文本生成图像 生成对抗网络 属性特征学习 图像语义融合 反残差结构
在线阅读 下载PDF
基于文本生成与迭代匹配的图像-文本检索
6
作者 潘莹莹 马青 白琮 《计算机辅助设计与图形学学报》 北大核心 2025年第5期856-864,共9页
跨模态图文检索由于图像和文本的特征表示方式不同面临着模态异构问题,传统的公共空间方法难以度量图像和文本的相似性.为此,提出了基于文本生成与迭代匹配的跨模态图像文本检索框架,它包含了特征融合模块和文本生成模块.特征融合模块... 跨模态图文检索由于图像和文本的特征表示方式不同面临着模态异构问题,传统的公共空间方法难以度量图像和文本的相似性.为此,提出了基于文本生成与迭代匹配的跨模态图像文本检索框架,它包含了特征融合模块和文本生成模块.特征融合模块通过迭代融合的方式,多次对齐图像和文本,在不同的迭代步骤中聚合细粒度信息,捕获图像和文本之间的局部关联信息,优化了局部公共嵌入空间;文本生成模块采用特征转换的思路,由图像模态中的特征映射到文本模态中的句子特征,通过图文信息交互增强了图像和文本的整体语义相关性,优化了全局公共嵌入空间,挖掘出图像与文本更深层的语义信息,以提高跨模态图像文本检索模型的性能.在Flickr30K和COCO数据集上进行了实验,并与现有的模型进行比较,结果表明,该框架在Flickr30K和COCO上的整体性能分别提升了0.7%和1.2%.在文本检索任务的召回指标中,最高可以提升3.4%;在图像检索任务的召回指标中,最高可以提升4.6%.消融实验也证明了其中特征融合模块以及文本生成模块的有效性. 展开更多
关键词 跨模态图文检索 文本生成 公共空间 特征融合 迭代匹配
在线阅读 下载PDF
基于自提示因果推理增强的跨域文本生成
7
作者 刘小明 黄柄涵 +1 位作者 杨关 刘杰 《中文信息学报》 北大核心 2025年第8期170-184,共15页
现有的大型语言模型(Large Language Models,LLMs)文本生成方法在面对缺乏大规模标注数据的特定领域时,缺少可学习的源域数据,这使得LLMs在处理特定术语和专业知识时容易产生虚假相关性问题。为解决这一问题,该文提出了一种基于自提示... 现有的大型语言模型(Large Language Models,LLMs)文本生成方法在面对缺乏大规模标注数据的特定领域时,缺少可学习的源域数据,这使得LLMs在处理特定术语和专业知识时容易产生虚假相关性问题。为解决这一问题,该文提出了一种基于自提示因果推理增强的专家协作框架,通过建立领域知识提取模块,以挖掘LLMs固有的领域背景知识,并通过设计因果关系提取模块来增强LLMs的因果关系发现能力,进一步提高模型对因果关系信息的利用,从而有效减轻了跨域文本生成中的虚假相关性问题;同时通过训练多个解码头实现并行解码,以减少框架带来的额外时间开销。实验结果表明,该框架在问答任务中的LogiQA、CommonsenseQA和MedQA数据集上的Acc值相较于Llama2-70b基准模型分别提高了16.57%、7.94%和16.32%。同时在HotpotQA数据集和其他6个低资源领域数据集上表现优异,证实了自提示因果推理在提高跨域文本生成准确性和减少虚假相关性方面的有效性。 展开更多
关键词 跨域文本生成 因果推理 零样本
在线阅读 下载PDF
基于文本生成的多粒度评论情感分析
8
作者 张佳威 王中卿 陈嘉沥 《计算机科学》 北大核心 2025年第10期239-246,共8页
随着社交媒体和在线评论平台的兴起,自动化的情感分析成为了理解公众情绪、消费者偏好及市场趋势的关键工具。传统的情感分析方法往往使用分类模型关注于提取文本的总体情绪倾向,忽视了评论中可能蕴含的复杂且多维度的情感信息。针对这... 随着社交媒体和在线评论平台的兴起,自动化的情感分析成为了理解公众情绪、消费者偏好及市场趋势的关键工具。传统的情感分析方法往往使用分类模型关注于提取文本的总体情绪倾向,忽视了评论中可能蕴含的复杂且多维度的情感信息。针对这一问题,提出了一种基于文本生成的多粒度评论情感分析模型,旨在细致地捕捉评论文本中方面级的情感和文档级的情感。同时,构建了一种结构化输出格式,其同时包含评论文本针对不同方面的情感标签和评论文本的总体情感标签。与传统的分类模型相比,所提模型通过不同的生成方式更全面地理解和反映了文本的情感结构,实现了对评论中多方面情感信息和总体情感的抽取和分类。实验结果表明,所提模型在总体情感和方面情感的识别中优于常规的分类方法,较Bert+LSTM模型F1值提升了4.4%。 展开更多
关键词 自然语言处理 文本生成 结构化输出 多粒度 评论情感分析
在线阅读 下载PDF
一种新的基于凸损失函数的离散扩散文本生成模型
9
作者 李思慧 蔡国永 +1 位作者 蒋航 文益民 《计算机科学》 北大核心 2025年第10期231-238,共8页
扩散语言模型采用的非自回归生成方式能显著提高推理速度,通过迭代重建过程持续优化能提高生成文本质量,因此它在文本生成任务中具有极大潜力。然而,扩散语言模型训练多采用基于极大似然估计的交叉熵损失,即便生成了正确句,也可能因为... 扩散语言模型采用的非自回归生成方式能显著提高推理速度,通过迭代重建过程持续优化能提高生成文本质量,因此它在文本生成任务中具有极大潜力。然而,扩散语言模型训练多采用基于极大似然估计的交叉熵损失,即便生成了正确句,也可能因为没有与参考句严格对齐被惩罚,使扩散语言模型面临严重的多模态问题,进而大大降低了文本生成质量。为了缓解多模态问题,提出了一种基于凸损失函数训练的离散扩散语言模型ConvexDiffusion,该模型利用凸函数可以锐化最优分布这一特性,使模型更专注于高概率输出;为了进一步提高文本生成质量,降低生成词的重复率,设计了一种使噪声标记非线性变化的混合感知噪声表,并在解码过程中采用高置信度确定性去噪策略。在机器翻译、问题生成、问题阐述这3类文本生成任务上的实验结果表明,ConvexDiffusion相比现有领先的扩散模型RDM和非自回归模型CMLM等,性能提升了1~7个BLEU,且具有更快的生成速度。特别是在WMT16’EN-RO和WMT14’EN-DE这两个大型数据集上,ConvexDiffusion的表现超越了目前主导文本生成领域的自回归语言模型。 展开更多
关键词 扩散模型 文本生成 多模态问题 损失函数 凸损失函数
在线阅读 下载PDF
基于离散扩散模型的序列到序列文本生成方法
10
作者 蒋航 蔡国永 李思慧 《计算机科学与探索》 北大核心 2025年第3期764-773,共10页
扩散语言模型是目前非自回归模型中最具潜力的语言模型,有望取代饱受推理速度缓慢问题拖累的自回归语言模型,实现高效且无损于质量的文本生成。文本摘要生成、机器翻译、对话生成等序列到序列的生成任务是扩散语言模型经常遇到的实际应... 扩散语言模型是目前非自回归模型中最具潜力的语言模型,有望取代饱受推理速度缓慢问题拖累的自回归语言模型,实现高效且无损于质量的文本生成。文本摘要生成、机器翻译、对话生成等序列到序列的生成任务是扩散语言模型经常遇到的实际应用场景,如何更好更快地实现序列到序列的文本生成一直是自然语言处理领域的研究重点。为了实现上述目标,通过推导离散扩散模型训练目标的上界简化了扩散模型的训练过程,随后引入并改造了条件掩码语言模型的遮掩-预测解码策略作为扩散模型的推理算法,提升了模型的生成质量。为了进一步提升离散扩散模型在推理的前几轮生成文本的质量,还提出了正弦噪音调度,相比于原来的线性噪音调度,时间步中高噪音区间变得更大了,模型将更专注于学习如何从高噪音数据中恢复数据,从而提升在推理的前几轮中生成文本的质量。受到课程学习策略的启发,设计了新的时间步采样分布,通过操纵时间步的采样实现由易到难的学习。在公开数据集上的实验表明,提出的方法能有效提升模型的性能,在WMT16 EN-RO数据集上,扩散模型仅用自回归基线一半的推理时间,就能推理出相同生成质量的文本。 展开更多
关键词 扩散模型 语言模型 文本生成 序列到序列 非自回归模型
在线阅读 下载PDF
基于扩散模型的文本生成材质贴图的泛化性优化方法
11
作者 涂晴昊 李元琪 +2 位作者 刘一凡 过洁 郭延文 《图学学报》 北大核心 2025年第1期139-149,共11页
针对现有的材质贴图数据集存在着文字描述不足且纯图像数据集规模庞大的现状,及传统的生成模型推理错误时难以获得额外的超参数来生成新的结果等问题,提出一种基于稳定扩散模型的文本生成材质贴图的泛化性优化方法,采用分阶段的方式训... 针对现有的材质贴图数据集存在着文字描述不足且纯图像数据集规模庞大的现状,及传统的生成模型推理错误时难以获得额外的超参数来生成新的结果等问题,提出一种基于稳定扩散模型的文本生成材质贴图的泛化性优化方法,采用分阶段的方式训练模型:使用大规模纯图像数据集对扩散模型进行微调,以拟合图像的生成;使用小规模含文本标注的数据集学习语义信息;引入新的解码器对扩散模型生成的隐编码重建得到材质贴图;最终可以通过输入文本描述获得多组随机生成的且符合描述的材质贴图结果。该方法使用Colossal架构组织代码,大大降低了训练的硬件要求;将图像拟合数据集、语义信息学习的工作分开,使用大规模图像数据集拟合模型参数,使用小规模文本数据学习语义信息,提高了模型的泛化性,减少了对多模态数据集规模的需求。 展开更多
关键词 扩散模型 泛化性 多模态 文本驱动材质贴图生成 材质编辑器
在线阅读 下载PDF
可控文本生成技术研究综述 被引量:4
12
作者 王舰 孙宇清 《中文信息学报》 CSCD 北大核心 2024年第10期1-23,共23页
可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的... 可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的长文本形式多样、语言灵活以及逻辑合理等,这使得可控文本生成任务更具挑战性且难以评估。近年来,数据驱动的神经方法得到了广泛应用,特别是大规模预训练语言模型大幅度提升了生成文本质量。该文综述这些生成方法中的代表性技术架构和模型,讨论文本生成领域定性和定量评价指标,以及相关数据集;针对可控文本生成任务的文本多样性和句子间语义一致性等高层次需求,重点讨论相关技术前沿进展,分析其理论依据和技术优势;最后总结可控文本生成任务仍然面临的挑战和未来发展方向。 展开更多
关键词 可控文本生成 文本评估 文本多样性 文本生成
在线阅读 下载PDF
基于知识图谱的冬奥赛事气象服务文本生成方法研究 被引量:1
13
作者 丰德恩 张雪英 +4 位作者 唐卫 王益鹏 王慕华 渠寒花 李敏 《科学技术与工程》 北大核心 2024年第16期6600-6609,共10页
气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和... 气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和固定的形式。针对以上问题,结合自然语言处理技术提出基于知识图谱的冬奥赛事气象服务文本生成方法。重点从历史赛事气象服务文本中进行内容分析和特征提取,利用气象数据和历史赛事信息构建高山滑雪赛事知识图谱。该方法根据实时气象数据和文稿模板生成天气描述文本,然后基于知识图谱查询推理技术得到赛事影响结果并生成相应文本。实验结果表明:气象服务文本的自动生成结果具有较好的准确性和可读性,有助于冬奥赛事的顺利推进,该文本生成方法面向特定领域也具有较好的应用前景。 展开更多
关键词 知识图谱 文本生成 气象服务 冬奥赛事 知识推理
在线阅读 下载PDF
结合语义分割图的注意力机制文本生成图像 被引量:2
14
作者 梁成名 李云红 +3 位作者 李丽敏 苏雪平 朱绵云 朱耀麟 《空军工程大学学报》 CSCD 北大核心 2024年第4期118-127,共10页
针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合... 针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合文本信息。其次结合语义分割图像,提取其边缘轮廓特征,为模型提供额外的生成和约束条件。然后采用注意力机制为模型提供细粒度词级信息,丰富所生成图像的细节。最后使用多模态相似度计算模型计算细粒度的图像-文本匹配损失,更好地训练生成器。通过CUB-200和Oxford-102 Flowers数据集测试并验证模型,结果表明:所提模型(SSA-GAN)与StackGAN、AttnGAN、DF-GAN以及RAT-GAN等模型最终生成的图像质量相比,IS指标值最高分别提升了13.7%和43.2%,FID指标值最高分别降低了34.7%和74.9%,且具有更好的可视化效果,证明了所提方法的有效性。 展开更多
关键词 文本生成图像 语义分割图像 生成对抗网络 注意力机制 仿射变换
在线阅读 下载PDF
基于内在质量约束的文本生成和评价综述 被引量:1
15
作者 兰玉乾 饶元 +3 位作者 李冠呈 孙菱 夏昺灿 辛婷婷 《电子学报》 EI CAS CSCD 北大核心 2024年第2期633-659,共27页
近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的... 近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的事实性错误,而且也需要依靠提示内容来控制细致的生成质量和领域适应性,因此,研究以内在质量约束为核心的文本生成方法仍具有重要意义.本文在近年来关键的内容生成模型和技术对比研究的基础上,定义了基于内在质量约束的文本生成的基本形式,以及基于“信、达、雅”的6种质量特征;针对这6种质量特征,分析并总结了生成器模型的设计和相关算法;同时,围绕不同的内在质量特征总结了多种自动评价和人工评价指标与方法.最后,本文对文本内在质量约束技术的未来研究方向进行了展望. 展开更多
关键词 自然语言处理 语言模型 文本生成 文本质量 文本评价
在线阅读 下载PDF
文本生成图像研究综述 被引量:12
16
作者 曹寅 秦俊平 +4 位作者 马千里 孙昊 闫凯 王磊 任家琪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第2期219-238,共20页
对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像.针对基于生成对抗网络架构的文本生成图像方法,按照改... 对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像.针对基于生成对抗网络架构的文本生成图像方法,按照改进的不同技术点归纳为6小类:采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型.通过对不同方法的分析,总结并讨论了现有的文本生成图像方法通用评估指标和数据集. 展开更多
关键词 人工智能生成内容 文本生成图像 生成对抗网络 自回归模型 扩散模型
在线阅读 下载PDF
基于自监督注意和图像特征融合的文本生成图像方法 被引量:3
17
作者 廖涌卉 张海涛 金海波 《液晶与显示》 CAS CSCD 北大核心 2024年第2期180-191,共12页
现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺... 现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题,提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段,利用注意机制进行图像特征之间的自主映射学习,通过特征的上下文关系引导动态注意矩阵,实现上下文挖掘和自注意学习的高度结合,提高低分辨率图像特征的生成效果,后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块,通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合,生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息,更加保证了不同分辨率特征图的语义一致性,从而实现高分辨率的逼真的图像生成。实验结果表明,相较于基准模型(AttnGAN),SAF-GAN模型在IS和FID指标上均有改善,在CUB数据集上的IS分数提升了0.31,FID指标降低了3.45;在COCO数据集上的IS分数提升了2.68,FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像,证明了该方法的有效性。 展开更多
关键词 计算机视觉 生成对抗网络 文本生成图像 CotNet 图像特征融合
在线阅读 下载PDF
融合XLnet与DMGAN的文本生成图像方法 被引量:1
18
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 XLnet模型 生成对抗网络 通道注意力
在线阅读 下载PDF
基于扩散序列的多元可控文本生成
19
作者 李晨阳 张龙 +1 位作者 郑秋生 钱少华 《计算机应用》 CSCD 北大核心 2024年第8期2414-2420,共7页
随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义... 随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先,在ChnSentiCorp数据集的基础上完成主题和情感属性的扩展,同时,为构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列执行扩散过程,使用预训练模型ERNIE 3.0(Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation)的编码解码能力贴合扩散模型的加噪去噪过程,最终生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,所提模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得0.13和0.01的BERTScore值的提升,困惑度分别下降了14.318和9.46。 展开更多
关键词 扩散模型 序列扩散 预训练模型 提示 文本生成 可控生成 细粒度情感
在线阅读 下载PDF
基于信息抽取和文本生成的自动文摘系统设计 被引量:13
20
作者 刘挺 吴岩 王开铸 《情报学报》 CSSCI 北大核心 1997年第S1期31-36,共6页
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文... 本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织。 展开更多
关键词 自动文摘 信息抽取 文本生成
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部