期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于改进信息最大化生成对抗网络的风光出力场景可控生成方法 被引量:8
1
作者 陈凡 陈刘明 +2 位作者 王曼 徐鸿琪 周小雨 《电网技术》 EI CSCD 北大核心 2024年第4期1477-1486,I0030,I0031-I0033,共14页
基于深度学习的场景生成方法能够自适应挖掘历史数据中高维非线性特征,在风光出力的不确定性建模中得到了广泛应用。然而,基于深度学习的场景生成方法多为黑盒模型,存在可解释性差、生成不可控等问题。为此,提出了一种基于改进信息最大... 基于深度学习的场景生成方法能够自适应挖掘历史数据中高维非线性特征,在风光出力的不确定性建模中得到了广泛应用。然而,基于深度学习的场景生成方法多为黑盒模型,存在可解释性差、生成不可控等问题。为此,提出了一种基于改进信息最大化生成对抗网络(information maximizing generative adversarial nets,Info GAN)的风光出力场景生成方法。该方法在目标函数中增加了基于互信息的正则化项,最大化控制编码与生成场景之间的互信息,无监督学习控制编码与生成场景统计特征的映射关系,并引入Gumbel-Softmax分布提高了生成场景的质量。结合风电场和光伏电站的真实数据进行了算例分析,算例结果表明,所提方法不仅能准确描述风光出力不确定性,而且具有可解释性,能够可控生成指定风光出力场景。 展开更多
关键词 场景生成 风光出力 可解释性 信息最大化生成对抗网络 Gumbel-Softmax分布 可控生成
在线阅读 下载PDF
FG-ECVG:细粒度情感可控的视频生成算法
2
作者 卫青蓝 段笑妍 +2 位作者 肖红江 薛瑞琪 王宇豪 《计算机辅助设计与图形学学报》 北大核心 2025年第3期396-406,共11页
情感引导的多媒体内容生成是推动可控人工智能内容生成技术发展的重要一环,对于丰富公众表达情绪和观点的方式具有独特价值.针对大模型生成的视觉内容情感属性模糊、交互性弱的问题,提出一种基于文本指令优化的视频生成算法FG-ECVG,可... 情感引导的多媒体内容生成是推动可控人工智能内容生成技术发展的重要一环,对于丰富公众表达情绪和观点的方式具有独特价值.针对大模型生成的视觉内容情感属性模糊、交互性弱的问题,提出一种基于文本指令优化的视频生成算法FG-ECVG,可以实现自动化生成高情感可控、强交互性的文本指令到视频内容.首先基于效价-唤醒-控制情感模型构建一个引导词典,并基于该词典对输入文本进行情感极性分析和情感引导词匹配,实现整体视觉氛围的情感控制;然后基于检索—增强—生成算法构建一个视觉细节扩写框架,为用户输入的文本指令添加结构化的类人情感视觉元素,提升生成内容的情感颗粒度.在EmoSet数据集上5类场景类别进行情感6分类内容生成,并对主观及客观微视频评价进行实验的结果表明,与仅使用生成式视觉大模型相比,所提算法生成的视频内容具有更强的情感表现力,情感2分类和情感6分类准确率分别提升23.33个百分点和20.00个百分点;与目前较新的视觉情感迁移或生成算法相比,情感6分类准确率平均提升26.67个百分点,证明了该算法的有效性和优越性. 展开更多
关键词 可控生成 文生视频 细粒度情感可控
在线阅读 下载PDF
自适应知识增强的可控故事生成模型
3
作者 孟祥仲 夏鸿斌 刘渊 《计算机工程与应用》 北大核心 2025年第12期129-140,共12页
可控故事生成是近年来自然语言处理领域内的热点方向。目前的研究通过交叉注意力机制已经能够有效地融合文本特征和事件特征,但其缺乏对于常识化知识的高效应用,仍然采用在公共的常识化知识语料库上后训练的方式,尽管这能够在一定程度... 可控故事生成是近年来自然语言处理领域内的热点方向。目前的研究通过交叉注意力机制已经能够有效地融合文本特征和事件特征,但其缺乏对于常识化知识的高效应用,仍然采用在公共的常识化知识语料库上后训练的方式,尽管这能够在一定程度上提升模型的性能,但在自适应性的方面仍然有很大的提升空间。为了解决此问题,提出自适应知识增强(adaptive knowledge enhancement,AKE)的可控故事生成模型,其中的常识化知识构建模块能够针对精调时的训练用数据集自适应地构建匹配的常识化知识语料库,确保为模型提供更相关的额外信息。此外,模型中加入了使用辅助函数进行训练的多任务学习组件,确保其能够学习到更具有判别性的特征表示,从而提升模型的泛化能力。实验结果表明,AKE在自动评测指标和人工评测指标上相较于其他基线模型均有显著提升,验证了此模型在利用常识化知识方面的优越性。 展开更多
关键词 自然语言处理 可控故事生成 交叉注意力机制 多任务学习 知识增强
在线阅读 下载PDF
基于改进条件生成对抗网络的可控场景生成方法 被引量:12
4
作者 张帅 刘文霞 +3 位作者 万海洋 吕笑影 Nawaraj Kumar Mahato 鲁宇 《电力自动化设备》 EI CSCD 北大核心 2024年第6期9-17,共9页
可再生能源发电具有较强的随机性和波动性,为实现高效可靠的场景建模,提出一种基于改进条件生成对抗网络的可控场景生成方法。提出基于条件生成对抗网络的场景生成框架,结合Transformer的全局注意力机制以及常规卷积和深度可分离卷积的... 可再生能源发电具有较强的随机性和波动性,为实现高效可靠的场景建模,提出一种基于改进条件生成对抗网络的可控场景生成方法。提出基于条件生成对抗网络的场景生成框架,结合Transformer的全局注意力机制以及常规卷积和深度可分离卷积的局部泛化机制,设计适用于提取可再生能源发电不同维度特征的网络结构;利用条件生成对抗网络模型建立低维气象特征隐空间和高维可再生能源发电数据之间的映射关系,提出一种可控场景生成方法,并建立随机场景生成、场景约减、极端场景生成和连续日场景生成4种生成策略。基于实际光伏、风电数据和气象数据的仿真结果表明,所提模型与方法能够有效学习可再生能源发电的随机性、时序性、波动性及空间相关性,实现对不同策略下场景的可控生成。 展开更多
关键词 场景生成 条件生成对抗网络 特征提取 配电网 可控生成
在线阅读 下载PDF
大小模型协同的小样本知识图谱问答问题自动生成方法 被引量:1
5
作者 赵润豪 曾维新 +2 位作者 唐九阳 吴继冰 黄宏斌 《指挥与控制学报》 北大核心 2025年第2期172-180,共9页
为解决现实知识图谱问题生成技术的低成本部署和生成可靠性的问题,提出大小模型协同的小样本知识图谱问题生成方法,通过构建OODA环思维链和小模型高效部署设计,可支撑资源匮乏作战场景下低成本部署和准确可控生成。该方法的先进性在多... 为解决现实知识图谱问题生成技术的低成本部署和生成可靠性的问题,提出大小模型协同的小样本知识图谱问题生成方法,通过构建OODA环思维链和小模型高效部署设计,可支撑资源匮乏作战场景下低成本部署和准确可控生成。该方法的先进性在多个公共数据集和军事场景得到验证。为解决资源匮乏作战场景下部署难、生成难以控制的难题提供可行路径。 展开更多
关键词 资源匮乏作战场景 大小模型协同 OODA环思维链 低成本部署 准确可控生成
在线阅读 下载PDF
基于扩散序列的多元可控文本生成
6
作者 李晨阳 张龙 +1 位作者 郑秋生 钱少华 《计算机应用》 CSCD 北大核心 2024年第8期2414-2420,共7页
随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义... 随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先,在ChnSentiCorp数据集的基础上完成主题和情感属性的扩展,同时,为构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列执行扩散过程,使用预训练模型ERNIE 3.0(Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation)的编码解码能力贴合扩散模型的加噪去噪过程,最终生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,所提模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得0.13和0.01的BERTScore值的提升,困惑度分别下降了14.318和9.46。 展开更多
关键词 扩散模型 序列扩散 预训练模型 提示 文本生成 可控生成 细粒度情感
在线阅读 下载PDF
可控文本生成技术研究综述 被引量:4
7
作者 王舰 孙宇清 《中文信息学报》 CSCD 北大核心 2024年第10期1-23,共23页
可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的... 可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的长文本形式多样、语言灵活以及逻辑合理等,这使得可控文本生成任务更具挑战性且难以评估。近年来,数据驱动的神经方法得到了广泛应用,特别是大规模预训练语言模型大幅度提升了生成文本质量。该文综述这些生成方法中的代表性技术架构和模型,讨论文本生成领域定性和定量评价指标,以及相关数据集;针对可控文本生成任务的文本多样性和句子间语义一致性等高层次需求,重点讨论相关技术前沿进展,分析其理论依据和技术优势;最后总结可控文本生成任务仍然面临的挑战和未来发展方向。 展开更多
关键词 可控文本生成 文本评估 文本多样性 长文本生成
在线阅读 下载PDF
一种适用于政务区块链的跨模态人脸生成模型 被引量:1
8
作者 崔思颖 谭志杰 +4 位作者 袁想 李伟平 莫同 乔秀全 吴中海 《南京师大学报(自然科学版)》 北大核心 2025年第2期102-111,共10页
如今,区块链技术被应用到包含电子证照、人脸图像等政府数据共享领域,但当前的大型区块链系统普遍面临低带宽和高存储成本的问题.本文提出了一种适用于政务区块链的跨模态人脸生成模型,将人脸图像转换为文本模态存储在链上,用户可使用... 如今,区块链技术被应用到包含电子证照、人脸图像等政府数据共享领域,但当前的大型区块链系统普遍面临低带宽和高存储成本的问题.本文提出了一种适用于政务区块链的跨模态人脸生成模型,将人脸图像转换为文本模态存储在链上,用户可使用文本与掩膜生成指定人的人脸图像.首先利用多任务学习方法训练基于ResNet-18网络结构的人脸分类器,将人脸图像转换为身份代号文本存储在链上.然后设计了区域感知码本和基于Transformer结构的混合专家采样器,采样器采用扩散模型的方法从码本中采样索引,采样结果由一个可学习的解码器转换成细粒度的人脸图像.在进行数据增强后的Casia Face V5数据集上的实验表明,模型在人脸分类任务中准确率可达95%以上,压缩效果达到了传统图像压缩方法1/10000的持久化时间与1/200的文件大小,与其他先进人脸图像生成方法相比,此模型可以可控地生成高保真度的指定人的人脸图像,并以1/20的参数量达到与大型预训练模型相近的人脸生成效果. 展开更多
关键词 区块链 跨模态人脸生成 可控图像生成 扩散模型 人脸识别
在线阅读 下载PDF
无监督的句法可控复述模型用于对抗样本生成 被引量:1
9
作者 杨二光 刘明童 +4 位作者 张玉洁 孟遥 胡长建 徐金安 陈钰枫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期83-90,共8页
针对使用句法可控的复述生成模型生成对抗样本时模型性能受限于复述平行语料的领域和规模的问题,提出仅需要单语语料训练的无监督的句法可控复述生成模型,用以生成对抗样本。采用变分自编码方式学习模型,首先将句子和句法树分别映射为... 针对使用句法可控的复述生成模型生成对抗样本时模型性能受限于复述平行语料的领域和规模的问题,提出仅需要单语语料训练的无监督的句法可控复述生成模型,用以生成对抗样本。采用变分自编码方式学习模型,首先将句子和句法树分别映射为语义变量和句法变量,然后基于语义变量和句法变量重构原始句子。在重构过程中,模型可以在不使用任何平行语料的情况下学习生成句法变化的复述。在无监督复述生成和对抗样本生成任务中的实验结果表明,所提方法在无监督复述生成任务中取得最佳性能,在对抗样本生成任务中可以生成有效的对抗样本,用以改进神经自然语言处理(NLP)模型的鲁棒性和泛化能力。 展开更多
关键词 无监督学习 句法可控复述生成模型 对抗样本
在线阅读 下载PDF
VTON-FG:通过图像边缘轮廓特征引导的虚拟试衣网络
10
作者 谭台哲 陈宏才 杨卓 《计算机工程与应用》 北大核心 2025年第9期255-262,共8页
针对当前虚拟试衣方法在生成手臂和服装纹理细节方面普遍存在生成模糊和不完整的问题,基于CP-VTON+模型提出了一种名为VTON-FG的虚拟试衣网络。该网络引入了特征引导模块,在试穿模块中,通过提取服装边缘轮廓特征,并将不同尺度的特征信... 针对当前虚拟试衣方法在生成手臂和服装纹理细节方面普遍存在生成模糊和不完整的问题,基于CP-VTON+模型提出了一种名为VTON-FG的虚拟试衣网络。该网络引入了特征引导模块,在试穿模块中,通过提取服装边缘轮廓特征,并将不同尺度的特征信息融合到U-Net编码器的不同层次中,从而避免手臂信息和纹理信息丢失,引导图像生成更清晰的手臂图像和纹理特征。此外,在几何匹配模块中,为解决服装变形后可能导致的纹理畸变问题,引入了边缘轮廓图损失,从而提高了服装变形后的真实性。通过一系列消融实验,逐步验证了各模块在模型性能提升中的关键作用。实验结果表明,这些针对性的改进增强了模型的性能,从而证实了各模块在整体模型架构中的有效性和重要性。相对于CP-VTON+,该方法在结构相似度SSIM、感知相似度LPIPS和IS评价指标上分别提升了2.8%、19.4%和6.9%。 展开更多
关键词 虚拟试衣 可控图像生成 特征引导 坐标注意力 边缘检测
在线阅读 下载PDF
文本风格迁移综述
11
作者 刘浦胜 吴连伟 +2 位作者 饶元 高超 王震 《中文信息学报》 北大核心 2025年第4期1-29,共29页
近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑... 近年来,人工智能技术的不断突破极大地推动了可控文本生成领域的发展,其中文本风格迁移研究作为核心技术的代表,受到学术界和工业界的广泛关注。该文梳理了近年来文本风格迁移领域的发展脉络,首先给出了文本风格迁移的定义及其面临的挑战,从应用场景、目的需求两个视角详细阐述了该领域四大类型任务,并从数据来源、标签及数据规模三方面介绍了该领域常用平行数据集及非平行数据集。此外,该文从数据增强、词汇约束解码、解纠缠、非解缠、交叉投影、伪平行语料、其他特殊策略等七个层面对现有研究方法进行了对比并重点分析了各类方法的实现机制、优缺点及其性能,随后从风格迁移准确率、内容保留度及语言困惑度三个视角归纳了文本风格迁移领域的评价指标并剖析了其评价实现原理。最后,该文展望了文本风格迁移领域的未来发展趋势并进行了总结。 展开更多
关键词 文本风格迁移 可控文本生成 自然语言生成
在线阅读 下载PDF
基于细粒度可解释矩阵的摘要生成模型
12
作者 王浩男 高扬 +3 位作者 冯俊兰 胡珉 王惠欣 柏宇 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期23-30,共8页
针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该... 针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩,捕获文章中心度高的句子,将抽取后的文本与生成器相结合,实现摘要生成。在生成端通过可解释的掩码矩阵,控制生成摘要的内容属性,在编码器端分别使用多层Transformer和预训练语言模型BERT来验证其适用性。在标准文本摘要数据集(CNN/DailyMail和NYT50)上的实验表明,所提模型的ROUGE指标和人工评估结果均优于当前最好的基准模型。实验中还构建两个测试数据集来验证摘要的更新度和相关度,结果表明所提模型在可控生成方面取得相应的提升。 展开更多
关键词 生成式摘要 可解释抽取 中心度 掩码矩阵 可控生成
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部