期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
PromptVis:面向文本生成图片的提示词的交互式可视分析方法 被引量:1
1
作者 卢裕弘 封颖超杰 +4 位作者 朱琳 周海怡 朱航 喻晨昊 陈为 《计算机辅助设计与图形学学报》 北大核心 2025年第4期688-696,共9页
高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用... 高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用户输入的提示词语句进行成分解析,并提供改进提示词的建议,如推荐相关的提示词;然后将用户输入与系统推荐的提示词集合进行聚类呈现,并支持用户交互探索;第三,从多个维度自动评估文本提示词和生成的图片,为用户修改提示词提供参考;第四,根据推荐的提示词对现有图片进行局部调整,支持用户预览提示词的修改效果.通过用户对比实验,从提示词创作效率分析和实用性问卷评估2个角度,证明了所提方法在辅助用户进行提示词创作上的实用性与有效性. 展开更多
关键词 文本生成图片 提示词工程 提示词可视化
在线阅读 下载PDF
结合视觉文本匹配和图嵌入的可见光-红外行人重识别 被引量:1
2
作者 张红颖 樊世钰 +1 位作者 罗谦 张涛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3662-3671,共10页
对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉... 对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉文本匹配和图嵌入的双阶段跨模态行人重识别方法。该方法通过上下文优化方案构建可学习文本模板,生成行人描述作为模态间的关联信息。具体而言,在第1阶段基于图片-文本对的预训练(CLIP)模型实现同一行人不同模态间的统一文本描述作为先验信息辅助降低模态差异。同时在第2阶段引入基于图嵌入的跨模态约束框架,设计模态间自适应损失函数,提升行人识别准确率。为了验证所提方法的有效性,在SYSU-MM01和Reg DB数据集上进行了大量实验,其中SYSU-MM01数据集上的首次命中(Rank-1)和平均精度均值(m AP)分别达到64.2%,60.2%。实验结果表明,该文所提方法能够提升可见光-红外跨模态行人重识别的准确率。 展开更多
关键词 行人重识别 跨模态 图片-文本对的预训练模型 上下文优化 图嵌入
在线阅读 下载PDF
启发式相关文本提取技术研究 被引量:4
3
作者 万钧 钟亦平 +1 位作者 傅维明 张世永 《小型微型计算机系统》 CSCD 北大核心 2004年第4期582-586,共5页
随着 WEB上图片资源的日益丰富 ,人们对 WEB图片检索的需求也日趋强烈 .基于文本检索 WEB图片 ,是人们当前检索 WEB图片的主要手段 ,其中 ,提取图片的相关文本是实现基于文本的图片检索的基础 .现有的相关文本提取技术对 WEB的复杂性理... 随着 WEB上图片资源的日益丰富 ,人们对 WEB图片检索的需求也日趋强烈 .基于文本检索 WEB图片 ,是人们当前检索 WEB图片的主要手段 ,其中 ,提取图片的相关文本是实现基于文本的图片检索的基础 .现有的相关文本提取技术对 WEB的复杂性理解不够 ,使用固定的模式提取文本 ,常常以偏概全 ,提取效果不佳 .本文进一步明确了相关文本的概念 ,使用启发式提取方法 ,让系统更智能地提取相关文本 .实验表明 ,该技术能提取到绝大部分的相关文本 。 展开更多
关键词 基于文本的web图片检索 相关文本 启发式 提取
在线阅读 下载PDF
生成对抗网络GAN的研究进展 被引量:12
4
作者 张恩琪 顾广华 +1 位作者 赵晨 赵志明 《计算机应用研究》 CSCD 北大核心 2021年第4期968-974,共7页
基于零和博弈思想的生成式对抗网络(generative adversarial network,GAN)模型的意义在于可通过无监督学习获得数据的分布,并能生成较逼真的数据。它可以应用在很多领域,尤其是在计算机视觉领域中的图像生成方面取得了很大成果,成为当... 基于零和博弈思想的生成式对抗网络(generative adversarial network,GAN)模型的意义在于可通过无监督学习获得数据的分布,并能生成较逼真的数据。它可以应用在很多领域,尤其是在计算机视觉领域中的图像生成方面取得了很大成果,成为当下的一个研究热点。以GAN模型及其在特定领域的应用结果为研究对象,对GAN的改进和扩展的研究成果进行了广泛的研究,并从图像超分辨率重建、文本合成图片等多个实际应用领域展开讨论,系统地梳理、总结出GAN的优势与不足,同时结合自然语言处理、强化学习对GAN的发展趋势及应用前景进行预测分析。 展开更多
关键词 零和博弈思想 生成式对抗网络 无监督学习 图像超分辨率重建 文本合成图片
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部