期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
符号互文、数据重组与拟像再现——Sora影像叙事的修辞学建构及其审美逻辑 被引量:3
1
作者 张伟 《云南社会科学》 北大核心 2025年第1期162-170,共9页
视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了... 视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了影像叙事的时空框架,使得由之形成的影像更具“故事性”。Sora对庞大视觉数据的学习与处理铺垫了其影像生成的深层路径,对视觉数据元素的提取与重组及其形成的互文关系成为其视觉叙事的另一修辞表征。“真实感”作为视觉修辞的内在意指为审视Sora的“形象”构建提供了理论合法性,一定程度上也揭示了Sora社会影响力的成因。符号表征、文本构建与传播效应是视觉修辞切入Sora影像叙事的三个视点,它在深度揭示人工智能视觉生产审美本质的同时,也加持了人们审视人类视觉表征场域这一非人化行动者的理性立场。 展开更多
关键词 视觉修辞 SORA “图—文”关系 互文 拟像
在线阅读 下载PDF
基于深度跨域中介模块的英文翻译
2
作者 黄笑菡 程时伟 张纪林 《计算机工程与设计》 北大核心 2025年第9期2502-2508,共7页
为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之... 为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之间的交互。通过强化文本编码器和视觉编码器提取的表征之间的语义关联,使视觉表征在语义上得到增强并演化为跨域表征。通过双重注意力解码器,利用两种独立的注意力机制分别处理文本和跨域表征的上下文,预测目标词汇。实验结果表明,集成DCIM的模型在两种英文翻译任务中基于Meteor和Ribes指标取得了最佳翻译准确性和鲁棒性。 展开更多
关键词 深度跨域中介模块 英文翻译 双重注意力解码器 文本域 视觉域 神经网络 自然语言处理
在线阅读 下载PDF
基于文本-视觉和信息熵最小化的对比学习模型
3
作者 蔡晓东 董丽芳 +1 位作者 黄业洋 周丽 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期50-56,共7页
当前的无监督对比学习方法主要依赖纯文本信息来构建句子嵌入,在全面理解句子所表达的深层含义时存在局限性。同时,传统的对比学习方法过于注重最大化文本正实例之间的互信息,忽视了句子嵌入中潜在的噪声干扰。为了既能保留文本中的有... 当前的无监督对比学习方法主要依赖纯文本信息来构建句子嵌入,在全面理解句子所表达的深层含义时存在局限性。同时,传统的对比学习方法过于注重最大化文本正实例之间的互信息,忽视了句子嵌入中潜在的噪声干扰。为了既能保留文本中的有用信息,又能有效地剔除文本嵌入中的噪声干扰,该文提出了一种基于文本-视觉和信息熵最小化的对比学习模型。首先,将文本与对应的视觉信息在对比学习的框架下进行深度融合,共同映射到一个统一的地面空间,并确保它们的表示在该空间中保持一致,从而克服了仅依赖纯文本信息进行句子嵌入学习的限制,使得对比学习过程更加全面且精确;然后,遵循信息最小化原则,在最大化文本正实例间互信息的同时,基于信息熵最小化对文本正实例进行重构。在标准语义文本相似度(STS)任务上的实验结果表明,所提出的模型在Spearman相关系数评价指标上取得了显著提升,相较于现有先进方法具有显著的优势,同时也证明了该模型的有效性。 展开更多
关键词 无监督对比学习 互信息 文本-视觉 信息熵最小化 语义文本相似度
在线阅读 下载PDF
多模态文本视觉大模型机器人地形感知算法研究 被引量:1
4
作者 孙浩 谢滔 +5 位作者 何龙 郭文忠 虞永方 吴其军 王建伟 东辉 《图学学报》 北大核心 2025年第3期558-567,共10页
为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子... 为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子块,通过增加提示点提高后续掩码质量,可显著提高地形分类准确度。然后,通过文本-图像预训练大模型CLIP,将输入视觉图像和预设地形文本信息进行匹配,并借助其可解释性和零次学习,生成各地形提示点集合。由SAM大模型接受上述集合生成带有语义标签的掩码数据,并通过Dice系数后处理筛选可用掩码。以Cityscapes数据集为地形分割样本,验证了该算法相较于监督和无监督学习框架下主流分割算法的优越性,在无需标记数据的情况下,实现了76.58%的有效掩码生成率,IoU达到90.14%。针对四足机器人地形感知任务,添加U-net编/解码器网络量化验证模块。以生成掩码作为数据集,构建轻量化地形分割模型,部署在四足机器人的边缘计算设备,并在真实环境中开展地形分割实验。实验结果表明,2种掩码优化方法分别使模型MIo U提升了2.36%和2.56%,最终轻量化模型MIoU达到96.34%,地形分割精度可靠,该算法有效指导了机器人快速地从起点安全行进到目标地,并有效避开草地等非几何障碍物。 展开更多
关键词 深度学习 文本视觉大模型 足式机器人 地形感知 计算机视觉
在线阅读 下载PDF
提要式书目的人物信息挖掘 被引量:1
5
作者 卢子言 肖卓 +1 位作者 颜欣杰 徐健 《图书馆论坛》 北大核心 2025年第2期10-21,共12页
古籍提要是对其内容、著者、版本、评价等方面的简要介绍。目前对提要式书目的研究聚焦于少量提要书籍的定性分析,得到的信息有限。对此,文章首先采用文本挖掘等方法,抽取各类书目中的人物基本信息,分析高频人物的特征;其次,从提要人物... 古籍提要是对其内容、著者、版本、评价等方面的简要介绍。目前对提要式书目的研究聚焦于少量提要书籍的定性分析,得到的信息有限。对此,文章首先采用文本挖掘等方法,抽取各类书目中的人物基本信息,分析高频人物的特征;其次,从提要人物评价视角切入,剖析人物整体评价和人物写作风格评价信息;然后基于学术流派对评价进行对比,分析不同文学流派的评价。研究发现:高频文献作者往往具有高科名、广泛学术影响力、朝代分布相对集中三类显著特征;提要撰写者最倾向于关注文献作者的个人喜好、教育经历和擅长领域;提要撰写者倾向于从文学作品主要构成角度来描述人物的写作风格,《四库全书》涉及的朝代跨度最广,提要书目中的评价情感以正向和中性为主,特别是清朝、周朝和民国时期的评价更偏向正向;提要撰写者对各学术流派的评价以中性为主,对于宋明理学流派,多本提要书目的撰写者均有提及,评价较客观和正面,相较之下,对明代七子派的评价大多源于四库馆臣,评价明显更为苛刻。这些人物信息不仅多角度地展现了人物特征和人物评价的特点,还揭示了古籍提要书目中存在的人文特征和社会规律,为古籍和历史人物研究提供了新的分析视角。 展开更多
关键词 古籍提要 文本挖掘 可视化
在线阅读 下载PDF
PromptVis:面向文本生成图片的提示词的交互式可视分析方法 被引量:2
6
作者 卢裕弘 封颖超杰 +4 位作者 朱琳 周海怡 朱航 喻晨昊 陈为 《计算机辅助设计与图形学学报》 北大核心 2025年第4期688-696,共9页
高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用... 高效地使用提示词实现文本到图片的生成是当前大模型的一个研究热点.针对现有工作在提示词工程方面的不足,提出一种面向文本生成图片的提示词的交互式可视分析方法——PromptVis,帮助用户评估并迭代改进提示词,以提升图片质量.首先对用户输入的提示词语句进行成分解析,并提供改进提示词的建议,如推荐相关的提示词;然后将用户输入与系统推荐的提示词集合进行聚类呈现,并支持用户交互探索;第三,从多个维度自动评估文本提示词和生成的图片,为用户修改提示词提供参考;第四,根据推荐的提示词对现有图片进行局部调整,支持用户预览提示词的修改效果.通过用户对比实验,从提示词创作效率分析和实用性问卷评估2个角度,证明了所提方法在辅助用户进行提示词创作上的实用性与有效性. 展开更多
关键词 文本生成图片 提示词工程 提示词可视化
在线阅读 下载PDF
药症方关联的中医药古籍交互可视分析方法
7
作者 吴泓嘉 张弛 +2 位作者 张宏鑫 陈为 夏佳志 《计算机辅助设计与图形学学报》 北大核心 2025年第8期1439-1452,共14页
中医药古代典籍承载了中医基础理论、药理知识和实践经验,具有很高的研究价值.传统的中医药古籍信息提取、过滤与简单的可视化方法未能充分地挖掘中医药理论知识内容及其相关性.针对该问题,与领域专家紧密合作,提出药症方关联的中医药... 中医药古代典籍承载了中医基础理论、药理知识和实践经验,具有很高的研究价值.传统的中医药古籍信息提取、过滤与简单的可视化方法未能充分地挖掘中医药理论知识内容及其相关性.针对该问题,与领域专家紧密合作,提出药症方关联的中医药古籍交互可视分析方法.基于《四库全书》语料预训练BERT模型,设计了一个中医药知识图谱构建与处理方法;基于中药的“君臣佐使”原理,提供了药方主症相关性计算方法;采用创新的知识图谱药方布局,支持从中医整体观和辨证论治理论,以药、症、方3个角度探查中医理论知识的关联性.与传统方法相比,该方法能更好地帮助专家从中医药古籍数据中进行高效率地探索、理解和推断.通过对比实验,所提BERTsiku-BiLSTM-CRF模型在命名实体识别任务上的精确率、召回率及F_(1)值分别达到90.57%,93.53%,91.99%;所提BERTsiku-PCNN模型在关系抽取任务上的精确率、召回率及F_(1)值分别为93.29%,75.14%,80.40%,结果均优于其他参比模型,证明了所提模型的有效性.通过2个《本草纲目》应用案例的研究,验证了交互可视分析系统的实用性,并在访谈中获得了领域专家的积极反馈. 展开更多
关键词 知识图谱 中医药 古文处理 人文可视化
在线阅读 下载PDF
基于三维城市空间的文本感知效果设计与评估
8
作者 张帆 《绿色科技》 2025年第3期145-149,共5页
计算机科学技术的发展极大地促进了三维空间中信息可视化的表达方式与类型。本文以三维城市空间为载体,研究文本感知效果的设计与应用,旨在探索三维城市空间中文本可视化的感知效果能否提升用户感知能力,从而优化用户体验。本文选取、设... 计算机科学技术的发展极大地促进了三维空间中信息可视化的表达方式与类型。本文以三维城市空间为载体,研究文本感知效果的设计与应用,旨在探索三维城市空间中文本可视化的感知效果能否提升用户感知能力,从而优化用户体验。本文选取、设计4个文本感知因子,引入屏幕空间距离与对象空间距离两个变量,结合常见数学规律组合得到不同感知效果作用函数。通过将感知效果作用函数应用于选定三维城市空间中信息数据集的方法,得到系列感知增强的文本信息可视化结果,并通过用户测试来评估与分析这些结果。基于25名用户测试结果得知,与原始可视化结果相比,本文设计的11组感知效果作用函数中有7组提升了用户找寻关键信息的感知效率(时间)与用户体验(难易度),且基于屏幕空间的感知效果优于基于对象空间的感知效果。 展开更多
关键词 感知 文本可视化 感知效果设计 三维城市空间
在线阅读 下载PDF
川剧文化大数据可视分析
9
作者 马秋梅 江兴涛 +1 位作者 曾琦峰 陈超 《计算机辅助设计与图形学学报》 北大核心 2025年第8期1465-1476,共12页
川剧作为巴蜀文化的典型代表,蕴含丰富的历史特色与艺术价值,但在可视化领域的相关研究较少.为了增加受众对川剧文化的理解,从历史起源、艺术特色和发展传承3个方面出发,基于6个可视化模块,构建了一个川剧文化大数据可视分析系统.首先... 川剧作为巴蜀文化的典型代表,蕴含丰富的历史特色与艺术价值,但在可视化领域的相关研究较少.为了增加受众对川剧文化的理解,从历史起源、艺术特色和发展传承3个方面出发,基于6个可视化模块,构建了一个川剧文化大数据可视分析系统.首先根据需求分析明确数据来源及特征,并设定可视化任务;然后采用文本、层次、时空和多维可视化技术设计川剧数据的可视化呈现方案,结合视图联动等交互技术实现多维度数据的关联与分析.系统以川剧的形成、脸谱特征变化和剧目题材发展为案例,深入分析了川剧的发展脉络与传承现状,可有效地帮助用户更好地了解川剧文化,也为今后其他领域的文化大数据研究提供一定的参考. 展开更多
关键词 川剧文化 可视分析 文本可视化 数据可视化
在线阅读 下载PDF
Sora类文生视频模型驱动主流意识形态视觉叙事的困境及突破之道 被引量:4
10
作者 杨章文 《理论月刊》 北大核心 2025年第3期15-25,159,共12页
主流意识形态视觉叙事不仅是创新我国意识形态工作的可靠支点,也是应对由Sora类文生视频模型引发的信息传播模式变革、廓清西方意识形态渗透“迷雾”的重要路径。在文生视频时代,主流意识形态视觉叙事本然在于复归感性的对象性活动本位... 主流意识形态视觉叙事不仅是创新我国意识形态工作的可靠支点,也是应对由Sora类文生视频模型引发的信息传播模式变革、廓清西方意识形态渗透“迷雾”的重要路径。在文生视频时代,主流意识形态视觉叙事本然在于复归感性的对象性活动本位,实然在于建构虚实共生的沉浸场景,应然在于实现技术驱动下的价值引领。基于“认知—情感—意动”理论的视角,Sora类文生视频模型驱动主流意识形态视觉叙事正面临着认知模式原子化、情感询唤虚拟化、意动行为畸形化的现实困境。破解主流意识形态视觉叙事的现实之困,实现叙事过程中的“知情意行同构”,应循守“致知”“激情”“诚意”“励行”的实践逻辑。其中,“知”重在筑牢认知高度,“情”力在追求情感温度,“意”旨在提升思想厚度,“行”意在突出实践力度,只有四者之间互动融合,才能不断优化主流意识形态视觉叙事的实践路径。 展开更多
关键词 SORA 文生视频模型 主流意识形态 视觉叙事 “认知—情感—意动”理论
在线阅读 下载PDF
GCANet:面向视觉物联网的标签文本检测方法
11
作者 孔二伟 窦泽亚 +2 位作者 张亚邦 贾运红 王满利 《高技术通讯》 北大核心 2025年第10期1059-1068,共10页
针对复杂环境下含标签货物实时记录困难的问题,提出一种面向视觉物联网(visual Internet of Things,VIoT)的文本检测方法。在视觉物联网中设计并引入基于全局上下文注意力和坐标注意力的文本检测网络(text detection network based on g... 针对复杂环境下含标签货物实时记录困难的问题,提出一种面向视觉物联网(visual Internet of Things,VIoT)的文本检测方法。在视觉物联网中设计并引入基于全局上下文注意力和坐标注意力的文本检测网络(text detection network based on global context attention and coordinate attention,GCANet),首先提出一种改进型坐标注意力模块,通过水平和垂直2个并行的一维池化操作,避免了因二维全局池化造成的位置信息丢失;然后引入全局上下文注意力模块,避免在复杂的背景对文本检测的影响,并防止密集或较远间隔的文本被错误地检测。该系统中提出的GCANet在公共数据集ICDAR2015、MSRA-TD500和Total-Text上的综合指标F值分别达到87.4%、86.9%和86.3%。在工业标签数据集Label-Text上平均准确率、平均召回率和平均F值分别达到93.4%、90.9%和92.1%。此外,GCANet在矿井下的标签数据集Mine-Text上准确率、召回率和F值分别达到94.4%、84.9%和89.9%。实验结果表明,本文提出的面向视觉物联网的文本检测方法效果优异。 展开更多
关键词 视觉物联网 文本检测 坐标注意力模块 全局上下文注意力模块
在线阅读 下载PDF
基于图像内容理解的判别性类别提示学习 被引量:1
12
作者 王楠井 刘阿建 +4 位作者 梁凤梅 张小梅 万军 谢珺 雷震 《电子学报》 北大核心 2025年第2期493-502,共10页
近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优化(Context Optimization,CoOp)和条件上下文优化(Conditional Context Optimization,CoCoOp)等,没有考虑图像的内容语义信息与类别的重要性,限制了模型对图像类别的理解与判别.为了解决上述问题,本文在CLIP的基础上提出了一种新方法:基于图像内容理解的判别性类别提示学习(Discriminative Category Prompt Learning based on image content understanding,DCPL),借助图像中丰富的内容特征来学习文本提示,提高文本提示对类别的判别性.具体来说,DCPL包含提示生成(Prompt Generation,PG)模块和文本监督(Text Supervision,TS)模块.PG模块将图像特征和初始化的查询向量作为输入,通过自注意力机制和交叉注意力机制使输出的文本提示中包含充分的图像语义信息;TS模块将固定的类别提示模板作为监督,为可学习文本提示在类别层面和logits层面注入类别信息,增强了类别的重要性.最后,DCPL在ImageNet、Caltech101和Oxford-Pets等11个公开分类数据集上的16-shots平均准确率达到了81.84%,较以往最优方法Cross-Modal的平均准确率提升了0.98个百分点. 展开更多
关键词 视觉-语言模型 图像识别 提示调优 注意力机制 文本监督(TS) 适配器微调 TRANSFORMER
在线阅读 下载PDF
基于人物传记文本数据的叙事可视化自动生成系统
13
作者 费彦琳 高天 +3 位作者 李俨达 石洋 曹楠 陈思明 《计算机辅助设计与图形学学报》 北大核心 2025年第8期1426-1438,共13页
传记可视化通过图形化语言描述人物的生平故事,旨在从海量传记数据中提取重要信息,并通过可视化获取洞见.针对从传记文本数据中自动生成叙事可视化存在提炼具有概括力的设计模式、设计传记可视化的自动生成流程、形成具有普适性的可视... 传记可视化通过图形化语言描述人物的生平故事,旨在从海量传记数据中提取重要信息,并通过可视化获取洞见.针对从传记文本数据中自动生成叙事可视化存在提炼具有概括力的设计模式、设计传记可视化的自动生成流程、形成具有普适性的可视化设计方案等难点,开发了基于人物传记文本数据的叙事可视化自动生成系统BioVistory.该系统以传记文本数据及其他辅助信息作为输入,运用自然语言处理的规范进行预处理;从文本中提取出事件,分为职业生涯、人物行迹、人际关系和时间信息4种不同的视角,并划分为若干人生阶段;将提取得到的事件、视角和阶段通过视觉隐喻自动生成传记可视化作品;为用户提供事件交互、视角交互和阶段交互3种不同语义层次的交互探索功能.通过案例分析和用户实验对BioVistory系统进行评估,结果表明,该系统可以自动生成高质量的传记可视化作品,能有效地支持数据驱动的叙事可视化,并增强传记文本的表现力和感染力;支持读者驱动的阅读体验,提高学习成效,增进用户参与度,同时减少用户的认知负荷. 展开更多
关键词 传记文本数据 数字人文 叙事可视化 自动生成
在线阅读 下载PDF
基于多模态分层注意力网络的玉米病害叶片识别
14
作者 商炎亮 吴凯 周文 《中国农机化学报》 北大核心 2025年第6期162-168,共7页
玉米叶片病害会影响叶片光合作用,严重影响玉米籽粒的灌浆,及时准确地检测玉米病害叶片有助于提高玉米的产量和质量,为此提出一种基于多模态分层注意力网络的小样本玉米病害叶片识别方法。首先,利用视觉特征提取网络VGG16将输入的玉米... 玉米叶片病害会影响叶片光合作用,严重影响玉米籽粒的灌浆,及时准确地检测玉米病害叶片有助于提高玉米的产量和质量,为此提出一种基于多模态分层注意力网络的小样本玉米病害叶片识别方法。首先,利用视觉特征提取网络VGG16将输入的玉米叶片映射到视觉语义空间,并逐层计算支持分支和查询分支间的语义关联。然后,利用文本转换器将玉米叶片文本标签映射到文本语义空间,并利用模态交叉注意力建立视觉与文本之间的上下文语义关联,尽可能地聚焦病害区域。最后,利用掩码平均池化技术生成指导未知玉米叶片病害的泛化原型集。在自建和开源的玉米病害叶片数据集上进行测试。结果表明:所提出模型在自建数据集上可以实现96.08%的识别精度,在开源的Plant Village数据集上可以实现98.11%的识别精度。 展开更多
关键词 玉米病害 叶片识别 视觉语义 文本语义 多模态分层注意力
在线阅读 下载PDF
文本属性激活视觉的广义零样本图像识别
15
作者 闫文尚 张桂梅 《计算机工程与应用》 北大核心 2025年第21期265-275,共11页
现有的零样本学习方法存在语义信息与视觉特征无法有效对齐,且视觉特征中存在较多冗余信息,导致零样本和广义零样本图像识别精度不佳。针对该问题,提出文本属性激活视觉的广义零样本图像识别方法。借助大语言模型生成判别性语义信息-文... 现有的零样本学习方法存在语义信息与视觉特征无法有效对齐,且视觉特征中存在较多冗余信息,导致零样本和广义零样本图像识别精度不佳。针对该问题,提出文本属性激活视觉的广义零样本图像识别方法。借助大语言模型生成判别性语义信息-文本属性。并引入类先验估计模块,计算每个文本属性的先验权重,以增强文本属性的可解释性,优化模型的性能。利用判别性文本属性激活与其对应的视觉特征,有效去除视觉特征中的冗余信息。在先验权重的引导下,将激活的视觉特征与文本属性进行跨模态对齐,以实现更精准高效的视觉语义交互,提高模型的图像识别精度。在三个基准数据集(AWA2、CUB、SUN)上进行自监督广义零样本图像识别实验,在AWA2和SUN数据集上调和平均值均达到最优,分别比次优值提高了1.1和0.8个百分点,在CUB数据集中取得次优,实验结果证明了提出方法的有效性。 展开更多
关键词 文本属性 先验权重 视觉激活 跨模态对齐
在线阅读 下载PDF
以文驭图:《诗余画谱》的文本视觉化呈现与图像改造策略
16
作者 刘青 《中国文学研究》 北大核心 2025年第4期121-127,共7页
《诗余画谱》是明万历年间宛陵汪氏编撰的词画谱,选取《草堂诗余》中97首唐宋词配以图像,其中37幅图像改造了《百咏图谱》与《顾氏画谱》中的图像,或调整画面元素呼应词中意象,或颠覆原画氛围契合情感基调,或解构经典图像隐喻词境,通过... 《诗余画谱》是明万历年间宛陵汪氏编撰的词画谱,选取《草堂诗余》中97首唐宋词配以图像,其中37幅图像改造了《百咏图谱》与《顾氏画谱》中的图像,或调整画面元素呼应词中意象,或颠覆原画氛围契合情感基调,或解构经典图像隐喻词境,通过细节增删、图像重构与抽象转译,以文学文本为主导实现词意视觉化,构建以词意为核心的图文关系。《诗余画谱》通过挪用经典图像构件,结合词作情境进行创造性调整,既保留原画元素,又赋予新意涵,是对文学性和艺术性的双重追求。画谱强化了文学对图像的主导地位,从整体视角理解词境,通过视觉符号凝练情感,推动词学复兴与图文关系转型。其“以文驭图”的实践不仅开创了文学经典的图像化阐释范式,更为后世《唐诗画谱》等诗画谱的创作奠定了追求文人审美的基础。 展开更多
关键词 诗余画谱 词意图像化 图文关系
在线阅读 下载PDF
基于多级视觉与图文动态交互的图像中文描述方法
17
作者 张军燕 赵一鸣 +1 位作者 林兵 吴允平 《计算机应用》 北大核心 2025年第5期1520-1527,共8页
图像文字描述技术可以帮助计算机更好地理解图像内容,实现跨模态交互。针对图像中文描述任务中存在的图像多粒度特征提取不全面以及图文关联性理解不充分等问题,提出一种基于多级视觉与图文动态交互的图像中文描述方法。首先,在编码器... 图像文字描述技术可以帮助计算机更好地理解图像内容,实现跨模态交互。针对图像中文描述任务中存在的图像多粒度特征提取不全面以及图文关联性理解不充分等问题,提出一种基于多级视觉与图文动态交互的图像中文描述方法。首先,在编码器端提取多级视觉特征,通过图像局部特征提取器的辅助引导模块获取多粒度特征。其次,设计图文交互模块对图文信息的语义关联进行动态关注;同时,设计特征动态融合解码器将带有图文信息动态权重的特征经过闭环动态融合并关注与解码,以保证信息增强且无缺失,从而获得语义关联性的输出。最后,生成语义通顺的图像中文描述语句。使用BLEU-n、Rouge、Meteor、CIDEr指标评估方法的有效性并与8种不同方法进行对比。实验结果显示,所提方法的语义相关性评价指标均有提升。具体而言,与基线模型NIC(Neural Image Caption)相比,所提方法在BLEU-1、BLEU-2、BLEU-3、BLEU-4、Rouge_L、Meteor、CIDEr分别提升了5.62%、7.25%、8.78%、10.85%、14.06%、5.14%、15.16%,表明该方法具有较好的准确性。 展开更多
关键词 图像中文描述 图像多级视觉特征 多粒度 图文交互 动态融合
在线阅读 下载PDF
数字人文背景下“远距离可视化阅读”探析 被引量:28
18
作者 胡悦融 马青 +3 位作者 刘佳派 梁书涵 何流 王晓光 《图书馆论坛》 CSSCI 北大核心 2017年第2期1-9,共9页
"远距离阅读"是一种新型文献阅读和理解方式,主张通过计算机处理原文,生成新的概要性内容,以支撑读者理解或学术研究。文章介绍文学类文本的"远距离可视化阅读"理论与实践,结合案例分析远距离可视化阅读面临的问题... "远距离阅读"是一种新型文献阅读和理解方式,主张通过计算机处理原文,生成新的概要性内容,以支撑读者理解或学术研究。文章介绍文学类文本的"远距离可视化阅读"理论与实践,结合案例分析远距离可视化阅读面临的问题与发展前景。 展开更多
关键词 远距离阅读 文本可视化 数字人文 文本挖掘
在线阅读 下载PDF
基于中文文本的可视化技术研究 被引量:15
19
作者 袁海 陈康 +1 位作者 陶彩霞 陈翀 《电信科学》 北大核心 2014年第4期114-122,共9页
文本可视化是数据可视化的新兴主题,其目的是让人直观地认识数据,敏捷地发现数据中隐藏的规律。首先介绍了文本可视化的过程,包括信息收集、预处理、视觉呈现和交互功能等;然后通过分析和使用各种中文文本可视化的工具,从基于标签云、... 文本可视化是数据可视化的新兴主题,其目的是让人直观地认识数据,敏捷地发现数据中隐藏的规律。首先介绍了文本可视化的过程,包括信息收集、预处理、视觉呈现和交互功能等;然后通过分析和使用各种中文文本可视化的工具,从基于标签云、树图、关联和时间序列等多方面研究可视化技术;最后对比了这几种技术的差异和优缺点,并指出各技术的适用场景。文本可视化能够更好地帮助用户处理日益增长的文本信息,提高数据的可视化效率和转换成利益的效率。 展开更多
关键词 文本分析 信息可视化 文本可视化 交互界面
在线阅读 下载PDF
文本信息可视化模型研究 被引量:12
20
作者 周宁 张会平 金大卫 《情报学报》 CSSCI 北大核心 2007年第1期155-160,共6页
本文针对文本信息资源的特征,提出了一个基于XML的文本信息可视化的通用模型,详细介绍了模型的三个对象空间——XML文档库、XML特征库和可视化对象以及三项关键技术——中文分词、文本分割和可视化映射,并结合实例验证了模型的实用... 本文针对文本信息资源的特征,提出了一个基于XML的文本信息可视化的通用模型,详细介绍了模型的三个对象空间——XML文档库、XML特征库和可视化对象以及三项关键技术——中文分词、文本分割和可视化映射,并结合实例验证了模型的实用性、易扩展性以及可移植性。 展开更多
关键词 文本 信息可视化 中文分词 文本分割
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部