检索结果-维普期刊中文期刊服务平台

基于多级视觉与图文动态交互的图像中文描述方法: 1; 作者张军燕赵一鸣 +1 位作者林兵吴允平《计算机应用》北大核心 2025年第5期1520-1527,共8页; 图像文字描述技术可以帮助计算机更好地理解图像内容,实现跨模态交互。针对图像中文描述任务中存在的图像多粒度特征提取不全面以及图文关联性理解不充分等问题,提出一种基于多级视觉与图文动态交互的图像中文描述方法。首先,在编码器... 展开更多; 关键词图像中文描述图像多级视觉特征多粒度图文交互动态融合; 在线阅读下载PDF 职称材料

融合编码器和视觉关键词搜索的图像中文描述: 2; 作者孟繁聪徐伟 +3 位作者李海波吴闽郑竣杰陈兴《计算机应用与软件》北大核心 2025年第4期208-216,244,共10页; 针对当前已有模型缺乏对图像局部细节的关注以及趋向于通用型描述问题,提出一种采用融合编码器和视觉关键词搜索技术的图像中文描述方法。构建融合编码器,在一个卷积神经网络(CNN)中同时提取图像的局部和全局特征,丰富长短时记忆网络(LS... 展开更多; 关键词图像中文描述编解码结构注意力机制图像检索强化学习; 在线阅读下载PDF 职称材料

基于视觉-语义中间综合属性特征的图像中文描述生成算法被引量：5: 3; 作者肖雨寒江爱文 +1 位作者王明文揭安全《中文信息学报》 CSCD 北大核心 2021年第4期129-138,共10页; 图像描述是计算机视觉、自然语言处理与机器学习的交叉领域多模态信息处理任务,需要算法能够有效地处理图像和语言两种不同模态的信息。由于异构语义鸿沟的存在,该任务具有较大的挑战性。目前主流的研究仍集中在基于英文的图像描述任务... 展开更多; 关键词图像中文描述目标检测注意力机制; 在线阅读下载PDF 职称材料

基于Transformer的细粒度图像中文描述被引量：3: 4; 作者肖雄徐伟峰 +2 位作者王洪涛苏攀高思华《吉林大学学报（理学版）》 CAS 北大核心 2022年第5期1103-1112,共10页; 针对图像中文描述中传统循环神经网络(RNN)结构不利于生成长句、缺乏细节语义信息的问题,提出一种用Transformer多头注意力(multi-head attention, MHA)网络,融合粗粒度的全局特征和细粒度的区域目标实体特征方法.该方法通过多尺度特征... 展开更多; 关键词图像中文描述细粒度特征多头注意力; 在线阅读下载PDF 职称材料

图像特征注意力与自适应注意力融合的图像内容中文描述被引量：7: 5; 作者赵宏孔东一《计算机应用》 CSCD 北大核心 2021年第9期2496-2503,共8页; 针对现有基于注意力机制的图像内容中文描述模型无法在关注信息不减弱和无缺失的条件下对重点内容进行注意力加强关注的问题,提出一种图像特征注意力与自适应注意力融合的图像内容中文描述模型。模型使用编解码结构,首先在编码器网络中... 展开更多; 关键词图像内容中文描述注意力机制深度学习卷积神经网络循环神经网络; 在线阅读下载PDF 职称材料

题名基于多级视觉与图文动态交互的图像中文描述方法: 1; 作者张军燕赵一鸣林兵吴允平; 机构福建师范大学光电与信息工程学院福建师范大学物理与能源学院; 出处《计算机应用》北大核心 2025年第5期1520-1527,共8页; 基金国家自然科学海峡联合基金重点项目(U1805263) 福建省科技厅产学研项目(2022H6024) 福建省本科高校教育教学研究一般项目(39)。; 文摘图像文字描述技术可以帮助计算机更好地理解图像内容,实现跨模态交互。针对图像中文描述任务中存在的图像多粒度特征提取不全面以及图文关联性理解不充分等问题,提出一种基于多级视觉与图文动态交互的图像中文描述方法。首先,在编码器端提取多级视觉特征,通过图像局部特征提取器的辅助引导模块获取多粒度特征。其次,设计图文交互模块对图文信息的语义关联进行动态关注;同时,设计特征动态融合解码器将带有图文信息动态权重的特征经过闭环动态融合并关注与解码,以保证信息增强且无缺失,从而获得语义关联性的输出。最后,生成语义通顺的图像中文描述语句。使用BLEU-n、Rouge、Meteor、CIDEr指标评估方法的有效性并与8种不同方法进行对比。实验结果显示,所提方法的语义相关性评价指标均有提升。具体而言,与基线模型NIC(Neural Image Caption)相比,所提方法在BLEU-1、BLEU-2、BLEU-3、BLEU-4、Rouge_L、Meteor、CIDEr分别提升了5.62%、7.25%、8.78%、10.85%、14.06%、5.14%、15.16%,表明该方法具有较好的准确性。; 关键词图像中文描述图像多级视觉特征多粒度图文交互动态融合; Keywords Chinese image captioning image multi-level visual feature multi-granularity image-text interaction dynamic fusion; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名融合编码器和视觉关键词搜索的图像中文描述: 2; 作者孟繁聪徐伟李海波吴闽郑竣杰陈兴; 机构华东宜兴抽水蓄能有限公司河海大学计算机与信息学院; 出处《计算机应用与软件》北大核心 2025年第4期208-216,244,共10页; 基金国网新源公司科技项目(SGXY2000074)。; 文摘针对当前已有模型缺乏对图像局部细节的关注以及趋向于通用型描述问题,提出一种采用融合编码器和视觉关键词搜索技术的图像中文描述方法。构建融合编码器,在一个卷积神经网络(CNN)中同时提取图像的局部和全局特征,丰富长短时记忆网络(LSTM)解码的语义信息;针对图像描述一般性表达,采用基于CNN的图像检索方法查找潜在视觉词汇,用于词向量解码;引入强化学习机制,在CIDEr评估指标上做句子层面上的优化,用以提高图像描述的词汇多样性。实验结果验证了所提方法的有效性。; 关键词图像中文描述编解码结构注意力机制图像检索强化学习; Keywords Chinese image caption Encoder-decoder architecture Attention mechanism Image retrieval Reinforcement learning; 分类号 TP3 [自动化与计算机技术—计算机科学与技术]; 在线阅读下载PDF 职称材料

题名基于视觉-语义中间综合属性特征的图像中文描述生成算法被引量：5: 3; 作者肖雨寒江爱文王明文揭安全; 机构江西师范大学计算机信息工程学院; 出处《中文信息学报》 CSCD 北大核心 2021年第4期129-138,共10页; 基金国家自然科学基金(61966018,61876074) 江西省自然科学基金(20181BAB202013) 江西省教育厅科技项目(GJJ160277,GJJ150350)。; 文摘图像描述是计算机视觉、自然语言处理与机器学习的交叉领域多模态信息处理任务,需要算法能够有效地处理图像和语言两种不同模态的信息。由于异构语义鸿沟的存在,该任务具有较大的挑战性。目前主流的研究仍集中在基于英文的图像描述任务,对图像中文描述的研究相对较少。图像视觉信息在图像描述算法中没有得到足够的重视,算法模型的性能更多地取决于语言模型。针对以上两个方面的研究不足,该文提出了基于多层次选择性视觉语义属性特征的图像中文描述生成算法。该算法结合目标检测和注意力机制,充分考虑了图像高层视觉语义所对应的中文属性信息,抽取不同尺度和层次的属性上下文表示。为了验证该文算法的有效性,在目前规模最大的AI Challenger 2017图像中文描述数据集以及Flick8k-CN图像中文描述数据集上进行了测试。实验结果表明,该算法能够有效地实现视觉-语义关联,生成文字表述较为准确、内容丰富的描述语句。较现阶段主流图像描述算法在中文语句上的性能表现,该文算法在各项评价指标上均有约3%~30%的较大幅度提升。为了便于后续研究复现,该文的相关源代码和模型已在开源网站Github上公开。; 关键词图像中文描述目标检测注意力机制; Keywords image Chinese description object detection attention mechanism; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于Transformer的细粒度图像中文描述被引量：3: 4; 作者肖雄徐伟峰王洪涛苏攀高思华; 机构华北电力大学(保定)计算机系中国民航大学计算机科学与技术学院; 出处《吉林大学学报（理学版）》 CAS 北大核心 2022年第5期1103-1112,共10页; 基金国家自然科学基金(批准号:61802124) 全国高等院校计算机基础教育研究会项目(批准号:2019-AFCEC-125)。; 文摘针对图像中文描述中传统循环神经网络(RNN)结构不利于生成长句、缺乏细节语义信息的问题,提出一种用Transformer多头注意力(multi-head attention, MHA)网络,融合粗粒度的全局特征和细粒度的区域目标实体特征方法.该方法通过多尺度特征的融合,使图像注意力更易聚焦于细粒度的目标区域,得到更具细粒度语义特征的图像表示,从而有效改善了图像描述.在数据集ICC上使用多种评价指标进行验证,结果表明,该模型在各项指标上均取得了更好的图像描述效果.; 关键词图像中文描述细粒度特征多头注意力; Keywords image Chinese caption fine-grained feature multi-head attention(MHA); 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名图像特征注意力与自适应注意力融合的图像内容中文描述被引量：7: 5; 作者赵宏孔东一; 机构兰州理工大学计算机与通信学院; 出处《计算机应用》 CSCD 北大核心 2021年第9期2496-2503,共8页; 基金国家自然科学基金资助项目(51668043,61262016)。; 文摘针对现有基于注意力机制的图像内容中文描述模型无法在关注信息不减弱和无缺失的条件下对重点内容进行注意力加强关注的问题,提出一种图像特征注意力与自适应注意力融合的图像内容中文描述模型。模型使用编解码结构,首先在编码器网络中提取图像特征,并通过图像特征注意力提取图像全部特征区域的注意力信息;然后使用解码器网络将带有注意力权重的图像特征解码生成隐藏信息,以保证关注信息不减弱、无缺失;最后利用自适应注意力的视觉哨兵模块对图像特征中的重点内容进行再次加强关注,从而更加精准地提取图像的主体内容。使用多种评价指标(BLEU、METEOR、ROUGEL和CIDEr)进行模型验证,将所提模型与单一基于自适应注意力和基于图像特征注意力的图像描述模型进行对比实验,该模型的CIDEr评价指标值分别提高了10.1%和7.8%;同时与基线模型NIC(Neural Image Caption)以及基于自底向上和自顶向下(BUTD)注意力的图像描述模型相比,该模型的CIDEr评价指标值分别提高了10.9%和12.1%。实验结果表明,所提模型的图像理解能力得到了有效提升,其各项评价指标得分均优于对比模型。; 关键词图像内容中文描述注意力机制深度学习卷积神经网络循环神经网络; Keywords Chinese description of image content attention mechanism deep learning Convolutional Neural Network(CNN) Recurrent Neural Network(RNN); 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于多级视觉与图文动态交互的图像中文描述方法	张军燕赵一鸣林兵吴允平	《计算机应用》北大核心	2025	0	在线阅读下载PDF 职称材料
2	融合编码器和视觉关键词搜索的图像中文描述	孟繁聪徐伟李海波吴闽郑竣杰陈兴	《计算机应用与软件》北大核心	2025	0	在线阅读下载PDF 职称材料
3	基于视觉-语义中间综合属性特征的图像中文描述生成算法	肖雨寒江爱文王明文揭安全	《中文信息学报》 CSCD 北大核心	2021	5	在线阅读下载PDF 职称材料
4	基于Transformer的细粒度图像中文描述	肖雄徐伟峰王洪涛苏攀高思华	《吉林大学学报（理学版）》 CAS 北大核心	2022	3	在线阅读下载PDF 职称材料
5	图像特征注意力与自适应注意力融合的图像内容中文描述	赵宏孔东一	《计算机应用》 CSCD 北大核心	2021	7	在线阅读下载PDF 职称材料