期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于ResNet18特征编码器的水稻病虫害图像描述生成 被引量:17
1
作者 谢州益 冯亚枝 +1 位作者 胡彦蓉 刘洪久 《农业工程学报》 EI CAS CSCD 北大核心 2022年第12期197-206,共10页
针对图像描述算法缺乏在农业领域中的应用,传统模型参数庞大的问题,该研究提出一种基于ResNet18特征编码器的图像描述算法,对作物患病类型进行识别并生成描述。首先,建立水稻病虫害图像描述数据集。其次,使用浅层ResNet18作为编码器,在... 针对图像描述算法缺乏在农业领域中的应用,传统模型参数庞大的问题,该研究提出一种基于ResNet18特征编码器的图像描述算法,对作物患病类型进行识别并生成描述。首先,建立水稻病虫害图像描述数据集。其次,使用浅层ResNet18作为编码器,在保证特征提取能力的同时缩减网络模型大小,解码器使用融合了注意力机制的长短期记忆网络(Long Short Term Memory,LSTM)来生成图像描述。试验结果表明,改进后模型尺寸大小为原来的1/3,经过6000次迭代后模型基本收敛,准确率达到98.48%。在水稻病虫害图像描述数据集上,改进编码器-解码器结构后的双语评估替换值(Bilingual Evaluation Understudy,BLEU)和METEOR(Metric for Evaluation of Translation with Explicit ORdering)分别达到0.752和0.404,其余指标结果也明显优于其他模型,具有描述细致准确、鲁棒性强等优点,能够更好地适用于小规模数据集上的训练,可为农作物相似病害特征的自动化描述提供有益参考。 展开更多
关键词 农业 算法 图像描述 水稻病虫害 编码器-解码器框架 ResNet18 注意力机制
在线阅读 下载PDF
基于知识图谱与全局上下文注意的图像描述生成模型
2
作者 陶瑞 张素兰 周慧媛 《计算机工程与设计》 北大核心 2025年第5期1297-1303,共7页
针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注... 针对当前大多数图像描述模型仅利用图像内容推理生成图像描述而导致描述内容缺失、准确性差的问题,通过引入知识图谱增强生成字幕的语义完整性,利用全局上下文信息约束进一步增加生成描述的准确性,提出一种基于知识图谱与全局上下文注意的图像描述模型。通过利用知识图谱,将外部知识编码到模型当中,提高生成初始语义信息的完整性;从初始的完整描述中获取全局上下文信息,利用上下文信息进一步约束指导最终生成的图像描述,提高图像描述结果的准确性。在两个不同规模的标准数据集MSCOCO和Flickr30k上与其它先进方法进行实验对比,其结果表明,该模型在评价指标上均有所提高,验证了所提方法的有效性。 展开更多
关键词 图像描述 编码器解码器框架 长短期记忆网络 注意机制 知识图谱 外部知识 全局上下文注意
在线阅读 下载PDF
结合视觉特征和场景语义的图像描述生成 被引量:26
3
作者 李志欣 魏海洋 +3 位作者 黄飞成 张灿龙 马慧芳 史忠植 《计算机学报》 EI CSCD 北大核心 2020年第9期1624-1640,共17页
现有的图像描述生成方法大多只使用图像的视觉信息来指导描述的生成,缺乏有效的场景语义信息的指导,而且目前的视觉注意机制也无法调整对图像注意的聚焦强度.针对这些问题,本文首先提出了一种改进的视觉注意模型,引入聚焦强度系数自动... 现有的图像描述生成方法大多只使用图像的视觉信息来指导描述的生成,缺乏有效的场景语义信息的指导,而且目前的视觉注意机制也无法调整对图像注意的聚焦强度.针对这些问题,本文首先提出了一种改进的视觉注意模型,引入聚焦强度系数自动调整注意强度.在解码器的每个时间步,通过模型的上下文信息和图像信息计算注意机制的聚焦强度系数,并通过该系数自动调整注意机制的“软”、“硬”强度,从而提取到更准确的图像视觉信息.此外,本文利用潜在狄利克雷分布模型与多层感知机提取出一系列与图像场景相关的主题词来表示图像场景语义信息,并将这些信息添加到语言生成模型中来指导单词的生成.由于图像的场景主题信息是通过分析描述文本获得,包含描述的全局信息,所以模型可以生成一些适合图像场景的重要单词.最后,本文利用注意机制来确定模型在解码的每一时刻所关注的图像视觉信息和场景语义信息,并将它们结合起来共同指导模型生成更加准确且符合场景主题的描述.实验评估在MSCOCO和Flickr30k两个标准数据集上进行,实验结果表明本文方法能够生成更加准确的描述,并且在整体的评价指标上与基线方法相比有3%左右的性能提升. 展开更多
关键词 图像描述生成 注意机制 场景语义 编码器-解码器框架 强化学习
在线阅读 下载PDF
结合邻域知识的文档级关键词抽取方法 被引量:2
4
作者 李晨亮 龙俊辉 +1 位作者 唐作立 周涛 《电子科技大学学报》 EI CAS CSCD 北大核心 2021年第4期551-557,共7页
基于编码器−解码器(encoder-decoder)框架的生成式方法在关键词抽取任务上得到了广泛应用并取得了较好的性能,然而该方法面临的主要挑战为建模有效的文档向量表示,及生成覆盖整个文档主题的关键词集合,这些挑战都会直接影响关键词抽取... 基于编码器−解码器(encoder-decoder)框架的生成式方法在关键词抽取任务上得到了广泛应用并取得了较好的性能,然而该方法面临的主要挑战为建模有效的文档向量表示,及生成覆盖整个文档主题的关键词集合,这些挑战都会直接影响关键词抽取的结果。该文提出了结合邻域知识的文档级关键词抽取模型以应对这些挑战。具体来说,通过给指定文档添加少量的最近邻样本,原文档被扩展为一个文档集合。基于单词之间的距离将文档集合中的每个文档构建成词图,合并集合中的所有词图形成一个大图,然后利用图卷积网络进行编码。解码端引入了上下文修改机制和覆盖机制,使模型能够生成更加多样化的关键词来覆盖文档包含的所有主题。最后在4种数据集上分别与现有的基准模型进行对比,实验结果表明该方法能够有效提升关键词抽取的性能。 展开更多
关键词 深度学习 编码器解码器框架 图卷积网络 图神经网络 关键词抽取 邻域知识
在线阅读 下载PDF
结合全局-局部特征和注意力的图像描述方法 被引量:2
5
作者 谢琦彬 陈平华 《计算机工程与应用》 CSCD 北大核心 2022年第12期218-225,共8页
为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对... 为了进一步提高图像描述生成文本的精度,提出一种结合全局-局部特征和注意力机制的图像描述方法。该方法在传统的编码器-解码器模型上进行改进,从整体角度来看,编码器阶段使用残差网络ResNet101提取图像的全局特征和局部特征,以避免对象丢失或对象预测错误问题,在解码器阶段采用嵌入改进后的注意力机制的双向GRU生成文本序列。从局部角度来看,该模型提出的注意力机制是一种独立的循环结构,通过计算图像局部特征向量与语义向量之间的相似度来获取注意力权重,增强图像特征与语义信息之间的映射。在MSCOCO数据集上的实验结果显示,该算法在BLEU、CIDEr、METEOR等评价指标上均获得了不同程度的提升,表明使用该模型生成的描述文本准确度高且细节丰富。 展开更多
关键词 图像描述 注意力机制 编码器-解码器框架 全局特征 局部特征
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部