期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
面向密文图像信息隐藏的随机插值方法 被引量:9
1
作者 孙容海 施林甫 +2 位作者 俞春强 劳欢 唐振军 《应用科学学报》 CAS CSCD 北大核心 2020年第3期419-430,共12页
传统图像插值方法应用于密文域图像信息隐藏时会降低信息隐藏系统的安全性.为此利用随机分配插值权重的策略设计了一种密文图像随机插值方法.该方法首先生成大小为密文图像两倍的初始插值图像,对于插值图像的奇数行和奇数列像素,直接用... 传统图像插值方法应用于密文域图像信息隐藏时会降低信息隐藏系统的安全性.为此利用随机分配插值权重的策略设计了一种密文图像随机插值方法.该方法首先生成大小为密文图像两倍的初始插值图像,对于插值图像的奇数行和奇数列像素,直接用密文图像的相应像素填充;对于其他位置的像素,先用伪随机函数生成随机值,再结合像素的具体位置来计算插值结果.实验结果表明,所提方法生成的密文图像的插值图像,其直方图近似均匀分布.对比结果显示该随机插值方法在安全性方面优于3种文献插值方法. 展开更多
关键词 随机插值 信息隐藏 密文图像 可逆信息隐藏 直方图
在线阅读 下载PDF
基于曲面插值的加密图像可逆信息隐藏算法 被引量:3
2
作者 陈艳 俞春强 +3 位作者 侯晓杰 张显全 唐振军 何南 《应用科学学报》 CAS CSCD 北大核心 2018年第2期220-236,共17页
提出一种基于曲面插值的加密图像可逆信息隐藏算法.对原始图像进行加密,利用随机函数确定加密图像中的载体像素,根据载体像素取反位的不同采取不同的隐藏方法.对载密图像进行解密以确定载体像素,在载体像素5×5邻域中选取与载体像... 提出一种基于曲面插值的加密图像可逆信息隐藏算法.对原始图像进行加密,利用随机函数确定加密图像中的载体像素,根据载体像素取反位的不同采取不同的隐藏方法.对载密图像进行解密以确定载体像素,在载体像素5×5邻域中选取与载体像素距离最近的6个非载体像素,采用曲面插值的方法计算载体像素的预测值,应用该预测值提取秘密信息并恢复载体像素.实验结果表明,该算法提取秘密信息的错误率较低,恢复图像的视觉效果较好. 展开更多
关键词 可逆信息隐藏 图像加密 曲面插值 预测值
在线阅读 下载PDF
采用相邻像素预测的可逆信息隐藏算法 被引量:3
3
作者 李亚翔 张显全 +1 位作者 俞春强 唐振军 《华侨大学学报(自然科学版)》 CAS 北大核心 2020年第2期223-229,共7页
为了提高图像信息隐藏算法的信息嵌入容量和载密图像的保真度,提出一种采用相邻像素预测的可逆信息隐藏算法.构建局部线性预测模型,以待预测像素的3个相邻像素为目标像素,通过目标像素的相邻像素建立线性方程组,求解预测模型参数.应用... 为了提高图像信息隐藏算法的信息嵌入容量和载密图像的保真度,提出一种采用相邻像素预测的可逆信息隐藏算法.构建局部线性预测模型,以待预测像素的3个相邻像素为目标像素,通过目标像素的相邻像素建立线性方程组,求解预测模型参数.应用预测模型进行预测,计算预测误差,绘制预测误差直方图,通过直方图平移实现可逆信息隐藏.实验结果表明:文中算法可通过较少的预测像素进行预测,比其他算法具有更高的预测精度和更大的信息嵌入容量. 展开更多
关键词 可逆信息隐藏 相邻像素 预测误差 局部线性预测
在线阅读 下载PDF
利用CVGS-XGBoost遥感识别水体与山体阴影信息 被引量:3
4
作者 秦琴 王修信 《桂林理工大学学报》 CAS 北大核心 2020年第4期850-858,共9页
针对喀斯特地区遥感图像中水体和山体阴影信息易混淆使得传统机器学习算法存在分类精度低、计算速度慢的缺点,改进XGBoost算法,通过交叉验证栅格搜索算法对XGBoost算法进行参数优化,构建CVGS-XGBoost分类算法,提取遥感图像中的水体和山... 针对喀斯特地区遥感图像中水体和山体阴影信息易混淆使得传统机器学习算法存在分类精度低、计算速度慢的缺点,改进XGBoost算法,通过交叉验证栅格搜索算法对XGBoost算法进行参数优化,构建CVGS-XGBoost分类算法,提取遥感图像中的水体和山体阴影信息。实验结果表明,CVGS-XGBoost算法的总体分类精度达到93.9%,比原始的XGBoost算法、决策树、随机森林和支持向量机算法构建的分类算法的总体分类精度分别提高1.5%、10.0%、6.3%和3.1%,且该算法与分类效果较好的支持向量机相比,运行时间开销少,可有效地识别喀斯特地区遥感图像中水体和山体阴影信息。 展开更多
关键词 水体信息 山体阴影 遥感提取 CVGS-XGBoost算法 喀斯特地区
在线阅读 下载PDF
安全高效的加密数据朴素贝叶斯训练和分类 被引量:1
5
作者 李兴鑫 朱友文 王箭 《密码学报》 CSCD 2022年第3期448-467,共20页
云外包为大规模数据上的机器学习任务提供有力支撑的同时也带来了数据隐私泄漏的风险.本文旨在通过加密保护外包数据隐私并在加密数据上高效实现安全朴素贝叶斯训练和分类.现有安全朴素贝叶斯方案大多考虑的是外包训练好的贝叶斯模型以... 云外包为大规模数据上的机器学习任务提供有力支撑的同时也带来了数据隐私泄漏的风险.本文旨在通过加密保护外包数据隐私并在加密数据上高效实现安全朴素贝叶斯训练和分类.现有安全朴素贝叶斯方案大多考虑的是外包训练好的贝叶斯模型以及预测阶段的计算任务.虽有少量工作考虑了同时在外包数据上完成朴素贝叶斯模型训练和分类,但这些工作在安全性和效率方面存在不足.本文结合somewhat同态加密算法、SIMD(single-instruction multiple data)技术和混淆电路提出了一个新的加密数据安全朴素贝叶斯训练和分类方案.本文在不影响正确性的前提下对朴素贝叶斯算法进行转换,设计了相应的明文编码方式避免计算过程出现数据溢出,并提出了新的交互协议在外包加密数据上安全批量地实现了朴素贝叶斯模型训练和分类所需的运算.提出的方案在保护外包数据集、朴素贝叶斯模型、待分类样本和分类结果的隐私的同时有效降低了计算和通信开销.本文在半诚实模型下证明了提出方案的安全性,并且通过实验验证了提出方案的有效性. 展开更多
关键词 云外包 安全计算 同态加密 朴素贝叶斯算法
在线阅读 下载PDF
基于Swin Transformer和卷积注意力的乳腺癌病理图像诊断研究
6
作者 禤浚波 周立广 +4 位作者 梁英豪 梁淑慧 付志鸿 关志广 毕明霞 《现代电子技术》 北大核心 2024年第13期36-42,共7页
为了降低由于医生阅片疲劳或经验不足而可能导致的漏诊或误诊问题,提高医生诊断乳腺癌病理图像的准确性和工作效率,文中采用北京大学国际医院提供的公开的最大乳腺癌病理组织图像数据集,包括正常、良性病变、原位癌和浸润癌四种类型,并... 为了降低由于医生阅片疲劳或经验不足而可能导致的漏诊或误诊问题,提高医生诊断乳腺癌病理图像的准确性和工作效率,文中采用北京大学国际医院提供的公开的最大乳腺癌病理组织图像数据集,包括正常、良性病变、原位癌和浸润癌四种类型,并提出了一种基于Swin Transformer和卷积注意力机制的乳腺癌病理图像诊断方法,给出了诊断算法的框架和处理流程,在评价指标方面取得了96.93%的精确率、97.82%的召回率和97.74%的准确率,与常用的卷积神经网络ResNet152、VGG16相比,精确率和准确率都是最高的,从而证明提出的方法是有效的。最后,基于Flask技术和Swin Transformer开发了可视化的乳腺癌病理图像诊断软件,只需提供一张患者的乳腺癌病理组织图像,10 s左右即可自动输出诊断结果,可以极大地提高医生的工作效率。 展开更多
关键词 乳腺癌 病理图像 深度学习 Swin Transformer 卷积注意力机制 FLASK
在线阅读 下载PDF
双路注意力引导图卷积网络的关系抽取 被引量:11
7
作者 李志欣 孙亚茹 +2 位作者 唐素勤 张灿龙 马慧芳 《电子学报》 EI CAS CSCD 北大核心 2021年第2期315-323,共9页
为了更好地学习节点依赖并利用结构信息,本文提出一种以完全依赖树作为直接输入的新方法,利用图卷积网络并结合两个并行的注意力模块,自主学习如何有选择地关注对关系抽取任务有用的信息.该方法将样本表示成图上的各节点,一个模块用于... 为了更好地学习节点依赖并利用结构信息,本文提出一种以完全依赖树作为直接输入的新方法,利用图卷积网络并结合两个并行的注意力模块,自主学习如何有选择地关注对关系抽取任务有用的信息.该方法将样本表示成图上的各节点,一个模块用于计算节点特征位置之间的影响,使特征向量可以包含更广范围的语义信息,另一个用于计算节点依赖的关系特征,以增强节点间的全局依赖.两个模块并行相互提升,可以得到完整的特征表示.在TACRED和SemEval数据集上的实验结果表明,该方法能够更有效地获取对关系抽取任务有益的信息,在各评价指标上取得了更好的性能. 展开更多
关键词 关系抽取 图卷积网络 注意力机制 多跳关系推理
在线阅读 下载PDF
融合两级相似度的跨媒体图像文本检索 被引量:15
8
作者 李志欣 凌锋 +1 位作者 张灿龙 马慧芳 《电子学报》 EI CAS CSCD 北大核心 2021年第2期268-274,共7页
为了更好地揭示图像和文本之间潜在的语义关联,提出了一种融合两级相似度的跨媒体检索方法,构建两个子网分别处理全局特征和局部特征,以获取图像和文本之间更好的语义匹配.图像分为整幅图像和一些图像区域两种表示,文本也分为整个语句... 为了更好地揭示图像和文本之间潜在的语义关联,提出了一种融合两级相似度的跨媒体检索方法,构建两个子网分别处理全局特征和局部特征,以获取图像和文本之间更好的语义匹配.图像分为整幅图像和一些图像区域两种表示,文本也分为整个语句和一些单词两种表示.设计一个两级对齐方法分别匹配图像和文本的全局和局部表示,并融合两种相似度学习跨媒体的完整表示.在MSCOCO和Flickr30K数据集上的实验结果表明,本文方法能够使图像和文本的语义匹配更准确,优于许多当前先进的跨媒体检索方法. 展开更多
关键词 卷积神经网络 自注意力网络 两级相似度 跨媒体检索
在线阅读 下载PDF
联合压缩感知和颜色向量角的彩色图像哈希方法 被引量:4
9
作者 刘凯 唐振军 +1 位作者 张显全 俞春强 《应用科学学报》 CAS CSCD 北大核心 2015年第6期595-603,共9页
提出一种联合压缩感知和颜色向量角的彩色图像哈希方法.该方法先对输入图像进行预处理,并计算其颜色向量角矩阵,然后对矩阵进行非重叠分块,再将每一块进行压缩感知测量,用测量向量的均值构成哈希值.实验表明,该方法对常见数字操作稳健... 提出一种联合压缩感知和颜色向量角的彩色图像哈希方法.该方法先对输入图像进行预处理,并计算其颜色向量角矩阵,然后对矩阵进行非重叠分块,再将每一块进行压缩感知测量,用测量向量的均值构成哈希值.实验表明,该方法对常见数字操作稳健并有良好的唯一性,分类性能优于3种现有方法. 展开更多
关键词 图像哈希 颜色向量角 压缩感知 测量向量
在线阅读 下载PDF
混合供电发射机的功率分配及调度算法 被引量:3
10
作者 刘迪迪 林基明 +2 位作者 王俊义 陈小徽 张文辉 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2016年第6期8-14,共7页
针对由固定电网和能量收集器混合供电的无线通信下行链路,研究在能量收集过程、数据到达过程以及衰落信道统计分布均未知的情况下发射机的动态功率分配及传输调度问题,目的是最小化发射机从固定电网消耗的平均电量,即提高收集的能量的... 针对由固定电网和能量收集器混合供电的无线通信下行链路,研究在能量收集过程、数据到达过程以及衰落信道统计分布均未知的情况下发射机的动态功率分配及传输调度问题,目的是最小化发射机从固定电网消耗的平均电量,即提高收集的能量的利用效率.研究基于李雅普诺夫的优化方法,提出了一种低复杂度的动态功率分配以及多用户之间的传输调度算法,保证各数据队列稳定且等待时延不超过用户时延要求的条件下,使发射机从固定电源消耗的平均电量趋于最小值.仿真对比表明,该算法的性能优于其他两种贪婪算法. 展开更多
关键词 能量收集 混合电源供电 功率分配 传输调度 李雅普诺夫优化
在线阅读 下载PDF
基于双注意模型的图像描述生成方法研究 被引量:8
11
作者 卓亚琦 魏家辉 李志欣 《电子学报》 EI CAS CSCD 北大核心 2022年第5期1123-1130,共8页
现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信... 现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信息,来表示生成语句所需的图像全局信息.在此基础上,结合语句级注意和单词级注意进一步提出了双注意模型,以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化,以解决信息间的干扰问题.此外,将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估,结果表明本文提出的方法能够生成更加准确和丰富的描述语句,并且在各项评价指标上优于现有的多种基于注意机制的方法. 展开更多
关键词 图像描述生成 编码器-解码器架构 单词级注意 语句级注意 双注意模型 强化学习
在线阅读 下载PDF
基于密钥树的云平台隐私保护与分享技术研究 被引量:2
12
作者 朱晓姝 孙小雁 +1 位作者 熊莉 张茂胜 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第8期1071-1073,1136,共4页
云存储平台中的隐私保护问题是云安全的挑战之一,当前主流的云存储平台大多面向内容存储服务,缺少对用户隐私信息的保护。针对该问题,文章设计了一种高效、用户主动可控的隐私保护云存储架构,该架构用高效的对称密码体制加密隐私信息,... 云存储平台中的隐私保护问题是云安全的挑战之一,当前主流的云存储平台大多面向内容存储服务,缺少对用户隐私信息的保护。针对该问题,文章设计了一种高效、用户主动可控的隐私保护云存储架构,该架构用高效的对称密码体制加密隐私信息,以安全的公钥密码体制传递解密密钥和文件信息,设计密钥派生树生成大量密钥实现高效的密钥管理,云存储服务提供者和非法用户均无法获取隐私信息,但用户可以将隐私信息向特定对象分享。分析表明,该架构不增加当前云存储平台负担并且能有效保护用户隐私。 展开更多
关键词 云存储 云计算 隐私保护
在线阅读 下载PDF
基于LoRa的心率血氧实时监测系统的研究 被引量:20
13
作者 吴磊 胡维平 《电子设计工程》 2019年第14期97-101,106,共6页
针对传统的心率、血氧饱和度检测方法在现代医院的应用中存在的缺陷和不足问题,开发了一种基于LoRa的心率血氧实时监测系统。该系统包括一组患者佩戴的心率血氧实时监测手环和与心率血氧实时监测手环通过LoRa基站连接的服务器。心率血... 针对传统的心率、血氧饱和度检测方法在现代医院的应用中存在的缺陷和不足问题,开发了一种基于LoRa的心率血氧实时监测系统。该系统包括一组患者佩戴的心率血氧实时监测手环和与心率血氧实时监测手环通过LoRa基站连接的服务器。心率血氧实时监测手环以STM328L151CBU6A作为处理器,集成MAX30102脉搏波传感器、SX1278芯片等。STM328L151CBU6A处理器首先对MAX30102采集的脉搏波信号进行预处理,然后通过心率血氧算法计算出心率血氧值并判断异常与否,SX1278芯片通过LoRa无线方式将心率血氧值或异常信号传输至LoRa基站,LoRa基站将数据或异常信号通过以太网的方式传输至服务器,服务器对接收到的数据或异常信号进行处理和存储,供每个护士站对每个患者的心率血氧状况进行实时的监测。实验表明,该系统传输网络稳定可靠、复杂环境传输距离远,对心率、血氧的监测准确度较高。 展开更多
关键词 心率 血氧饱和度 LoRa MAX30102
在线阅读 下载PDF
基于联合稀疏表示的复Contourlet域SAR图像与红外图像融合(英文) 被引量:4
14
作者 吴一全 王志来 《雷达学报(中英文)》 CSCD 2017年第4期349-358,共10页
针对红外图像与SAR图像的灰度差异性大、两者融合图像不太符合人类视觉认知的问题,提出了一种基于联合稀疏表示的复Contourlet域红外图像与SAR图像融合方法。首先对红外图像与SAR图像分别进行复Contourlet分解。然后利用K-奇异值分解(K-... 针对红外图像与SAR图像的灰度差异性大、两者融合图像不太符合人类视觉认知的问题,提出了一种基于联合稀疏表示的复Contourlet域红外图像与SAR图像融合方法。首先对红外图像与SAR图像分别进行复Contourlet分解。然后利用K-奇异值分解(K-Singular Value Decomposition,K-SVD)方法获得两幅源图像低频分量的过完备字典,并根据联合稀疏表示模型生成联合字典,通过正交匹配追踪(Orthogonal Matching Pursuit,OMP)方法求出源图像低频分量在联合字典下的稀疏表示系数,接着采用选择最大化策略对两个低频分量的稀疏表示系数进行选取,随后进行稀疏表示重构获得融合的低频分量;对高频分量结合视觉敏感度系数和能量匹配度两个活跃度准则进行融合,以捕获源图像丰富的细节信息。最后经复Contourlet逆变换获得融合图像。与3种经典融合方法及近年来提出的基于非下采样Contourlet变换(Non-Subsampled Contourlet Transform,NSCT)、基于稀疏表示的融合方法相比,该方法能够有效突出源图像的显著特征,最大程度地继承源图像的信息。 展开更多
关键词 图像融合 SAR图像 红外图像 复Contourlet变换 联合稀疏表示
在线阅读 下载PDF
求解两物种小系统发育问题的遗传算法题 被引量:1
15
作者 吴璟莉 王军伟 胡资鹏 《高技术通讯》 CAS CSCD 北大核心 2015年第3期219-227,共9页
基于复制-丢失比对(DLA)问题模型,研究了复制-丢失(D-L)演化模型下两物种(2-species)小系统发育问题(SPP),缩写为2-SPP-DL问题。通过引入比对算法、标记算法及3种智能变异算子,提出了求解2-SPP-DL问题的遗传算法——G2SP算法。G2SP算法... 基于复制-丢失比对(DLA)问题模型,研究了复制-丢失(D-L)演化模型下两物种(2-species)小系统发育问题(SPP),缩写为2-SPP-DL问题。通过引入比对算法、标记算法及3种智能变异算子,提出了求解2-SPP-DL问题的遗传算法——G2SP算法。G2SP算法采用普通算子和智能算子相结合的方式,普通算子能有效地保持种群的多样性,而智能算子则能提高种群的收敛性,使其更快地进化到最优解区域。利用4种真实菌属的tRNA和rRNA基因数据对算法性能进行测试,实验结果表明,G2SP算法能够获得较PBLP算法更小的进化代价,是求解2-SPP-DL问题的一种有效方法。 展开更多
关键词 复制 丢失 两物种小系统发育问题 序列对比 遗传算法
在线阅读 下载PDF
网络钓鱼攻击分析和防范探讨 被引量:4
16
作者 陆向艳 刘峻 《数字通信世界》 2022年第1期179-181,共3页
网络钓鱼攻击诱导用户访问虚假网站窃取用户姓名、账号、密码等敏感信息进而侵犯用户经济利益和隐私信息,影响极为恶劣。文章探讨了网络钓鱼攻击的方法、方式、检测技术、危害和预防措施,旨在为预防网络钓鱼攻击提供参考。
关键词 网络钓鱼攻击 分析 防范
在线阅读 下载PDF
一种基于混沌变换的多变量密码体制
17
作者 孙小雁 朱晓姝 覃娜 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期582-585,共4页
多变量公钥密码体制变换过程均为矩阵运算,导致其安全性存在缺陷,针对此问题,文章提出基于混沌映射的多变量密码体制。利用混沌映射的非线性、伪随机性等特性,对明文进行混沌预处理,同时摒弃传统多变量公钥密码体制中的第1个仿射变换,... 多变量公钥密码体制变换过程均为矩阵运算,导致其安全性存在缺陷,针对此问题,文章提出基于混沌映射的多变量密码体制。利用混沌映射的非线性、伪随机性等特性,对明文进行混沌预处理,同时摒弃传统多变量公钥密码体制中的第1个仿射变换,将多变量密码体制内部的线性变换转换为非线性变换,再通过中心映射和另一个仿射变换进行混淆与扩散处理。安全性分析显示,新的多变量密码体制能够有效抵抗各种常见的攻击,可以应用于加解密与签名。 展开更多
关键词 多变量 混沌 安全 非线性 密码
在线阅读 下载PDF
植物三维点云分割 被引量:11
18
作者 赖亦斌 陆声链 +2 位作者 钱婷婷 宋真 陈明 《应用科学学报》 CAS CSCD 北大核心 2021年第4期660-671,共12页
针对植物点云具有形状不规则、密度不均匀的特点,提出一种适用于植物的三维点云分割方法。将烟草、玉米、黄瓜这3种植物作为样本数据,以滤波等预处理方法去除离群点与背景点,以欧氏聚类算法分割植物群体,并用区域增长算法、边缘提取算... 针对植物点云具有形状不规则、密度不均匀的特点,提出一种适用于植物的三维点云分割方法。将烟草、玉米、黄瓜这3种植物作为样本数据,以滤波等预处理方法去除离群点与背景点,以欧氏聚类算法分割植物群体,并用区域增长算法、边缘提取算法、超体素聚类算法以及基于凹凸性的方法来分割叶片器官。将所提出的方法用于分割烟草、玉米的三维点云,其覆盖率分别为87.5%、96.9%,从而验证了该方法的可行性与有效性,为自动提取作物叶器官表型研究提供了线索。 展开更多
关键词 三维点云 植物表型 点云分割 叶片分割
在线阅读 下载PDF
融合深度扩张网络和轻量化网络的目标检测模型 被引量:21
19
作者 权宇 李志欣 +1 位作者 张灿龙 马慧芳 《电子学报》 EI CAS CSCD 北大核心 2020年第2期390-397,共8页
目标检测作为计算机视觉的一个重要研究方向,近年来在算法性能上有了突破性进展.为了更好的提升两阶段目标检测的精度与速度性能,提出了一种基于迁移学习方法的融合深度扩张卷积网络和轻量化网络的检测模型.首先用扩张卷积网络替换主干... 目标检测作为计算机视觉的一个重要研究方向,近年来在算法性能上有了突破性进展.为了更好的提升两阶段目标检测的精度与速度性能,提出了一种基于迁移学习方法的融合深度扩张卷积网络和轻量化网络的检测模型.首先用扩张卷积网络替换主干网络中部分的卷积残差模块——深度扩张卷积网络D_dNet-65;然后对预训练后的特征图进行压缩操作,并增加一个81类的全连接层以确保正常进行分类和回归操作——轻量化网络结构;最后,引入迁移学习方法并融合D_dNet和轻量化网络结构,通过迁移实现模型的进一步优化.实验在典型的数据集MSCOCO以及VOC07上进行.实验评估表明,本文提出的方法具有良好的有效性和可扩展性. 展开更多
关键词 图像目标检测 迁移学习 扩张卷积网络 轻量化网络 卷积神经网络
在线阅读 下载PDF
基于多层级视觉融合的图像描述模型 被引量:5
20
作者 周东明 张灿龙 +1 位作者 李志欣 王智文 《电子学报》 EI CAS CSCD 北大核心 2021年第7期1286-1290,共5页
传统方法在视觉策略网络中只关注实体,不能够推理出实体和属性之间的联系,在语言策略网络存在暴露偏差和误差累计问题.为此,提出了一个基于强化学习的多层级视觉融合网络模型.在视觉策略网络中通过多层级神经网络模块将视觉特征转化为... 传统方法在视觉策略网络中只关注实体,不能够推理出实体和属性之间的联系,在语言策略网络存在暴露偏差和误差累计问题.为此,提出了一个基于强化学习的多层级视觉融合网络模型.在视觉策略网络中通过多层级神经网络模块将视觉特征转化为视觉知识的特征集.融合网络生成使描述语句更加流畅的虚词,用于视觉策略网络和语言策略网络的互动.在语言策略网络中使用基于强化学习的自批评策略梯度算法对视觉融合网络实现端到端的优化.实验结果表明,该模型在MS⁃COCO数据集取得不错效果,将Karpathy分割测试中的CIDEr值从120.1提高到124.3. 展开更多
关键词 图像描述 视觉融合 强化学习 策略网络 机器学习 注意力机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部