期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
多层次编码—解码网络遥感图像建筑物分割 被引量:6
1
作者 何青 孟洋洋 李华智 《计算机应用研究》 CSCD 北大核心 2021年第8期2510-2514,共5页
为提高高分辨率遥感影像建筑物边缘提取精度和高分辨率特征利用率,提出了一种基于残差分组卷积的高分辨率遥感影像建筑物提取方法。利用多层次编码—解码结构提取影像中建筑物不同尺度特征,同层次特征之间引入密集连接保证高分辨率特征... 为提高高分辨率遥感影像建筑物边缘提取精度和高分辨率特征利用率,提出了一种基于残差分组卷积的高分辨率遥感影像建筑物提取方法。利用多层次编码—解码结构提取影像中建筑物不同尺度特征,同层次特征之间引入密集连接保证高分辨率特征的有效性,相邻层次特征之间引入交换单元增加不同深度的上下文信息交互。使用武汉大学建筑物数据集对模型进行训练及评估,与现有的全卷积神经网络SegNet、UNet和UNet++相比,评价指标recall、IoU、F 1等高出2%以上。实验结果表明该网络在对建筑物边缘精准提取方面具有很好的效果。 展开更多
关键词 高分辨率遥感影像 残差分组卷积 建筑物提取 编码—解码结构 密集连接
在线阅读 下载PDF
基于编码-解码结构的多阶段图像去雨滴方法
2
作者 谷坤源 贾宗璞 +2 位作者 赵珊 庞晓艳 张鹏 《计算机应用研究》 CSCD 北大核心 2023年第9期2875-2880,共6页
针对附着镜头或玻璃表面的雨滴会造成图像退化的问题,提出了一种多阶段渐进式图像去雨滴方法。整个去雨滴过程被分解为多个更易于实现的阶段。首先在每个阶段设计多尺度融合的编码—解码网络以学习雨滴特征,通过构建带有门控循环单元的... 针对附着镜头或玻璃表面的雨滴会造成图像退化的问题,提出了一种多阶段渐进式图像去雨滴方法。整个去雨滴过程被分解为多个更易于实现的阶段。首先在每个阶段设计多尺度融合的编码—解码网络以学习雨滴特征,通过构建带有门控循环单元的多尺度扩张卷积来细化内部传递的空间特征。然后引入无降维的通道注意力机制对特定空间特征下的通道信息进行提取。最后为加强每个阶段各部分之间的信息交换,采用跨阶段特征融合机制,在每个阶段的编码—解码网络之间加入横向连接,以实现特征信息的横向传递。在每个阶段之间加入监督注意模块,以增强不同阶段之间的信息传递,最终渐进地实现雨滴的去除。实验表明该方法能够有效地去除雨滴。 展开更多
关键词 图像去雨滴 深度学习 编码—解码结构 多尺度扩张卷积 通道注意力机制
在线阅读 下载PDF
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
3
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
图像的文本描述方法研究综述 被引量:6
4
作者 马龙龙 韩先培 孙乐 《中文信息学报》 CSCD 北大核心 2018年第4期1-12,共12页
随着深度学习技术的兴起,自然语言处理与计算机视觉领域呈现相结合的趋势。作为融合视觉和语言的多模态研究任务,图像的文本描述可应用于基于文本内容的图像检索、网络图像分析等众多场景中,从而受到了研究界和企业界的广泛关注。图像... 随着深度学习技术的兴起,自然语言处理与计算机视觉领域呈现相结合的趋势。作为融合视觉和语言的多模态研究任务,图像的文本描述可应用于基于文本内容的图像检索、网络图像分析等众多场景中,从而受到了研究界和企业界的广泛关注。图像的文本描述方法可归纳为三大类:基于生成的方法、基于检索的方法和基于编码—解码的方法。该文详细介绍了这三类方法各自具有代表性的工作,并进一步分析了各方法的优劣;然后对图像文本描述方法的相关数据集、评测标准和主要开源工具包进行了阐述;最后,分析了图像的文本描述中需要解决的关键技术问题。 展开更多
关键词 图像的文本描述 生成 检索 编码—解码
在线阅读 下载PDF
基于LinkNet的地震相自动划分 被引量:2
5
作者 陈海洋 汪玲玲 《石油地球物理勘探》 EI CSCD 北大核心 2023年第3期518-527,共10页
地震相人工解释需要耗费大量的时间和精力,并存在很大的主观性和不确定性,从而直接影响地震资料解释的准确性。虽然深度学习算法已经广泛用于地震相划分,然而由于地震相出现的模式及其空间尺度的多样性,在保证高分辨率以及高精度的同时... 地震相人工解释需要耗费大量的时间和精力,并存在很大的主观性和不确定性,从而直接影响地震资料解释的准确性。虽然深度学习算法已经广泛用于地震相划分,然而由于地震相出现的模式及其空间尺度的多样性,在保证高分辨率以及高精度的同时,提高计算效率仍是一项具有挑战性的任务。为此,提出基于LinkNet的地震相自动划分方法,采用多分类交叉熵与Tversky的加权线性组合作为网络训练的损失函数。Tversky通过调整参数平衡假正类和假负类,进而提升召回率等指标以提高不均衡数据中少数类地震相边界的刻画精度。LinkNet解码层共享编码层的学习特征,使解码层的结构更精简,大大提高了计算效率。在荷兰北海F3区块的测试结果表明:所提方法刻画地震相的精度高于U-Net+PPM(金字塔池化模块),在面对不均衡数据时,对占比较小的类别的关注度更高,并具有更好的边界刻画能力;LinkNet计算速度快,可以在配置更低的设备上运行,较U-Net+PPM更实用。 展开更多
关键词 深度学习 地震相划分 LinkNet 编码—解码结构 损失函数
在线阅读 下载PDF
Hadamard变换用于资料联立采集
6
作者 王维佳 《石油地球物理勘探》 EI CSCD 北大核心 1989年第3期241-247,366,共8页
多源联立资料采集的概念是 Garotta(1983)首先提出的,但是,他只给出两个源联立激发的编码与解码公式。实际上采用 Hadamard 变换可以实现多源或多接收器的资料联立采集。通过 Hadamard 编码,可用单道同时对多源或多接收器的数据进行记录... 多源联立资料采集的概念是 Garotta(1983)首先提出的,但是,他只给出两个源联立激发的编码与解码公式。实际上采用 Hadamard 变换可以实现多源或多接收器的资料联立采集。通过 Hadamard 编码,可用单道同时对多源或多接收器的数据进行记录,再用 Hadamard 反变换进行解码分离,便可得到各单源或单接收器的观测结果。文中给出2N 阶 Hadamard 矩阵,并推导出相应的编码—解码公式。对于 N 次编码来说,其解码记录要比原单次记录增强 N倍,这相当于起了垂直叠加的作用。随机干扰不存在编码关系,所以联立采集有压制干扰的作用。采用资料联立采集还可以大大加快野外施工速度,使少道仪器发挥出多道仪器的作用。本法不仅适用于地震勘探,原则上也适用于其它应用人工源的地球物理方法。采用本法时,有必要用专门的现场编码设备进行质量控制。 展开更多
关键词 HADAMARD 变换 资料联立采集 多源编码—解码
在线阅读 下载PDF
Frame-bitrate-change based steganography for voice-over-IP 被引量:4
7
作者 刘进 田晖 周可 《Journal of Central South University》 SCIE EI CAS 2014年第12期4544-4552,共9页
Steganography based on bits-modification of speech frames is a kind of commonly used method, which targets at RTP payloads and offers covert communications over voice-over-IP(Vo IP). However, direct modification on fr... Steganography based on bits-modification of speech frames is a kind of commonly used method, which targets at RTP payloads and offers covert communications over voice-over-IP(Vo IP). However, direct modification on frames is often independent of the inherent speech features, which may lead to great degradation of speech quality. A novel frame-bitrate-change based steganography is proposed in this work, which discovers a novel covert channel for Vo IP and introduces less distortion. This method exploits the feature of multi-rate speech codecs that the practical bitrate of speech frame is identified only by speech decoder at receiving end. Based on this characteristic, two steganography strategies called bitrate downgrading(BD) and bitrate switching(BS)are provided. The first strategy substitutes high bit-rate speech frames with lower ones to embed secret message, which introduces very low distortion in practice, and much less than other bits-modification based methods with the same embedding capacity. The second one encodes secret message bits into different types of speech frames, which is an alternative choice for supplement. The two strategies are implemented and tested on our covert communication system Steg Vo IP. The experiment results show that our proposed method is effective and fulfills the real-time requirement of Vo IP communication. 展开更多
关键词 covert communication steganography multi-rate speech codec voice-over-IP(VOIP)
在线阅读 下载PDF
Screen image sequence compression method utilizing adaptive block size coding and hierarchical GOP structure
8
作者 武星 梅亮 +2 位作者 袭奇 张申生 陈延伟 《Journal of Central South University》 SCIE EI CAS 2010年第4期786-794,共9页
To compress screen image sequence in real-time remote and interactive applications,a novel compression method is proposed.The proposed method is named as CABHG.CABHG employs hybrid coding schemes that consist of intra... To compress screen image sequence in real-time remote and interactive applications,a novel compression method is proposed.The proposed method is named as CABHG.CABHG employs hybrid coding schemes that consist of intra-frame and inter-frame coding modes.The intra-frame coding is a rate-distortion optimized adaptive block size that can be also used for the compression of a single screen image.The inter-frame coding utilizes hierarchical group of pictures(GOP) structure to improve system performance during random accesses and fast-backward scans.Experimental results demonstrate that the proposed CABHG method has approximately 47%-48% higher compression ratio and 46%-53% lower CPU utilization than professional screen image sequence codecs such as TechSmith Ensharpen codec and Sorenson 3 codec.Compared with general video codecs such as H.264 codec,XviD MPEG-4 codec and Apple's Animation codec,CABHG also shows 87%-88% higher compression ratio and 64%-81% lower CPU utilization than these general video codecs. 展开更多
关键词 screen image sequence compression adaptive block size hierarchical GOP structure intra-frame coding inter-frame coding
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部