期刊文献+
共找到812篇文章
< 1 2 41 >
每页显示 20 50 100
基于改进iTransformer的多维特征河流水质预测方法研究
1
作者 樊力震 董建刚 李俊俊 《现代电子技术》 北大核心 2025年第8期179-186,共8页
水质预测是水资源生态管理的重要组成部分。水质数据易受环境影响,随着时间、随机事件、自然条件变化等因素呈现出非平稳性和非线性的特性,使得水质时序依赖较为复杂,其规律难以捕捉。为更准确地提取水质时序规律,并使其具备一定的泛化... 水质预测是水资源生态管理的重要组成部分。水质数据易受环境影响,随着时间、随机事件、自然条件变化等因素呈现出非平稳性和非线性的特性,使得水质时序依赖较为复杂,其规律难以捕捉。为更准确地提取水质时序规律,并使其具备一定的泛化性,提出一种基于改进iTransformer的多维特征水质预测模型——GF-iTransformer。针对水质数据中的复杂噪声问题,引入一维高斯-拉普拉斯滤波器对水质时序数据进行降噪。为更好地挖掘水质数据中隐含的频域信息,加入频率增强通道注意力机制,利用基于离散余弦变换(DCT)的频率信息提取方法,从本质上避免了基于傅里叶变换(FT)造成的吉布斯现象,并相对减少了计算量,得到了更好的预测性能。在3个不同的公共数据集(ETTh1、ETTh2、ETTm2)和两个河流数据集(yihe、luohe)上进行验证,结果表明,相较于TimesNet、ETSformer、DLinear等6个现有主流时序预测模型,文中所提GF-iTransformer模型都展现出了较好的预测精度,证明了该模型的有效性。 展开更多
关键词 水质预测 多维特征 itransformer模型 高斯-拉普拉斯滤波器 注意力机制 离散余弦变换
在线阅读 下载PDF
Hankel矩阵的离散Cosine变换的快速算法
2
作者 汪祥 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第4期461-463,共3页
在图像和信号处理研究邻域,经常会涉及到结构矩阵的离散sine、快速傅里叶变换(FFT)及离散cosine变换.文献[6]的作者利用FFT给出了离散cosine变换的一个算法,计算变换矩阵的M个元素所需的计算量和存贮空间分别为O(N2logN)+O(M)和O(N2).... 在图像和信号处理研究邻域,经常会涉及到结构矩阵的离散sine、快速傅里叶变换(FFT)及离散cosine变换.文献[6]的作者利用FFT给出了离散cosine变换的一个算法,计算变换矩阵的M个元素所需的计算量和存贮空间分别为O(N2logN)+O(M)和O(N2).本文利用Hankel矩阵的结构特点导出一递推关系式(见式(8)),给出了Hankel矩阵的离散cosine变换(DCT)的一个快速算法.该算法所需要的存贮空间为O(N),计算变换矩阵的M个元素所需的计算量为O(NlogN)+O(M). 展开更多
关键词 HANKEL矩阵 快速算法 离散 快速傅里叶变换 存贮空间 变换矩阵 递推关系式 结构矩阵 信号处理 结构特点 计算量 FFT 元素 图像
在线阅读 下载PDF
采用离散余弦变换的复合材料构件制造偏差建模方法
3
作者 常正平 李学文 +3 位作者 严康赫 李晓锋 罗群 王仲奇 《西安交通大学学报》 北大核心 2025年第3期201-209,共9页
为能够更精确、高效地表达碳纤维增强复合材料构件制造偏差,提出了一种基于离散余弦变换的制造偏差建模方法。首先,对构件理论表面进行离散化得到网格模型,计算网格模型节点与对应区域实测点云数据的法向距离以表征制造偏差,进而得到复... 为能够更精确、高效地表达碳纤维增强复合材料构件制造偏差,提出了一种基于离散余弦变换的制造偏差建模方法。首先,对构件理论表面进行离散化得到网格模型,计算网格模型节点与对应区域实测点云数据的法向距离以表征制造偏差,进而得到复合材料构件制造偏差场,实现了理论模型与实测数据的融合。其次,采用二维离散余弦正变换,将制造偏差场分解为一系列偏差模态的线性组合,并结合离散余弦变换的能量集中特性与核函数的正交性,对复合材料构件制造偏差场组成模态进行识别与筛选,确定了构成制造偏差场的关键模态。然后,对确定的制造偏差场关键模态进行离散余弦逆变换,并重构制造偏差场,实现了构件制造偏差场的数据精简,该方法在保证重构模型精度的同时减少了计算复杂度与数据存储量。最后,通过复合材料蒙皮构件开展实例验证。结果表明:点云数据网格尺寸与重构精度、偏差模态总数成反比,当数据删减率为60.54%时,其相对重构误差为7.62%。研究结果证明了基于离散余弦变换的偏差建模方法可精确、高效地表征复合材料构件的制造偏差特征。 展开更多
关键词 离散余弦变换 复合材料构件 制造偏差 模态识别
在线阅读 下载PDF
基于对称融合多尺度双域网络的图像压缩感知重建方法
4
作者 林乐平 廖心竹 欧阳宁 《计算机工程与设计》 北大核心 2025年第7期1905-1911,共7页
针对图像在细节丰富和结构复杂区域重建效果不佳的问题,提出一种对称融合多尺度双域网络(SFMD-Net),通过融合频域和空间域信息,提高图像重建质量。在频域增强支路,利用二维离散余弦变换获取频域信息,通过双残差注意模块深化频域关键特... 针对图像在细节丰富和结构复杂区域重建效果不佳的问题,提出一种对称融合多尺度双域网络(SFMD-Net),通过融合频域和空间域信息,提高图像重建质量。在频域增强支路,利用二维离散余弦变换获取频域信息,通过双残差注意模块深化频域关键特征的学习。在空域多尺度重建支路,设计多尺度深度细化模块,加强对空间域内不同层次和尺度特征的提取与增强。引入对称融合策略确保频域与空间域特征的有效融合,提高重建图像的细节表现和整体视觉质量。实验结果表明,与当前主流压缩感知重建算法相比,所提算法在性能和效果上均有改进,尤其是在重建边缘明显和纹理丰富的图像方面。 展开更多
关键词 压缩感知 多尺度特征 离散余弦变换 图像重建 对称融合 深度学习 双域网络
在线阅读 下载PDF
基于双混沌系统的双随机相位编码和压缩感知的图像加密算法 被引量:1
5
作者 赵雪妍 张钊 +2 位作者 贾静雯 周红艳 陈雪波 《计算机工程与科学》 北大核心 2025年第5期885-893,共9页
通过将一维Logistic混沌系统、四维新超混沌系统NHS、压缩感知CS理论和双随机相位编码DRPE技术以及二维离散余弦变换DCT相结合,提出了一种新的图像加密算法。首先,利用二维DCT对灰度图像进行稀疏表示,对通过索引排序置乱得到的稀疏矩阵... 通过将一维Logistic混沌系统、四维新超混沌系统NHS、压缩感知CS理论和双随机相位编码DRPE技术以及二维离散余弦变换DCT相结合,提出了一种新的图像加密算法。首先,利用二维DCT对灰度图像进行稀疏表示,对通过索引排序置乱得到的稀疏矩阵进行置乱;其次,利用CS进行测量,测量矩阵由四维NHS生成;最后,进行DRPE的二次加密,使用Logistic混沌映射和四维NHS作为双重密钥,实现DRPE,得到最终加密图像。该算法充分利用了CS的优点,同时实现压缩和加密,并将CS理论与DRPE技术相结合,既减少了存储空间、降低了传输带宽,又提高了加密的安全性能。仿真实验和对比分析表明,所提出的图像加密算法具有良好的安全性、鲁棒性和解密质量。 展开更多
关键词 双混沌系统 压缩感知 双随机相位编码 二维离散余弦变换
在线阅读 下载PDF
基于对称卷积的镜像综合孔径无混叠视场研究
6
作者 李育芳 朱四华 +2 位作者 尹肖云 陈晔 刘丹丹 《电波科学学报》 北大核心 2025年第1期132-140,共9页
无混叠视场直接决定综合孔径可以观测的视场范围,对提升观测视场内的镜像综合孔径亮温图像质量具有重要意义。本文基于离散余弦变换(discrete cosine transform,DCT)域卷积定理,推导了镜像综合孔径的阵列因子,获得镜像综合孔径无混叠视... 无混叠视场直接决定综合孔径可以观测的视场范围,对提升观测视场内的镜像综合孔径亮温图像质量具有重要意义。本文基于离散余弦变换(discrete cosine transform,DCT)域卷积定理,推导了镜像综合孔径的阵列因子,获得镜像综合孔径无混叠视场为综合孔径视场的1/2,此外,镜像综合孔径重建亮温图像可以表示为延拓的场景与延拓的阵列因子的乘积。利用仿真和现有的镜像综合孔径实验系统验证了一维和二维镜像综合孔径无混叠视场的理论正确性,本文研究方法可为提升镜像综合孔径亮温图像质量提供参考。 展开更多
关键词 镜像综合孔径 综合孔径 离散余弦变换(DCT)域卷积定理 对称延拓 亮温图像重建
在线阅读 下载PDF
基于幅值重排的抗倍速攻击音频水印算法
7
作者 王鑫 黄樱 +3 位作者 牛保宁 吴世强 兰方鹏 关虎 《太原理工大学学报》 北大核心 2025年第3期465-473,共9页
【目的】数字音频水印技术是指将具有特定意义的水印信号嵌入到原始音频信号中,并在需要时可将水印信号提取出来的技术。该技术在版权保护、内容认证、保密通信等领域有着重要的应用。随着音频编辑软件和在线音频编辑网站日益成熟,对音... 【目的】数字音频水印技术是指将具有特定意义的水印信号嵌入到原始音频信号中,并在需要时可将水印信号提取出来的技术。该技术在版权保护、内容认证、保密通信等领域有着重要的应用。随着音频编辑软件和在线音频编辑网站日益成熟,对音频进行修改变得越来越便捷,对音频进行倍速是一种常见的修改,但现有的数字音频水印算法对音频倍速攻击的鲁棒性有待提高,不能很好地抵抗这种修改。针对这一问题,提出基于波形相似重叠加法和幅值重排的音频水印算法。【方法】该算法基于倍速原理,通过波形相似重叠加法划分音频区域,确定倍速前后均存在的不变区域作为嵌入区域,保证水印在倍速攻击中的稳定性;对嵌入区域进行离散余弦变换后,选取不易感知且抗攻击性好的中频区域,使用幅值重排的方法实现水印嵌入,使该区域在嵌入前后的总能量保持不变,在保证不可感知性的同时提高水印算法对倍速攻击的鲁棒性。【结果】实验结果表明,该算法在保持音频水印不可感知性的同时,能够提高对倍速攻击的鲁棒性,平均误码率小于0.02。 展开更多
关键词 音频水印 音频倍速 幅值重排 离散余弦变换 鲁棒性 不可感知性
在线阅读 下载PDF
全局语义感知与纹理频域约束的激光干扰图像修复
8
作者 赵佩瑶 冯斌 +3 位作者 杨欣朋 苗锡奎 吴云龙 叶庆 《红外与激光工程》 北大核心 2025年第5期324-338,共15页
成像设备在受到外界激光干扰时,干扰光斑会遮挡显著目标的有效信息,导致图像质量显著下降,对后续工作带来困扰。针对激光干扰图像修复的问题,提出了基于全局语义感知与纹理频域约束的激光干扰图像修复网络模型。该模型由全局语义引导阶... 成像设备在受到外界激光干扰时,干扰光斑会遮挡显著目标的有效信息,导致图像质量显著下降,对后续工作带来困扰。针对激光干扰图像修复的问题,提出了基于全局语义感知与纹理频域约束的激光干扰图像修复网络模型。该模型由全局语义引导阶段和局部细节增强阶段两部分组成:全局语义引导阶段通过结合滑动窗口的自注意力机制和分层结构的HBES(Hybrid Block of ESA andSTL)模块逐步扩大感受野以提取全局上下文信息,从而准确地推断出干扰区域的合理内容;局部细节增强阶段则以全局语义引导阶段的预测结果为输入,通过分析未干扰区域和干扰区域之间的相似性,将背景和干扰区域的关联信息相结合,生成高质量的修复结果。此外,为提升网络对纹理细节的关注,设计了一种余弦变换损失函数,强调图像细节部分的修复,使干扰区域的重建图像清晰、连贯。实验结果表明,该模型在激光干扰图像修复任务上取得了良好的修复效果,有效改善了图像质量。 展开更多
关键词 图像修复 激光干扰 上下文注意力机制 生成对抗网络 离散余弦变换
在线阅读 下载PDF
基于区块链的图像数字版权保护系统
9
作者 兰亚杰 马自强 +1 位作者 苗莉 胡富森 《应用科学学报》 北大核心 2025年第2期315-333,共19页
传统的版权管理方法依赖集中式服务器进行存储与验证,这会导致侵权检测困难、版权确权复杂、版权授权流程烦琐,以及缺乏有效的相似性检索机制等问题,使得为版权拥有者提供具有公信力的版权证明变得困难。为此,该文在Hyperledger Fabric... 传统的版权管理方法依赖集中式服务器进行存储与验证,这会导致侵权检测困难、版权确权复杂、版权授权流程烦琐,以及缺乏有效的相似性检索机制等问题,使得为版权拥有者提供具有公信力的版权证明变得困难。为此,该文在Hyperledger Fabric区块链网络的基础上,结合尺度不变特征变换相似性检测算法、离散余弦变换零水印算法、混沌映射图像加密算法、星际文件系统分布式存储,提出了一种图像数字版权保护系统。通过系统功能测试及性能分析发现,该系统可以实现确权图像相似性检测、版权所属权证明、去中心化加密存储、版权变更等版权维权功能。该研究为版权拥有者提供了一个透明、安全且开放的图像数字版权交易平台。 展开更多
关键词 区块链 尺度不变特征变换 离散余弦变换零水印 混沌映射 图像数字版权
在线阅读 下载PDF
融合Mobile Vit和倒置门控编解码的视网膜血管分割算法
10
作者 梁礼明 阳渊 +2 位作者 朱晨锟 何安军 吴健 《北京航空航天大学学报》 北大核心 2025年第3期712-723,共12页
针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域... 针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域维度减少图像特征信息缺失,精确分割血管前景像素;提出特征自适应融合模块,建立血管纹理上下文依赖关系,提高血管分割灵敏度;优化编解码结构,设计倒置门控编解码模块,进一步捕获空间信息与深层语义信息,提高视网膜血管图像分割精度。在公共数据集DRIVE、STARE和CHASE_DB1上对所提算法进行实验,特异性分别为0.9863、0.9897和0.9873,准确度分别为0.9709、0.9754和0.9760,敏感度分别为0.8109、0.8010和0.8079。仿真实验证明,所提网络对视网膜血管分割具有较好的分割效果,为眼科疾病的诊断提供了新窗口。 展开更多
关键词 视网膜血管 Mobile Vit模块 离散余弦变换 倒置门控编解码模块 特征自适应融合
在线阅读 下载PDF
基于离散余弦变换的快速对抗训练方法 被引量:1
11
作者 王晓淼 张玉金 +2 位作者 张涛 田瑾 吴飞 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第11期2230-2238,共9页
为了提升深度神经网络的鲁棒性,从频域的角度提出基于离散余弦变换(DCT)的快速对抗训练方法.引入对抗初始化生成模块,根据系统的鲁棒性自适应地生成初始化信息,可以更精准地捕捉到图像特征,有效避免灾难性过拟合.对样本进行随机谱变换,... 为了提升深度神经网络的鲁棒性,从频域的角度提出基于离散余弦变换(DCT)的快速对抗训练方法.引入对抗初始化生成模块,根据系统的鲁棒性自适应地生成初始化信息,可以更精准地捕捉到图像特征,有效避免灾难性过拟合.对样本进行随机谱变换,将样本从空间域变换至频谱域,通过控制频谱显著性提高模型的迁移与泛化能力.在CIFAR-10与CIFAR-100数据集上验证提出方法的有效性.实验结果表明,在以ResNet18为目标网络,面对PGD-10攻击时,本文方法在CIFAR-10上的鲁棒精度较现有方法提升了2%~9%,在CIFAR-100上提升了1%~9%.在面对PGD-20、PGD-50、C&W等其他攻击以及架构更复杂的模型时,均取得了类似的效果.提出方法在避免灾难性过拟合现象的同时,有效提高了系统的鲁棒性. 展开更多
关键词 对抗样本 快速对抗训练 离散余弦变换(DCT) 鲁棒性 样本初始化
在线阅读 下载PDF
使用频域卷积的端到端图像数字盲水印方法 被引量:1
12
作者 张志伟 王晗 崔凯元 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第11期1719-1727,共9页
传统数字水印方法对裁剪、噪声、形变等攻击具有强鲁棒性,但很难抵御真实场景中由图像压缩编码和移动摄像设备翻拍引起的水印信息丢失.为了增强水印的鲁棒性,利用离散余弦变换频谱中某些频段对人眼的掩蔽特性,以及卷积神经网络对一些不... 传统数字水印方法对裁剪、噪声、形变等攻击具有强鲁棒性,但很难抵御真实场景中由图像压缩编码和移动摄像设备翻拍引起的水印信息丢失.为了增强水印的鲁棒性,利用离散余弦变换频谱中某些频段对人眼的掩蔽特性,以及卷积神经网络对一些不可见扰动的学习能力,提出一种基于频域卷积的端到端图像数字盲水印方法.首先使用卷积神经网络构建编码网络,将水印信息嵌入到图像频域中;其次构建与编码网络对称的解码网络,从图像频域中提取水印信息;最后对编码和解码网络进行联合训练,并监督编码网络的图像质量和解码网络的水印提取效果.在MIRFLICKR数据集上的实验结果表明,所提方法对显示器下翻拍攻击的PSNR,SSIM,LPIPS和BPP分别达到36.29 dB, 0.951, 3.11×10^(-3), 2.44×10^(-3)和93.1%,与其他基准方法相比具有一定的优势,证明了该方法的有效性. 展开更多
关键词 图像数字水印 离散余弦变换 鲁棒水印 卷积神经网络
在线阅读 下载PDF
基于全局频域池化的行为识别算法 被引量:1
13
作者 贾志超 张海超 +3 位作者 张闯 颜蒙蒙 储金祺 颜之岳 《计算机应用研究》 CSCD 北大核心 2024年第9期2867-2873,共7页
目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(g... 目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(global frequency domain pooling,GFDP)的行为识别算法。首先,根据离散余弦变换(discrete cosine transform,DCT)看出,GAP是频域中特征分解的一种特例,从而引入更多频率分量增加特征通道间的特异性,减少信息压缩后的信息冗余;其次,为了更好地抑制过拟合问题,引入卷积层的批标准化策略,并将其拓展在以ERB(efficient residual block)-Res3D为骨架的行为识别模型的全连接层以优化数据分布;最后,将该方法在UCF101数据集上进行验证。结果表明,模型计算量为3.5 GFlops,参数量为7.4 M,最终的识别准确率在ERB-Res3D模型的基础上提升了3.9%,在原始Res3D模型基础上提升了17.4%,高效实现了更加准确的行为识别结果。 展开更多
关键词 3D-ConvNet 人体行为识别 全局平均池化 离散余弦变换
在线阅读 下载PDF
用于热成像数据的卷积神经网络特征图筛选方法 被引量:1
14
作者 张雷 沈国琛 欧冬秀 《计算机工程》 CAS CSCD 北大核心 2024年第4期31-40,共10页
红外热成像数据可以有效辅助可见光图像数据,弥补其在天气和光照条件上的不足。现有的研究往往借助域适应将基于可见光图像数据训练得到的卷积神经网络用于处理热成像数据,以弥补热成像数据缺少大量标注训练集的不足,但是这类方法仍无... 红外热成像数据可以有效辅助可见光图像数据,弥补其在天气和光照条件上的不足。现有的研究往往借助域适应将基于可见光图像数据训练得到的卷积神经网络用于处理热成像数据,以弥补热成像数据缺少大量标注训练集的不足,但是这类方法仍无法避免一定程度的训练。而一些研究者发现,图像在频域上呈现域不变成分和随域改变成分的分离现象。受这一现象的启发,提出一种基于离散余弦变换和卡方独立性分数的卷积神经网络特征图筛选方法。利用频域分离域不变成分和随域改变成分,借鉴卡方独立性检验的思想提出基于频段分量的独立性分数,用于度量特征图的差异度,使用聚类将特征图分类,保留主要包含域不变成分的特征图分支,得到适用于热成像数据的网络。实验结果表明,该方法可以充分利用预训练卷积神经网络的潜在预测能力,且不需要重新训练模型。预训练网络无法预测热成像数据,而筛选后的网络前5位预测结果与目标相关的比例最高可达90%。 展开更多
关键词 热成像数据 离散余弦变换 域适应 卷积神经网络 交通场景
在线阅读 下载PDF
利用可逆网络的音频藏图算法
15
作者 张晓虹 项世军 黄红斌 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第4期226-238,共13页
可逆网络因其具有天然可逆的结构,非常适用于信息隐藏领域。图像能以生动直观、有层次的方式传递信息,而音频是一种广泛传播和使用的媒体文件,具有较大的嵌入容量,因此在音频中隐藏图像具有较高的研究和应用价值。在音频藏图任务中,如... 可逆网络因其具有天然可逆的结构,非常适用于信息隐藏领域。图像能以生动直观、有层次的方式传递信息,而音频是一种广泛传播和使用的媒体文件,具有较大的嵌入容量,因此在音频中隐藏图像具有较高的研究和应用价值。在音频藏图任务中,如何表征音频和图像数据以及如何在减少音频失真的同时提高重建图像的质量是两个重要的问题。针对这两个问题,提出了一种基于可逆网络的音频藏图算法。对于数据特征表示,受到JPEG图像压缩中数据处理方法的启发,提出了图像特征提取与表示模块,该模块对彩色图像依次进行分块离散余弦变换、锯齿扫描和高低频分离操作,提取出图像的频域特征并得到其一维表示。此外,为了减少音频失真并提高重建图像的质量,利用小波变换分离音频的高低频分量并引入可逆网络将秘密图像嵌入到载体音频的高频区域中。实验结果表明,所提出的算法在实现高嵌入率的同时,能生成质量更高的隐写音频以及重建出更加还原的彩色图像,且算法具有较高的安全性。 展开更多
关键词 隐写 图像隐藏 可逆网络 小波变换 离散余弦变换
在线阅读 下载PDF
不同光照下多模态注意力融合的车辆检测
16
作者 王佳琪 张淇 黄巍 《计算机工程与应用》 CSCD 北大核心 2024年第16期116-123,共8页
针对现有基于单模态车辆检测算法受光照变换所导致的性能下降问题,提出了一种红外和可见光融合的多模态检测方法YOLO-MMF。该方法构建高效的双流特征提取网络,分别提取可见光图像和红外图像的特征,用DenseBlock结构代替了YOLOv5中浅层CS... 针对现有基于单模态车辆检测算法受光照变换所导致的性能下降问题,提出了一种红外和可见光融合的多模态检测方法YOLO-MMF。该方法构建高效的双流特征提取网络,分别提取可见光图像和红外图像的特征,用DenseBlock结构代替了YOLOv5中浅层CSP模块中的瓶颈层,加强对小目标的特征提取能力;采用特征级融合机制,利用离散余弦变换获取高频信息,改善因平均池化使细节信息丢失的现象,并与自注意力机制相结合,使网络可以自发捕捉模态间潜在的互补性,从而显著提高车辆检测的性能。在DroneVehicle数据集上的实验结果证实了该方法的有效性,相比单一模态检测方式,平均检测精度分别提升了14.4个百分点和10.8个百分点,该方法在面对光照变换等复杂情况时具有较好的鲁棒性。 展开更多
关键词 车辆检测 多模态融合 自注意力机制 离散余弦变换
在线阅读 下载PDF
结合注意力的纺织品瑕疵检测方法研究
17
作者 周在雍 狄岚 《智能系统学报》 CSCD 北大核心 2024年第4期827-838,共12页
本文阐述了一种名为SAAM-YOLOX的基于改进YOLOX的纺织品瑕疵检测模型,旨在解决纺织品瑕疵检测中针对犬牙花纹与格纹背景中出现的误检和漏检问题,以及整体检测精度不高的问题。在特征提取阶段,该模型引入了离散余弦变换所构建的多分支离... 本文阐述了一种名为SAAM-YOLOX的基于改进YOLOX的纺织品瑕疵检测模型,旨在解决纺织品瑕疵检测中针对犬牙花纹与格纹背景中出现的误检和漏检问题,以及整体检测精度不高的问题。在特征提取阶段,该模型引入了离散余弦变换所构建的多分支离散余弦注意力机制(multi-branch discrete cosine attention,MDCA),能够解决模型在犬牙花纹与格纹背景中出现的误检和漏检问题,并且在检测精度上有一定的提高;在特征融合阶段,为了聚集和加强不同尺度的语义特征,SAAM-YOLOX模型采用了尺度聚合技术和注意力机制来构建尺度聚合注意力模块(scale aggregation attention module,SAAM)。在SAAM的上采样过程中,使用双线性插值结合自注意力机制来增强特征信息的有效性,从而进一步提高检测的精度。在完成尺度聚合后,加入注意力模块来增强混合尺度的特征表示,最终实现提高检测效果的目的。实验结果表明,本文检测模型解决了犬牙花纹与格纹背景中出现的误检和漏检问题,并且提高了瑕疵检测的精度。 展开更多
关键词 注意力机制 尺度聚合 双线性插值 离散余弦变换 多尺度特征 特征融合 纺织品瑕疵检测 计算机视觉
在线阅读 下载PDF
DCT和无损编码的GNSS中频信号压缩算法
18
作者 林子钧 庄学彬 +2 位作者 曾小慧 王帅 钟元芾 《导航定位学报》 CSCD 北大核心 2024年第6期84-95,共12页
针对全球卫星导航系统(GNSS)中频信号在数据回放与分析、模拟测试场景下存储数据量大,内存占用高的问题,提出一种基于离散余弦变换(DCT)和无损编码的GNSS中频信号压缩算法:结合DCT变换和多种主流无损编码技术,根据信号功率谱特性确定压... 针对全球卫星导航系统(GNSS)中频信号在数据回放与分析、模拟测试场景下存储数据量大,内存占用高的问题,提出一种基于离散余弦变换(DCT)和无损编码的GNSS中频信号压缩算法:结合DCT变换和多种主流无损编码技术,根据信号功率谱特性确定压缩方式和多个压缩阈值,实现信号功率谱的多阶层自适应压缩;针对多种采样率信号和多种量化位宽信号进行实验,利用软件接收机评估算法对信号功率估计精度的影响及算法压缩性能。结果表明,DCT_Zstd算法可以同时满足压缩率较低和压缩时间较短的需求,算法对仿真信号和实测信号的最小功率损失分别约为0.16 dBHz和0.51 dBHz,特别是对实测信号的压缩率可达1%的同时,仅对导航定位解算有微小的影响。 展开更多
关键词 全球卫星导航系统(GNSS) 中频信号 信号压缩 离散余弦变换 无损编码 功率估计
在线阅读 下载PDF
基于视觉传达技术的激光三维图像虚拟重建方法
19
作者 高越飞 兰慧红 《激光杂志》 CAS 北大核心 2024年第7期162-167,共6页
为了提升激光三维图像虚拟重建效果,提出了基于视觉传达技术的激光三维图像虚拟重建方法。获取激光三维图像的纹理特征值,采集到激光三维图像,提取激光三维图像重建特征;融合频率域特征和纹理特征,得到激光三维图像多特征数据集以及激... 为了提升激光三维图像虚拟重建效果,提出了基于视觉传达技术的激光三维图像虚拟重建方法。获取激光三维图像的纹理特征值,采集到激光三维图像,提取激光三维图像重建特征;融合频率域特征和纹理特征,得到激光三维图像多特征数据集以及激光三维图像多特征数据集内坏特征,设计多特征融合的步骤;根据多特征融合结果,得到三维特定激光三维图像模型,实现激光三维图像虚拟重建结果。实验结果证明:该系统可有效解决了激光三维图像重建难题,当遮挡比例为18%时,尺度不变深度误差值与平均角度误差值均达到最大,最大值均未超过设置阈值,本方法结构相似度在90%以上,重建精度较高,可以实现激光三维图像高精度虚拟重建。 展开更多
关键词 激光三维图像 虚拟重建 离散余弦变换 重建误差
在线阅读 下载PDF
一种基于Fibonacci数系的数字水印新方法 被引量:8
20
作者 邹建成 石志鑫 《电子学报》 EI CAS CSCD 北大核心 2011年第7期1598-1602,共5页
本文基于Fibonacci数系,给出了一种抗JPEG压缩的数字水印算法.该算法利用Fibonacci数列、整数的Fibonacci表示以及兔子序列S,构造了量化DCT系数的Fibonacci量化表Q和嵌入水印的系数修改表M.通过改变构造M表的位阈值N能够方便地的解决图... 本文基于Fibonacci数系,给出了一种抗JPEG压缩的数字水印算法.该算法利用Fibonacci数列、整数的Fibonacci表示以及兔子序列S,构造了量化DCT系数的Fibonacci量化表Q和嵌入水印的系数修改表M.通过改变构造M表的位阈值N能够方便地的解决图像压缩质量与水印的鲁棒性之间的冲突.由于Fibonacci数是呈黄金分割递增的,而JPEG压缩主要原理也是DCT变换,所以本算法通过构造的量化表和系数修改表来修改DCT直流分量嵌入水印,对于抗JPEG压缩有很好的鲁棒性.实验结论表明,当构造M表的位阈值N=7,图像压缩质量IQ=40%时,使用本算法提取水印的正确率能达到90%以上. 展开更多
关键词 FIBONACCI数列 数字水印 兔子序列 DCT(discrete cosine transform)
在线阅读 下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部