期刊文献+
共找到246篇文章
< 1 2 13 >
每页显示 20 50 100
基于AMR-WB编解码器的移动网络话音传输抗丢包算法 被引量:3
1
作者 王晶 刘宝光 +1 位作者 费泽松 张剑寅 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第10期1048-1052,共5页
针对移动通信网络中AMR-WB编解码器在话音分组传输中的抗丢包问题,提出了一种与VoLTE系统中语音编码速率相匹配的AMR-WB抗丢包实现方案.通过实验分析AMR-WB编解码器中经过错误隐藏恢复的各个参数对语音质量的影响,利用多描述编码(multip... 针对移动通信网络中AMR-WB编解码器在话音分组传输中的抗丢包问题,提出了一种与VoLTE系统中语音编码速率相匹配的AMR-WB抗丢包实现方案.通过实验分析AMR-WB编解码器中经过错误隐藏恢复的各个参数对语音质量的影响,利用多描述编码(multiple description coding,MDC)技术设计了AMR-WB抗丢包方案,并进一步结合删余卷积编码提出了双重差错保护的增强型抗丢包算法,实现了多码率下的差错保护和速率匹配,该方案可兼容原有AMR-WB编码模式下的语音编码速率.仿真结果表明,提出的新方案能够增强AMR-WB的抗丢包能力,并且不需要增加额外的信令开销,兼容现有系统网络中的多速率语音编码. 展开更多
关键词 amr-wb MDC 删余卷积编码 移动网络
在线阅读 下载PDF
Windows环境下用软件CODEC实现数字视频实时通信 被引量:1
2
作者 陈宁 谈大龙 王庆鹏 《计算机工程》 CAS CSCD 北大核心 2001年第9期144-146,共3页
讨论了Windows环境下利用软件编解码器实现视频压缩的方法和技巧,结合视频捕获和视频传输,以网络环境下机器人遥操作的实际应用为背景,给出了数字视频实时通信的编程实例。
关键词 软件编解码 数字视频实时通信 WINDOWS codec 视频捕获 视频传输
在线阅读 下载PDF
AMR-WB+中帧错误隐藏算法的优化 被引量:2
3
作者 周凤 吴云 赵勇 《计算机工程》 CAS CSCD 北大核心 2009年第24期222-224,共3页
AMR-WB+是应用于第3代移动通信系统的最新音频压缩编解码标准。分析AMR-WB+中基音延迟参数的帧错误隐藏算法,给出算法优化方案。实验结果表明,优化后的基音延迟参数的帧错误隐藏算法在平均情况下,客观测试得分高于原算法,主观测试得分... AMR-WB+是应用于第3代移动通信系统的最新音频压缩编解码标准。分析AMR-WB+中基音延迟参数的帧错误隐藏算法,给出算法优化方案。实验结果表明,优化后的基音延迟参数的帧错误隐藏算法在平均情况下,客观测试得分高于原算法,主观测试得分与原算法相当。 展开更多
关键词 amr-wb+标准 音频编码 错误隐藏 算法优化
在线阅读 下载PDF
基于AMR-WB线谱频率参数的隐写算法
4
作者 滕达 冯浩楠 《计算机应用与软件》 CSCD 2016年第5期278-280,301,共4页
AMR-WB(Adaptive Multi-Rate-Wideband)的线谱频率LSF(Line Spectrum Frequency)参数在编码过程中会分裂为若干子矢量。利用编解码过程中的ISF索引参数,提出一种在3G话音中隐藏信息的算法。该算法首先选择用于信息隐藏的LSF索引段,然后... AMR-WB(Adaptive Multi-Rate-Wideband)的线谱频率LSF(Line Spectrum Frequency)参数在编码过程中会分裂为若干子矢量。利用编解码过程中的ISF索引参数,提出一种在3G话音中隐藏信息的算法。该算法首先选择用于信息隐藏的LSF索引段,然后通过修改所选的LSF索引段进行信息隐藏。实验结果表明,改变特定LSF索引会在较少影响话音质量的同时隐藏信息,该算法在具有较好隐蔽性的同时又能较少影响语音质量。 展开更多
关键词 线谱频率 amr-wb 信息隐藏
在线阅读 下载PDF
Windows环境下基于软件CODEC的实时视频压缩解压缩技术 被引量:2
5
作者 刘军 叶晓东 周耀华 《计算机工程》 EI CAS CSCD 北大核心 2000年第8期151-153,共3页
讨论了Windows环境下利用软件压缩解压缩器进行实时视频处理的VCM接口技术,并给出了相应的编程实例,同时结合一个局域网视频实时传输系统对软件CODEC技术在多媒体系统中的应用作了一定的探讨.
关键词 软件压缩解压缩器 多媒体系统 codec WINDOWS
在线阅读 下载PDF
SpaceWire CODEC的容错设计和实现 被引量:2
6
作者 程照强 刘淑芬 《空间控制技术与应用》 2012年第3期52-57,共6页
对SpaceWire CODEC进行容错设计是提高其可靠性的重要途径.分析SpaceWire协议的容错性能,介绍SpaceWire CODEC的容错设计方法,通过故障汇入和仿真验证了容错设计的有效性.
关键词 SPACEWIRE codec 容错设计 Hsiao编码 状态机 空时三模冗余
在线阅读 下载PDF
对新型宽带语音编解码器AMR-WB的研究 被引量:2
7
作者 钱国荣 李治柱 《计算机工程与应用》 CSCD 北大核心 2003年第28期194-196,共3页
文章介绍了一种应用于第三代移动通讯的新型语音编解码器,该编解码器的语音带宽拓展为50Hz到7000Hz,编码后语音的自然度很高,用在3G移动通讯系统的多媒体服务、宽带包交换网络、音频和视频会议等等。在简单介绍该语音编解码器的产生背景... 文章介绍了一种应用于第三代移动通讯的新型语音编解码器,该编解码器的语音带宽拓展为50Hz到7000Hz,编码后语音的自然度很高,用在3G移动通讯系统的多媒体服务、宽带包交换网络、音频和视频会议等等。在简单介绍该语音编解码器的产生背景后,着重介绍了该语音编解码器组成和特点。 展开更多
关键词 语音编码 ACELP VAD
在线阅读 下载PDF
新型宽带语音编解码器AMR-WB的语音端点检测(VAD)研究
8
作者 刘江 吴亚栋 《计算机工程》 CAS CSCD 北大核心 2003年第z1期120-122,共3页
AMR-WB是一种应用于3G上的一种新型宽带语音编解码器,该编解码器将语音带宽拓展到7kHz,采样频率为16kHz,编码后的语音在自然度、音乐方面有较大的改善,将在3G移动通信系统、ISDN上的高保真电话、数字无线广播等各个方面有广泛的应用.文... AMR-WB是一种应用于3G上的一种新型宽带语音编解码器,该编解码器将语音带宽拓展到7kHz,采样频率为16kHz,编码后的语音在自然度、音乐方面有较大的改善,将在3G移动通信系统、ISDN上的高保真电话、数字无线广播等各个方面有广泛的应用.文章着重介绍该语音编解码器中有关语音端点检测(VAD)算法,并给出了测试结果. 展开更多
关键词 语音编码 amr-wb 语音端点检测
在线阅读 下载PDF
欧胜推出全新高性能、低功耗CODEC系列
9
《半导体技术》 CAS CSCD 北大核心 2009年第11期1156-1156,共1页
欧胜微电子有限公司宣布推出一个全新的、创新型的低功耗编码解码器(CODEC)系列,旨在增强音频性能和延长各种便携式电池寿命。
关键词 音频性能 codec系列 低功耗 编码解码器 电池寿命 微电子 创新型 便携式
在线阅读 下载PDF
欧胜提供业内超低功耗CODEC
10
《半导体技术》 CAS CSCD 北大核心 2009年第7期721-721,共1页
2009年6月22日,欧胜微电子宣布推出型号为WM8961的超低功耗立体声编码解码器(CODEC),它是其新一代超低功耗器件系列的第二款产品,为极大延长便携设备音频回放时间而设计。WM8961以欧胜开创性的WM8903编码解码器为基础,在芯片中集... 2009年6月22日,欧胜微电子宣布推出型号为WM8961的超低功耗立体声编码解码器(CODEC),它是其新一代超低功耗器件系列的第二款产品,为极大延长便携设备音频回放时间而设计。WM8961以欧胜开创性的WM8903编码解码器为基础,在芯片中集成了同样的创新技术以及一个附加的内置高功率D类立体声扬声器驱动器。这项提升扩展了欧胜业界领先的超低功耗音频技术在要求高性能扬声器驱动器功能中的应用,其市场包括移动互联网设备(MID)、手持游戏机和便携媒体播放器(PMP)。 展开更多
关键词 超低功耗 codec 立体声扬声器 编码解码器 音频技术 媒体播放器 便携设备 创新技术
在线阅读 下载PDF
基于色彩感知的通用高保真光谱图像压缩
11
作者 梁玮 蔡磊 +2 位作者 郝雯 金海燕 侯煜 《光谱学与光谱分析》 北大核心 2025年第7期2008-2016,共9页
针对光谱图像在特定再现环境下的色彩高保真复制等领域的应用,为增加通用性,提升压缩效率,进一步存储传输,本文提出了特定光照中基于视觉感知特性的通用低复杂度色彩高保真光谱图像压缩方法。首先研究特定再现环境中光谱图像的色彩再现... 针对光谱图像在特定再现环境下的色彩高保真复制等领域的应用,为增加通用性,提升压缩效率,进一步存储传输,本文提出了特定光照中基于视觉感知特性的通用低复杂度色彩高保真光谱图像压缩方法。首先研究特定再现环境中光谱图像的色彩再现原理,设计重建光谱图像色彩误差衡量方式,进而提出特定光照中光谱图像色彩保真压缩的失真指导准则。基于色彩失真指导准则,得出压缩原理,进而设计光谱预处理、空谱去冗余方法、编码方法和优化策略,最终提出可供高保真再现的光谱图像压缩方法。在失真指导准则方面,首先构建了光谱图像的色彩分解环境,提出了对光谱图像在特定照明下(单一或者混合照明)进行色彩感知信息提取的矩阵算子;然后,利用色彩感知信息提取算子,采用色彩感知误差衡量光谱图像于色彩测度上的偏差;最后,提出用于指导压缩环节的光谱图像色彩感知失真准则。基于该准则提出针对性压缩原理,设计了本文压缩算法流程。首先,对光谱数据色彩感知加权预处理,采用色彩感知信息提取算子,获得特定再现条件下保持光谱特性的光谱色彩感知数据;然后,基于色彩感知压缩原理,对色彩感知光谱数据进行APWS-RA编码,命名为W_(S)F-APWS-RA。光谱图像解码分为两个阶段。首先,对压缩码流进行编码的逆处理,形成重建的光谱色彩感知数据矩阵;然后,采用设计的可逆色彩感知提取算子,通过感知信息提取矩阵算子的逆矩阵与重建光谱色彩感知数据矩阵相乘获得重构光谱图像。实验表明,在相同比特率下,较低复杂度压缩APWS,APWS-RA及色彩再现类WF-APWS-RA,W_(S)F-APWS-RA编码不但能够更加有效地保留特定再现条件下的光谱色彩信息,具有最优秀的变光照色彩再现稳定性,同时可有效提升光谱重建精度。因此,新方法亦可泛化用于遥感等领域,具有重要实用价值。 展开更多
关键词 可见光谱 光谱图像压缩 色彩高保真再现 色彩感知信息提取 小波编解码
在线阅读 下载PDF
浮选泡沫低照度图像颜色深度编解码校正及多尺度增强
12
作者 孙磊 唐倩 +3 位作者 廖一鹏 廖玉华 董则希 何建军 《光学精密工程》 北大核心 2025年第10期1609-1626,共18页
浮选现场环境恶劣、光照条件复杂多变,针对现场采集的浮选图像易出现曝光不足、颜色失真等问题,提出了一种低照度图像颜色深度编解码校正及多尺度增强方法。首先,将低照度图像从RGB转换至HSV空间,针对明度(V)分量,采用非下采样剪切波变... 浮选现场环境恶劣、光照条件复杂多变,针对现场采集的浮选图像易出现曝光不足、颜色失真等问题,提出了一种低照度图像颜色深度编解码校正及多尺度增强方法。首先,将低照度图像从RGB转换至HSV空间,针对明度(V)分量,采用非下采样剪切波变换(NSST)进行多尺度分解;其次,提出基于全局空间模块的色彩编解码网络,通过挤压提取、色彩编码、色彩解码、颜色校正构建颜色深度编解码校正网络模型,对色度(H)、饱和度(S)分量进行颜色校正;然后,采用自适应模糊集增强V分量的低频子带图像,利用尺度相关系数有效滤除V分量中各高频子带的噪声成分,同时使用非线性增益函数对高频边缘系数进行显著增强处理;最后,对增强后的V分量各子带图像作NSST反变换重构,并将重构后的V分量与校正后的H分量、S分量融合转换回RGB空间。通过实验验证,与当前的主流方法相比,本文方法CIEDE平均降低14.8358,PSNR平均提高8.48 dB,结构相似度平均提高31.32%,连续边缘像素比保持在91%以上。本文方法显著改善了图像的亮度,提升了对比度、清晰度和信息熵,使图像颜色更接近真实色彩,保留了更多纹理细节,并在有效抑制噪声的同时,实现了边缘增强。 展开更多
关键词 浮选泡沫 低照度图像 颜色校正 颜色深度编解码网络 多尺度增强与去噪 非下采样剪切波变换 模糊集
在线阅读 下载PDF
VALL-E R:利用单调对齐策略的鲁棒且高效零样本语音合成 被引量:1
13
作者 韩冰 钱彦旻 《信号处理》 北大核心 2025年第9期1537-1546,共10页
借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错... 借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错误、遗漏和重复等鲁棒性问题。为了解决上述问题,我们提出了VALL-E R,一个鲁棒且高效的零样本TTS系统,并以VALL-E为基础进行构建。具体而言,我们引入了一种音素单调对齐策略,通过约束声学标记与其对应的音素严格匹配,增强了音素与声学序列之间的映射关系,从而确保更精确的对齐。此外,我们采用编解码器合并的方法,在浅层量化层对离散码进行降采样,以减少解码计算量,同时保持语音输出的高质量。受益于这些策略,VALL-E R在音素可控性方面取得了显著提升,并通过逼近真实语音的词错误率展现了卓越的鲁棒性。此外,该系统仅需较少的自回归推理步骤,推理时间降低超过60%,极大提升了推理效率。 展开更多
关键词 零样本语音合成 单调对齐 合并编码 鲁棒性 高效性
在线阅读 下载PDF
舰载显控图像信息共享方法设计与实现
14
作者 龙小军 童文滔 李立夏 《舰船科学技术》 北大核心 2025年第15期121-128,共8页
为解决传统舰载视频信号不能双向流动、占用网络带宽高、控制繁琐、可扩展性不强等弱点,提出一种基于IP图像信息共享方法。在源端,首先对不同的视频接口信号进行归一化处理,然后对其进行H.264/H.265编码,再对其进行RTSP流封装,最后将其... 为解决传统舰载视频信号不能双向流动、占用网络带宽高、控制繁琐、可扩展性不强等弱点,提出一种基于IP图像信息共享方法。在源端,首先对不同的视频接口信号进行归一化处理,然后对其进行H.264/H.265编码,再对其进行RTSP流封装,最后将其推送到共享网络;在终端,首先对RTSP视频流进行解封,然后对其进行H.264/H.265解码,最后对其进行叠加显示。结果表明,此方法提出的图像信息共享架构,具有信号双向流动、网络带宽可调节、控制简单以及很强的可扩展性等特点,同时该方法可简化视频系统的硬件配置,提升数据传输效率,缩短系统传输延时,提高指控系统作战效能。 展开更多
关键词 舰载视频 图像共享 视频编解码 超高清视频 低延时
在线阅读 下载PDF
基于梅尔谱与压缩激励加权量化的语音神经编解码方法
15
作者 周俊佐 易江燕 +2 位作者 陶建华 任勇 汪涛 《计算机研究与发展》 北大核心 2025年第11期2725-2736,共12页
目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法... 目前,以SoundStream等为代表的端到端语音神经编解码器在重建语音感知质量方面展现了优异性能.然而,这些方法需要大量的卷积计算,从而导致较长的编码时间.为缓解上述问题,提出基于梅尔谱和压缩激励加权量化的神经语音编解码方法.该方法旨在保持较高语音感知质量的同时降低计算代价,加快运行速度,从而减少时延.具体而言,采用梅尔谱特征作为输入,借助梅尔谱提取过程中时域压缩的性质,并结合低层卷积编码器以简化运算过程.此外,借鉴压缩激励网络思想,提取了编码器最后一层输出特征各维度的激励权重,将其作为量化器中计算码本距离时压缩特征各维度的权重系数,由此学习特征间的相关性并优化量化性能.在LibriTTS和VCTK数据集上的实验结果表明,该方法显著提升了编码器计算速度,且能在较低比特率时(≤3 Kbps)提升重建语音质量.以比特率1.5 Kbps时为例,编码计算实时率(real-time factor,RTF)最多可提升4.6倍.对于感知质量,以0.75 Kbps为例,短时客观可懂度(shorttime objective intelligibility,STOI)、虚拟语音质量客观评估(virtual speech quality objective listener,VISQOL)等客观指标相较基线平均可提升8.72%.此外,消融实验不仅表明压缩激励权重方法的优化效果与比特率呈反相关,而且发现Relu激活函数相较周期性质激活函数Snake而言,在语音感知质量相当的情况下,能大量加快运行速度. 展开更多
关键词 语音编解码 梅尔谱图 压缩激励网络 残差矢量量化 生成对抗网络
在线阅读 下载PDF
深度联合编解码器融合知识图谱的语义通信性能优化
16
作者 赖雪冰 李旋 +1 位作者 王辩铮 申滨 《南京邮电大学学报(自然科学版)》 北大核心 2025年第4期60-69,共10页
语义通信模型通常采用传统信源信道编解码方案,在低信噪比环境下,文本传输易受噪声影响而导致失真。因此,设计了一种深度联合语义信道编解码器融合知识图谱的语义模型KG-DeepSC,实现文本传输性能优化。该模型在发送端引入冗余三元组过... 语义通信模型通常采用传统信源信道编解码方案,在低信噪比环境下,文本传输易受噪声影响而导致失真。因此,设计了一种深度联合语义信道编解码器融合知识图谱的语义模型KG-DeepSC,实现文本传输性能优化。该模型在发送端引入冗余三元组过滤模块对知识图谱进行预处理,然后经过基于Transformer的联合编解码器,将三元组作为基本符号传输至接收端,并恢复为自然文本。所设计的编解码器通过学习推理三元组之间的关联,基于其所具有的自注意力机制捕捉并传输三元组语义特征,增强了对抗物理信道噪声的能力,并节约了传输开销。另外,引入基于Flan-T5模型的微调实现自然文本恢复任务,并结合数据增强方法进一步提升模型泛化能力。计算机仿真实验证明,在低信噪比条件下,与传统的Huffman-RS语义编码方法和联合编解码器独立架构DeepSC相比,所提出的KG-DeepSC语义相似度性能分别实现了至少30%和10%的提升,能够更为有效地传输语义知识。 展开更多
关键词 语义通信 知识图谱 文本传输 联合编解码
在线阅读 下载PDF
基于残差膨胀卷积与门控编解码网络的语音增强
17
作者 李珂 王雅静 +1 位作者 昝志辉 齐瑞洁 《电子测量与仪器学报》 北大核心 2025年第4期74-83,共10页
语音信号的时序依赖性特征和上下文信息在语音增强任务中至关重要,针对编解码网络对其捕获不充分导致增强效果差的问题,构建了一种非对称的残差膨胀卷积与门控编解码网络(RD-EGN),该网络包含编码器、中间层和解码器3部分。编码器设计了... 语音信号的时序依赖性特征和上下文信息在语音增强任务中至关重要,针对编解码网络对其捕获不充分导致增强效果差的问题,构建了一种非对称的残差膨胀卷积与门控编解码网络(RD-EGN),该网络包含编码器、中间层和解码器3部分。编码器设计了一种因果卷积层结构,以时序特征建模,捕获语音序列中不同层的特征,并保持语音信号的因果性;中间层设计了残差膨胀卷积网络(RDCN),融合膨胀卷积、残差连接和级联的扩张块使网络拥有更高的感受野,以跨层的方式传递信息并提取语音长时依赖性特征,在此基础上将RDCN与长短时记忆网络相结合,捕获更广泛的上下文信息;解码器引入门控机制,动态调整信息流的门控程度,获得更丰富的全局特征并重建增强语音。分别在TIMIT、UrbanSound8k、VoiceBank及NOISE92数据集上进行消融及性能对照,实验结果表明,RD-EGN相较于卷积循环网络(CRN)、自编码器卷积神经网络(AECNN)、膨胀-密集自动编码器(DDAEC)等具有较少的训练参数和较高的SSNR得分、主观评价指标(CSIG,CBAK和COVL)得分,并且在客观评价指标方面,语音质量客观评价指标(PESQ)提高了2.5%~7.1%,短时客观可懂度(STOI)提高了1%~5.3%,具有较为突出的增强性能与泛化能力。 展开更多
关键词 语音增强 深度学习 编解码网络 膨胀卷积 门控机制
在线阅读 下载PDF
融合Mobile Vit和倒置门控编解码的视网膜血管分割算法 被引量:1
18
作者 梁礼明 阳渊 +2 位作者 朱晨锟 何安军 吴健 《北京航空航天大学学报》 北大核心 2025年第3期712-723,共12页
针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域... 针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域维度减少图像特征信息缺失,精确分割血管前景像素;提出特征自适应融合模块,建立血管纹理上下文依赖关系,提高血管分割灵敏度;优化编解码结构,设计倒置门控编解码模块,进一步捕获空间信息与深层语义信息,提高视网膜血管图像分割精度。在公共数据集DRIVE、STARE和CHASE_DB1上对所提算法进行实验,特异性分别为0.9863、0.9897和0.9873,准确度分别为0.9709、0.9754和0.9760,敏感度分别为0.8109、0.8010和0.8079。仿真实验证明,所提网络对视网膜血管分割具有较好的分割效果,为眼科疾病的诊断提供了新窗口。 展开更多
关键词 视网膜血管 Mobile Vit模块 离散余弦变换 倒置门控编解码模块 特征自适应融合
在线阅读 下载PDF
一种钢轨表面缺陷检测网络PS-Unet
19
作者 许建军 胡祥涛 +2 位作者 张勇乐 李子怡 湛红晖 《合肥工业大学学报(自然科学版)》 北大核心 2025年第9期1192-1200,1217,共10页
文章提出一种基于Unet网络的缺陷分割模型PS-Unet,该模型在Unet网络结构基础上,设计金字塔池化模块(pyramid pooling module,PPM)和尺度感知模块(scale-aware module,SAM),并将其嵌入深层特征提取层中,用于提升模型的性能;针对缺陷和背... 文章提出一种基于Unet网络的缺陷分割模型PS-Unet,该模型在Unet网络结构基础上,设计金字塔池化模块(pyramid pooling module,PPM)和尺度感知模块(scale-aware module,SAM),并将其嵌入深层特征提取层中,用于提升模型的性能;针对缺陷和背景像素比例失衡导致的模型精度降低问题,提出一种改进的损失函数,使训练过程聚焦在不易识别的缺陷上,加快模型收敛。实验证明,该文提出的PS-Unet网络显著改善了检测性能,相较Unet检测网络,平均交并比(mean intersection over union,mIOU)、平均像素精度(mean pixel accuracy,mPA)、精确率P在高速轨道缺陷数据集上分别提高2.06%、4.98%、3.18%,在普通/重型运输轨道缺陷数据集上分别提高4.79%、4.35%、6.28%。 展开更多
关键词 钢轨缺陷 编解码 金字塔池化 尺度感知
在线阅读 下载PDF
基于改进ViT的网络流量分类方法
20
作者 李道全 高洁 +1 位作者 聂若琳 胡一帆 《计算机工程与设计》 北大核心 2025年第2期431-437,共7页
目前网络流量分类方法中存在模型结构复杂、特征提取不足等问题,提出一种基于稀疏注意力的改进ViT(SA-ViT)网络流量分类模型。去除数据集中无关字段并转化为灰度图,划分为块序列输入编码器提取特征;引入Longformer稀疏注意力对Self-atte... 目前网络流量分类方法中存在模型结构复杂、特征提取不足等问题,提出一种基于稀疏注意力的改进ViT(SA-ViT)网络流量分类模型。去除数据集中无关字段并转化为灰度图,划分为块序列输入编码器提取特征;引入Longformer稀疏注意力对Self-attention进行优化,使其具有更高的局部与全局特征表达能力;通过对比图像相似度实现流量分类。通过网络公开数据集进行检测,其结果表明,所提算法在分类准确率、精确率以及F1分数等方面有较大提升,验证了该模型的科学性与可行性。 展开更多
关键词 流量分类 Vision Transformer(ViT) 稀疏注意力 Longformer 编解码器 样本不均衡 灰度图
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部