期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于颜色及纹理特征的果蔬种类识别方法 被引量:52
1
作者 陶华伟 赵力 +2 位作者 奚吉 虞玲 王彤 《农业工程学报》 EI CAS CSCD 北大核心 2014年第16期305-311,共7页
为更好地表述果蔬图像纹理特征,提高智能果蔬识别系统识别准确性,提出一种颜色完全局部二值模式纹理特征提取算法。果蔬识别系统模型利用颜色完全局部二值模式提取图像纹理特征,利用HSV颜色直方图、外点/内点颜色直方图提取图像颜色特征... 为更好地表述果蔬图像纹理特征,提高智能果蔬识别系统识别准确性,提出一种颜色完全局部二值模式纹理特征提取算法。果蔬识别系统模型利用颜色完全局部二值模式提取图像纹理特征,利用HSV颜色直方图、外点/内点颜色直方图提取图像颜色特征,采用匹配得分融合算法将颜色和纹理特征相融合,采用最近邻分类器实现果蔬农产品分类。通过不同光照条件下和不同数量训练样本条件下的试验得出:颜色完全局部二值模式的果蔬图像纹理表述能力明显优于和差直方图等果蔬图像纹理操作子,识别率提升最小在5%以上,更适合果蔬分类;对比其他纹理特征提取算法,采用颜色完全局部二值模式与颜色特征进行融合时,识别率最优,时间开销约为1.1 s。该方法能够应用到智能果蔬识别系统中,提升系统识别准确性。 展开更多
关键词 农产品 图像处理 特征识别 颜色特征 纹理特征 融合 果蔬
在线阅读 下载PDF
面向语音情感识别的语谱图特征提取算法 被引量:17
2
作者 陶华伟 査诚 +3 位作者 梁瑞宇 张昕然 赵力 王青云 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期817-821,共5页
为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征... 为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征;最后,将不同尺度、不同方向Gabor图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别.柏林库(EMO-DB)及FAU Ai Bo库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%.因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音. 展开更多
关键词 情感识别 语谱图 图像纹理特征 局部二值模式
在线阅读 下载PDF
面向语音情感识别的Gabor分块局部二值模式特征 被引量:5
3
作者 陶华伟 柳晶晶 +3 位作者 梁瑞宇 查诚 张昕然 赵力 《信号处理》 CSCD 北大核心 2016年第5期505-511,共7页
谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;... 谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;然后,采用多尺度,多方向的Gabor小波对对数能量谱进行处理,得到Gabor谱图;再次,对每张Gabor谱图进行分块,采用局部二值模式提取每个块的局部能量分布信息;最后,将提取到的所有特征级联,得到GBLBP特征。EMO-DB库及中文语音库上的实验结果表明:GBLBP特征的平均加权召回率比MFCC高了9%~10%,识别性能显著优于众多谱特征,且与现有声学特征有较好的融合性。 展开更多
关键词 GABOR小波 局部二值模式 语音情感识别 谱特征
在线阅读 下载PDF
梯度直方图和光流特征融合的视频图像异常行为检测算法 被引量:18
4
作者 柳晶晶 陶华伟 +2 位作者 罗琳 赵力 邹采荣 《信号处理》 CSCD 北大核心 2016年第1期1-7,共7页
异常行为检测在智能监控系统领域中有广泛的应用前景。本文针对此应用领域,提出了一种结合光流特征和梯度直方图特征的视频异常行为检测及定位方法。首先利用视频背景提取算法进行前景提取和标注,实现对前景信息的分割。然后利用光流和... 异常行为检测在智能监控系统领域中有广泛的应用前景。本文针对此应用领域,提出了一种结合光流特征和梯度直方图特征的视频异常行为检测及定位方法。首先利用视频背景提取算法进行前景提取和标注,实现对前景信息的分割。然后利用光流和梯度直方图特征提取算法对前景图像分别提取光流和梯度直方图特征,其次,使用支持向量机对数据进行训练和测试。最后结合光流幅度信息与前景标记信息对判断出来的异常行为进行定位。实验结果表明,与先前算法相比,本文算法可以检测出异常行为,并且能够对异常帧进行异常行为定位。 展开更多
关键词 异常行为检测 光流 梯度直方图 支持向量机
在线阅读 下载PDF
MIMO-OFDM系统中基于压缩感知的信道参数反馈方法 被引量:2
5
作者 傅洪亮 张贝贝 +1 位作者 陶华伟 李明瑞 《计算机应用研究》 CSCD 北大核心 2012年第5期1870-1872,1876,共4页
为了解决MIMO-OFDM系统中基于完全信道状态信息预编码所面临的反馈链路开销大的问题,提出将压缩感知技术应用于这种预编码的信道状态信息的反馈阶段。在接收端通过压缩感知技术对由信道估计得出的信道状态信息进行观测,将少量的观测值... 为了解决MIMO-OFDM系统中基于完全信道状态信息预编码所面临的反馈链路开销大的问题,提出将压缩感知技术应用于这种预编码的信道状态信息的反馈阶段。在接收端通过压缩感知技术对由信道估计得出的信道状态信息进行观测,将少量的观测值反馈到发送端,在发送端通过正交匹配追踪算法重构出完全信道状态信息。仿真结果表明,信道状态信息在KLT域的压缩感知性能明显优于DCT域的压缩感知性能,可以由反馈到发送端的少量采样值精确地重构出信道状态信息,降低了反馈链路的开销。 展开更多
关键词 多输入多输出正交频分复用 预编码 压缩感知 信道参数反馈 Karhunen-Loève变换 离散余弦变换 正交匹配追踪
在线阅读 下载PDF
听觉注意模型的语谱图语音情感识别方法 被引量:1
6
作者 张昕然 查诚 +2 位作者 宋鹏 陶华伟 赵力 《信号处理》 CSCD 北大核心 2016年第9期1117-1125,共9页
在语音情感识别技术中,由于噪声环境、说话方式和说话人特质原因,造成特征向量空间分布不匹配的情况。从语音学上分析,该问题多存在于跨数据库情感识别实验。训练的声学模型和用于测试的语句样本之间的错位,会使语音情感识别性能剧烈下... 在语音情感识别技术中,由于噪声环境、说话方式和说话人特质原因,造成特征向量空间分布不匹配的情况。从语音学上分析,该问题多存在于跨数据库情感识别实验。训练的声学模型和用于测试的语句样本之间的错位,会使语音情感识别性能剧烈下降。语谱图的特征能从图像的角度对现有情感特征进行有效的补充。本文据此所研究的听觉选择性注意模型,模拟人耳听觉特性,能有效探测语谱图上变化的情感特征。同时,利用时频原子对模型进行改进,取得频率特性信号匹配的优势,从时域上提取情感信息。选择注意机制使模型能提取跨语音数据库中的显著性特征,提高语音情感识别系统的情感辨识能力。实验结果表明,利用文章所提方法在跨库情感样本上进行特征提取,再通过典型的分类器,识别性能提高了约9个百分点,从而验证了该方法对不同数据库具有更好的鲁棒性。 展开更多
关键词 语音情感识别 跨数据库 语谱图特征 听觉注意机制 时频原子
在线阅读 下载PDF
基于两步噪声学习网络的波束域毫米波大规模MIMO信道估计
7
作者 杨静 王朋朋 陶华伟 《电讯技术》 北大核心 2023年第3期390-395,共6页
针对波束域毫米波大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统,构建了一种新型两步噪声学习网络(Two-step Noise Learning Network,TNLNet)。基本原理是在接收信号反复经过卷积层和池化层提取噪声特征的基础上,利用... 针对波束域毫米波大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统,构建了一种新型两步噪声学习网络(Two-step Noise Learning Network,TNLNet)。基本原理是在接收信号反复经过卷积层和池化层提取噪声特征的基础上,利用波束域毫米波大规模MIMO信道矩阵稀疏性所引起的相邻元素相近的特点,采用下采样将信道矩阵重构成4个子矩阵,提高训练测试效率。该算法具有以比全卷积去噪近似消息传递(Fully Convolutional Denoising Approximate Message Passing,FCDAMP)算法和学习去噪的近似消息传递(Learned Denoising-based Approximate Message Passing,LDAMP)算法更低的复杂度,取得了比最小二乘算法、最小均方误差算法、FCDAMP和LDAMP更优的归一化均方误差(Normalized Mean Squared Error,NMSE)性能;与快速灵活去噪卷积神经网络(Fast and Flexible Denoising convolutional neural Network,FFDNet)相比虽然复杂度略高,但具有更优的NMSE性能,且在单一训练模型中获得了比FFDNet更宽的信噪比适用范围,增强了实用性。 展开更多
关键词 毫米波大规模MIMO 波束域信道估计 两步噪声学习网络(TNLNet)
在线阅读 下载PDF
基于决策边界优化域自适应的跨库语音情感识别 被引量:8
8
作者 汪洋 傅洪亮 +3 位作者 陶华伟 杨静 谢跃 赵力 《计算机应用》 CSCD 北大核心 2023年第2期374-379,共6页
域自适应算法被广泛应用于跨库语音情感识别中;然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(DBODA... 域自适应算法被广泛应用于跨库语音情感识别中;然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(DBODA)的跨库语音情感识别方法。首先利用卷积神经网络进行特征处理,随后将特征送入最大化核范数及均值差异(MNMD)模块,在减小域间差异的同时,最大化目标域情感预测概率矩阵的核范数,从而提升目标域样本的鉴别性并优化决策边界。在以Berlin、eNTERFACE和CASIA语音库为基准库设立的六组跨库实验中,所提方法的平均识别精度领先于其他算法1.68~11.01个百分点,说明所提模型有效降低了决策边界的样本密度,提升了预测的准确性。 展开更多
关键词 跨库语音情感识别 卷积神经网络 决策边界优化 域自适应 特征分布差异
在线阅读 下载PDF
基于动态卷积递归神经网络的语音情感识别 被引量:11
9
作者 耿磊 傅洪亮 +3 位作者 陶华伟 卢远 郭歆莹 赵力 《计算机工程》 CAS CSCD 北大核心 2023年第4期125-130,137,共7页
动态情感特征是说话人独立语音情感识别中的重要特征。由于缺乏对语音中时频信息的充分挖掘,现有动态情感特征表征能力有限。为更好地提取语音中的动态情感特征,提出一种动态卷积递归神经网络语音情感识别模型。基于动态卷积理论构建一... 动态情感特征是说话人独立语音情感识别中的重要特征。由于缺乏对语音中时频信息的充分挖掘,现有动态情感特征表征能力有限。为更好地提取语音中的动态情感特征,提出一种动态卷积递归神经网络语音情感识别模型。基于动态卷积理论构建一种动态卷积神经网络提取语谱图中的全局动态情感信息,使用注意力机制分别从时间和频率维度对特征图关键情感区域进行强化表示,同时利用双向长短期记忆网络对谱图进行逐帧学习,提取动态帧级特征及情感的时序依赖关系。在此基础上,利用最大密度散度损失对齐新个体特征与训练集特征分布,降低个体差异性对特征分布产生的影响,提升模型表征能力。实验结果表明,该模型在CASIA中文情感语料库、Emo-db德文情感语料库及IEMOCAP英文情感语料库上分别取得59.50%、88.01%及66.90%的加权平均精度,相较HuWSF、CB-SER、RNN-Att等其他主流模型识别精度分别提升1.25~16.00、0.71~2.26及2.16~8.10个百分点,验证了所提模型的有效性。 展开更多
关键词 语音情感识别 特征提取 动态特征 注意力机制 神经网络
在线阅读 下载PDF
基于深度自编码器子域自适应的跨库语音情感识别 被引量:6
10
作者 庄志豪 傅洪亮 +3 位作者 陶华伟 杨静 谢跃 赵力 《计算机应用研究》 CSCD 北大核心 2021年第11期3279-3282,3348,共5页
针对不同语料库之间数据分布差异问题,提出一种基于深度自编码器子域自适应的跨库语音情感识别算法。首先,该算法采用两个深度自编码器分别获取源域和目标域表征性强的低维情感特征;然后,利用基于LMMD(local maximum mean discrepancy)... 针对不同语料库之间数据分布差异问题,提出一种基于深度自编码器子域自适应的跨库语音情感识别算法。首先,该算法采用两个深度自编码器分别获取源域和目标域表征性强的低维情感特征;然后,利用基于LMMD(local maximum mean discrepancy)的子域自适应模块,实现源域和目标域在不同低维情感类别空间中的特征分布对齐;最后,使用带标签的源域数据进行有监督地训练该模型。在eNTERFACE库为源域、Berlin库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了5.26%~19.73%;在Berlin库为源域、eNTERFACE库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了7.34%~8.18%。因此,所提方法可以有效地提取不同语料库的共有情感特征并提升了跨库语音情感识别的性能。 展开更多
关键词 跨库语音情感识别 深度自编码器 子域自适应 监督学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部