期刊文献+
共找到102篇文章
< 1 2 6 >
每页显示 20 50 100
空间听觉与虚拟听觉空间的计算机仿真 被引量:7
1
作者 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 1995年第4期143-151,共9页
一些科学工作者对人类以及动物听觉的自由声场至耳膜的传递函数进行了测量,他们发现在宽带信号激励的情况下,不同频率分量之间的幅度差异是与声源的方向有关的,这一发现已被用于展现“真实”的三维听觉,称作虚拟听觉空间仿真。
关键词 空间听觉 声源 虚拟听觉空间 听觉 计算机仿真
在线阅读 下载PDF
合理使用MMX技术进行多媒体数据处理 被引量:1
2
作者 吴镇扬 任永川 张子瑜 《电声技术》 北大核心 1999年第12期34-38,共5页
详细说明了MMX指令的使用以及MMX代码的优化方法,并利用这些方法给出了一个实用的FIR滤波实现例程。
关键词 MMX 多媒体 数据处理 计算机应用
在线阅读 下载PDF
HRIR的空间特征抽取与特征分析
3
作者 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 1996年第6期7-13,共7页
在自由声场中,抵达听者耳膜处的声音信号是随着声源的方向而变化的。由方向所决定的冲激响应被称作与头相关联的冲激响应。利用Karhunen-Loeve变换对归一化的HRIR作特征抽取。其主分量的特征与先前的许多心理物理实... 在自由声场中,抵达听者耳膜处的声音信号是随着声源的方向而变化的。由方向所决定的冲激响应被称作与头相关联的冲激响应。利用Karhunen-Loeve变换对归一化的HRIR作特征抽取。其主分量的特征与先前的许多心理物理实验结果十分吻合。 展开更多
关键词 听觉模拟 特征抽取 声场 HRIR 耳膜 声音信号
在线阅读 下载PDF
HRIR的空间特征抽取与特征分析
4
作者 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 1996年第S1期9-15,共7页
在自由声场中,抵达听者耳膜处的声音信号是随着声源的方向而变化的.由方向所决定的冲激响应被称作与头相关联的冲激响应(HRIR).利用Karhunen-Loeve变换对归一化的HRIR作特征抽取.其主分量的特征与先前的许... 在自由声场中,抵达听者耳膜处的声音信号是随着声源的方向而变化的.由方向所决定的冲激响应被称作与头相关联的冲激响应(HRIR).利用Karhunen-Loeve变换对归一化的HRIR作特征抽取.其主分量的特征与先前的许多心理物理实验结果十分吻合. 展开更多
关键词 听觉模拟 特征抽取 主分量分析
在线阅读 下载PDF
虚拟听觉空间中运动声源的模拟
5
作者 吴镇扬 翁涛 《电声技术》 北大核心 2000年第6期7-9,共3页
文中提出一种在虚拟听觉空间中加入多普勒效应以提高模拟运动物体效果的方法。该方法通过对原始声源运动轨迹的分析,对声源信号进行多普勒调频,并根据耳间时间差对双耳信号进行调相。最后利用连续球面空间上的HRIR对双耳信号进行滤波... 文中提出一种在虚拟听觉空间中加入多普勒效应以提高模拟运动物体效果的方法。该方法通过对原始声源运动轨迹的分析,对声源信号进行多普勒调频,并根据耳间时间差对双耳信号进行调相。最后利用连续球面空间上的HRIR对双耳信号进行滤波处理。经过验证,该方法处理后的声源信号运动感觉强烈。它为实现虚拟听觉空间提供了一种有益的新方法。 展开更多
关键词 虚拟听觉空间 多普勒效应 运动声源模拟
在线阅读 下载PDF
语音信号中的情感特征分析和识别的研究 被引量:28
6
作者 赵力 钱向民 +1 位作者 邹采荣 吴镇扬 《通信学报》 EI CSCD 北大核心 2000年第10期18-24,共7页
本文分析了含有欢快、愤怒、惊奇、悲伤等 4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较 ,总结了不同情感语音信号的情感特征的分布规律。根据这些分析 ,提取了 9个情感特征... 本文分析了含有欢快、愤怒、惊奇、悲伤等 4种情感语音信号的时间构造、振幅构造、基频构造和共振峰构造的特征。通过和不带情感的平静语音信号的比较 ,总结了不同情感语音信号的情感特征的分布规律。根据这些分析 ,提取了 9个情感特征进行了情感识别的实验 ,获得了基本上接近于人的正常表现的识别结果。 展开更多
关键词 语音信号 情感特征分析 情感识别 语音识别
在线阅读 下载PDF
语音信号中的情感特征分析和识别的研究 被引量:49
7
作者 赵力 将春辉 +1 位作者 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2004年第4期606-609,共4页
提出了一种利用全局和时序结构的组合特征以及MMD进行情感特征识别的方法.对于从10名话者中 搜集的带有欢快,愤怒,惊奇和悲伤4种情感的1000句语句,利用提出的新的识别方法获得了94%的平均情感识别 率.
关键词 语音信号 情感特征分析 MMD 情感识别
在线阅读 下载PDF
一种基于KL变换的椭圆模型肤色检测方法 被引量:15
8
作者 高建坡 王煜坚 +1 位作者 杨浩 吴镇扬 《电子与信息学报》 EI CSCD 北大核心 2007年第7期1739-1743,共5页
肤色检测是计算机视觉中的一个重要问题,该文提出了一种新的基于KL变换的椭圆模型肤色检测方法。算法首先对训练肤色样本进行了分布均匀化处理,然后以KL变换为基本工具最终得到了肤色分布区域的椭圆边界方程。方法简单直观。实践表明,... 肤色检测是计算机视觉中的一个重要问题,该文提出了一种新的基于KL变换的椭圆模型肤色检测方法。算法首先对训练肤色样本进行了分布均匀化处理,然后以KL变换为基本工具最终得到了肤色分布区域的椭圆边界方程。方法简单直观。实践表明,该算法能完成对各种不同环境条件下所拍摄图像的肤色分割,效果理想,其性能明显优于常用的域值界定法和单高斯模型法。 展开更多
关键词 人脸检测 肤色模型 肤色分割 KL变换 GAUSS模型
在线阅读 下载PDF
基于视觉特性和颜色空间的多尺度彩色图像增强算法 被引量:20
9
作者 黄凯奇 王桥 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2004年第4期673-676,共4页
本文根据人眼视觉对亮度和颜色不同的敏感特性,按照视觉特性选择了CIE La*b*均匀彩色空间,在此空间中提出了一种基于小波变换的彩色图像增强算法.和目前存在的灰度图像增强算法相比,本文不仅给出了一种自适应动态范围调节算法,同时对图... 本文根据人眼视觉对亮度和颜色不同的敏感特性,按照视觉特性选择了CIE La*b*均匀彩色空间,在此空间中提出了一种基于小波变换的彩色图像增强算法.和目前存在的灰度图像增强算法相比,本文不仅给出了一种自适应动态范围调节算法,同时对图像的饱和度分量也进行处理.实验证明,增强后的彩色图像不仅更加清晰,同时更加生动,鲜艳,达到了预期的目的. 展开更多
关键词 彩色图像 小波 视觉特性 彩色空间
在线阅读 下载PDF
稀疏表示的超像素在线跟踪 被引量:5
10
作者 程旭 李拟珺 +2 位作者 周同驰 周琳 吴镇扬 《电子与信息学报》 EI CSCD 北大核心 2014年第10期2393-2399,共7页
目标表观变化的处理是视觉跟踪领域极具挑战性的问题,该文针对这一问题,在粒子滤波框架下提出一种高效的基于超像素的L1跟踪方法(SuperPixel-L1 tracker,SPL1)。首先利用具有结构性信息的中层视觉线索(超像素)构造字典来对目标的表观建... 目标表观变化的处理是视觉跟踪领域极具挑战性的问题,该文针对这一问题,在粒子滤波框架下提出一种高效的基于超像素的L1跟踪方法(SuperPixel-L1 tracker,SPL1)。首先利用具有结构性信息的中层视觉线索(超像素)构造字典来对目标的表观建模;然后求解由粒子表示的候选目标状态的L1范数最小化,把重构误差最小的候选状态作为跟踪的结果;最后进一步改进了字典的在线更新策略,不论目标发生遮挡与否,字典都被学习更新;为了降低目标发生漂移的可能,更新时保留初始帧的信息。仿真结果验证了SPL1在目标发生长时间遮挡、尺度和光照变化时依然能够稳定地跟踪目标。 展开更多
关键词 视觉跟踪 在线学习 表观变化 稀疏表示 超像素
在线阅读 下载PDF
色彩恒常性在彩色图像增强中的应用 被引量:10
11
作者 黄凯奇 吴镇扬 王桥 《应用科学学报》 CAS CSCD 2004年第3期322-326,共5页
将Retinex算法应用于彩色图像增强中,在分析MSRCR算法构成的基础上,针对灰度假设(GW)带来的问题作出了改进.改进的算法基于图像自身的直方图,对参数进行自适应的选取.实验结果表明,改进后的算法使彩色图像在演色性(Rendering)方面有了... 将Retinex算法应用于彩色图像增强中,在分析MSRCR算法构成的基础上,针对灰度假设(GW)带来的问题作出了改进.改进的算法基于图像自身的直方图,对参数进行自适应的选取.实验结果表明,改进后的算法使彩色图像在演色性(Rendering)方面有了较大的提高,更符合人眼视觉系统的感知特性. 展开更多
关键词 色彩恒定性 图像增强 彩色图像 灰度假设 RETINEX理论 多尺度彩色复原算法
在线阅读 下载PDF
基于多特征融合和分层反向传播增强算法的人体动作识别 被引量:6
12
作者 李拟珺 程旭 +1 位作者 郭海燕 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期493-498,共6页
为了推广神经网络在人体动作识别中的应用,设计了一种基于分层识别框架和增强算法的动作识别系统,该系统融合了光流直方图、有向梯度直方图、Hu的矩特征、分块剪影和自相似矩阵等多种特征.为了与反向传播网络的增强相匹配,将传统的二分... 为了推广神经网络在人体动作识别中的应用,设计了一种基于分层识别框架和增强算法的动作识别系统,该系统融合了光流直方图、有向梯度直方图、Hu的矩特征、分块剪影和自相似矩阵等多种特征.为了与反向传播网络的增强相匹配,将传统的二分类增强算法扩展到多分类版本.此外,系统采用了包含预判决和后判决的分层识别框架,前者通过分析运动显著区域的位置,把动作粗分为几个子类,后者则利用额外的特征进一步提高识别准确率.基于Weizmann和KTH数据库的实验结果表明:神经网络相对于常用的支持向量机具有明显的优越性;结合分层识别的反向传播增强算法可以极大减少运算代价与动作类间的混淆,识别准确率较高. 展开更多
关键词 特征提取 动作识别 反向传播增强算法 神经网络 分层识别
在线阅读 下载PDF
基于压缩感知的麦克风阵列声源定位算法 被引量:13
13
作者 赵小燕 周琳 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期203-207,共5页
为了提高麦克风阵列在高混响、低信噪比环境中的定位性能,提出了一种基于压缩感知的声源定位算法.该算法将声源定位问题转化为稀疏信号的重构问题,将不同位置的房间冲激响应作为特征以构建字典.首先,将麦克风接收信号转换至频域,从具有... 为了提高麦克风阵列在高混响、低信噪比环境中的定位性能,提出了一种基于压缩感知的声源定位算法.该算法将声源定位问题转化为稀疏信号的重构问题,将不同位置的房间冲激响应作为特征以构建字典.首先,将麦克风接收信号转换至频域,从具有较高能量的频点中求得一组扩展的频域声源信号矢量,该矢量中包含了声源的位置信息.然后,在频域中整合这些扩展的声源信号矢量,使声源的位置信息更突出,矢量中最大元素所对应的空间位置即为声源的位置估计.仿真实验结果表明,与相位变换加权的可控响应功率(SRP-PHAT)定位算法相比,所提算法的定位成功率更高,对混响的鲁棒性更强,更适合高混响低信噪比环境中的声源位置估计. 展开更多
关键词 麦克风阵列 声源定位 压缩感知
在线阅读 下载PDF
基于直方图插值的均值移动小尺寸目标跟踪算法 被引量:5
14
作者 陈建军 安国成 +1 位作者 张索非 吴镇扬 《电子与信息学报》 EI CSCD 北大核心 2010年第9期2119-2125,共7页
小尺寸目标跟踪是视觉跟踪中的难题。该文首先指出了均值移动小尺寸目标跟踪算法中的两个主要问题:算法跟踪中断和丢失跟踪目标。然后,论文给出了相应的解决方法。对传统Parzen窗密度估计法加以改进,并用于对候选目标区域的直方图进行... 小尺寸目标跟踪是视觉跟踪中的难题。该文首先指出了均值移动小尺寸目标跟踪算法中的两个主要问题:算法跟踪中断和丢失跟踪目标。然后,论文给出了相应的解决方法。对传统Parzen窗密度估计法加以改进,并用于对候选目标区域的直方图进行插值处理,较好地解决了算法跟踪中断问题。论文采用Kullback-Leibler距离作为目标模型和候选目标之间的新型相似性度量函数,并推导了其相应的权值和新位置计算公式,提高了算法的跟踪精度。多段视频序列的跟踪实验表明,该文提出的算法可以有效地跟踪小尺寸目标,能够成功跟踪只有6×12个像素的小目标,跟踪精度也有一定提高。 展开更多
关键词 小尺寸目标跟踪 均值移动 直方图插值 PARZEN窗 相似性度量
在线阅读 下载PDF
一种基于超像素的局部判别式跟踪算法 被引量:3
15
作者 程旭 郭海燕 +3 位作者 李拟珺 周同驰 周琳 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第6期1105-1110,共6页
针对目标在复杂环境下容易受到外界干扰而发生漂移的问题,提出了一种基于超像素的局部判别式跟踪方法.首先,对视频序列前10帧的目标区域进行分割,得到超像素,并利用kmeans方法对其进行聚类以构造初始字典;其次,通过训练样本集来训练线... 针对目标在复杂环境下容易受到外界干扰而发生漂移的问题,提出了一种基于超像素的局部判别式跟踪方法.首先,对视频序列前10帧的目标区域进行分割,得到超像素,并利用kmeans方法对其进行聚类以构造初始字典;其次,通过训练样本集来训练线性分类器;然后,为了减少目标发生漂移的可能性,将初始训练的分类器与更新后的分类器线性加权之和定义为似然函数;最后,在粒子滤波的框架下,将似然函数值最大的粒子作为跟踪的结果,每运行U帧更新一次字典和分类器参数,以捕获目标表观的变化.仿真结果表明,所提算法在目标发生遮挡、光照变化的复杂环境下仍然能够跟踪目标. 展开更多
关键词 视频监控 稀疏表示 目标跟踪 表观更新 超像素
在线阅读 下载PDF
一种改进的无损压缩数字音频编码器 被引量:5
16
作者 胡学龙 江新炼 +1 位作者 周琳 吴镇扬 《微电子学与计算机》 CSCD 北大核心 2003年第7期23-25,共3页
文章介绍了无损压缩在音频信号处理中的应用和一种实用的无损压缩编码器的相关技术如分帧、预测和熵编码。同时,为了有效地提高数据压缩比,提出了对AudioPak编码器改进的一些方法,并对改进后的结果作出了评估。
关键词 无损压缩 数字音频编码器 音频信号处理 熵编码 数据压缩比 信源编码
在线阅读 下载PDF
一种基于实例的文本图像超分辨率重建算法 被引量:5
17
作者 杨浩 安国成 +1 位作者 陈向东 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第2期191-194,共4页
为了从一幅包含文字、公式和图形等内容的低分辨率文本图像重建高分辨率图像,提出了一种获取重建图像先验知识的新方法.利用实例图像和图像降质模型建立图像库,图像重建时,将低分辨率观测图像分成若干子块,每个子块分别从图像库中找到... 为了从一幅包含文字、公式和图形等内容的低分辨率文本图像重建高分辨率图像,提出了一种获取重建图像先验知识的新方法.利用实例图像和图像降质模型建立图像库,图像重建时,将低分辨率观测图像分成若干子块,每个子块分别从图像库中找到一块最佳匹配的高分辨率实例图像块,将这些实例图像块依次拼成一幅大图,并把该大图各点的灰度值作为重建图像各点灰度值的均值,以此先验知识采用最大后验概率(MAP)准则估计出高分辨率文本图像.实验结果表明本文的方法能够取得较好的重建效果. 展开更多
关键词 图像超分辨率 基于实例 图像库
在线阅读 下载PDF
基于Hough变换的任意时频分布线条特征提取 被引量:3
18
作者 张子瑜 吴镇扬 +1 位作者 李想 任永川 《电子学报》 EI CAS CSCD 北大核心 2001年第4期433-435,共3页
时频分布将时 (空 )域信号变换到时频联合域 ,揭示出信号的非平稳性、瞬时频率以及频率随时 (空 )间的变化演进 ,这其中往往主要含有线条成分 ,现有的分析方法只能探测直线成分 (即线性调频参数 ) ,并且只是分析Wigner分布 .本文进行两... 时频分布将时 (空 )域信号变换到时频联合域 ,揭示出信号的非平稳性、瞬时频率以及频率随时 (空 )间的变化演进 ,这其中往往主要含有线条成分 ,现有的分析方法只能探测直线成分 (即线性调频参数 ) ,并且只是分析Wigner分布 .本文进行两方面的推广 ,一方面将Hough变换探测各种参数曲线 ,可以对任意时频模式的信号进行检测 ;另一方面推广到任意时频分布 ,试验结果表明本文方法对于低信噪比的信号 ,检测可靠性更高 ,尤其对于自适应时频分布 ,效果更为满意 . 展开更多
关键词 时频分布 HOUGH变换 分数傅里叶变换 Rodon-Winger变换 FRFT 信号处理
在线阅读 下载PDF
基于偏最小二乘回归的与头相关传递函数的个人化 被引量:4
19
作者 胡红梅 周琳 +1 位作者 马浩 吴镇扬 《电子与信息学报》 EI CSCD 北大核心 2008年第1期154-158,共5页
该文提出了一种基于偏最小二乘回归(Partial Least Squares Regression,PLSR)的与头相关传递函数(Head Related Transfer Function,HRTF)的个人化方法。通过对HRTF进行预处理和主元分析,并对人体参数进行筛选,只要相对简单的人体参数测... 该文提出了一种基于偏最小二乘回归(Partial Least Squares Regression,PLSR)的与头相关传递函数(Head Related Transfer Function,HRTF)的个人化方法。通过对HRTF进行预处理和主元分析,并对人体参数进行筛选,只要相对简单的人体参数测量,就可利用PLSR得到特定人的HRTF。客观误差分析和主观声音定位测试结果表明估计的HRTF与实际测量的HRTF之间不仅均方误差较小,而且感知区别不大;同时由PLSR估计的个人化HRTF在水平面上的主观测试定位准确率明显优于非个人化HRTF,也优于由最小二乘回归(Least Squares Regression,LSR)估计的个人化HRTF。 展开更多
关键词 偏最小二乘回归 最小二乘回归 与头相关传递函数 声音定位测试
在线阅读 下载PDF
基于3维空间Viterbi算法的汉语连续语音识别方法 被引量:5
20
作者 赵力 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页
本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位... 本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . 展开更多
关键词 汉语连续语音识别 三维空间 VITERBI算法
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部