期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于小波变分辨率频谱特征的静音检测 被引量:2
1
作者 薛卫 都思丹 叶迎宪 《计算机工程》 CAS CSCD 北大核心 2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检... 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 变分辨率频谱 支持向量机
在线阅读 下载PDF
视频文字大小自适应提取算法 被引量:1
2
作者 薛卫 都思丹 吴书凯 《计算机应用研究》 CSCD 北大核心 2009年第3期1146-1147,1159,共3页
视频文字大小自适应提取算法基于离散傅里叶变换(discrete Fourier transform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT... 视频文字大小自适应提取算法基于离散傅里叶变换(discrete Fourier transform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT特征作进一步分类。结果表明,该算法能提取出视频图像中不同大小的文字,识别率优于以小波、灰度、离散余弦变换系数(discrete cosine transform,DCT)等为纹理特征的算法。 展开更多
关键词 文字检测 自适应 多分辨率 离散傅里叶变换 支持向量机
在线阅读 下载PDF
基于肤色信息与宽度优先搜索的AAM人脸特征定位算法 被引量:1
3
作者 薛卫 梁敬东 林金星 《计算机科学》 CSCD 北大核心 2011年第8期275-277,共3页
提出了一种结合肤色信息与宽度优先搜索的AAM(Active Appearcance Models)人脸检测算法。该算法充分利用彩色人脸图像中的肤色信息,建立肤色模型,结合形态学运算和宽度优先搜索算法,定位人脸重心,有效地缩小了搜索窗口。实验表明,和AAM... 提出了一种结合肤色信息与宽度优先搜索的AAM(Active Appearcance Models)人脸检测算法。该算法充分利用彩色人脸图像中的肤色信息,建立肤色模型,结合形态学运算和宽度优先搜索算法,定位人脸重心,有效地缩小了搜索窗口。实验表明,和AAM算法相比,该算法不仅检测率提高,而且速度提高60%以上。 展开更多
关键词 AAM 肤色模型 形态学运算 宽度优先搜索 人脸定位
在线阅读 下载PDF
小波变分辨率频谱特征静音检测和短时自适应混音算法 被引量:1
4
作者 薛卫 都思丹 叶迎宪 《计算机科学》 CSCD 北大核心 2009年第7期211-214,共4页
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重。测试表明,静... 静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重。测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729b静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 支持向量机 短时自适应权重
在线阅读 下载PDF
面向对象的H.264码率控制算法
5
作者 薛卫 都思丹 叶锡君 《计算机科学》 CSCD 北大核心 2010年第2期131-133,共3页
提出了H.264码率控制改进算法。首先,基于帧间运动估计残差(mean absolutely difference,MAD)的空间和时间相关性提出了"十字"MAD预测模型;为了平衡缓冲的占有率,在分配帧比特时将前一帧的比特使用情况作为当前帧比特分配时... 提出了H.264码率控制改进算法。首先,基于帧间运动估计残差(mean absolutely difference,MAD)的空间和时间相关性提出了"十字"MAD预测模型;为了平衡缓冲的占有率,在分配帧比特时将前一帧的比特使用情况作为当前帧比特分配时的惩罚因子;最后,结合视频文字对象提取技术实现了基于文字对象的宏块比特分配以及量化步长的计算。实验结果表明,改进算法能在准确控制码率的情况下,提高输出序列的峰值信噪比。 展开更多
关键词 H.264 码率控制 文字对象
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部