期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于小波变分辨率频谱特征的静音检测
被引量:
2
1
作者
薛卫
都思丹
叶迎宪
《计算机工程》
CAS
CSCD
北大核心
2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检...
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。
展开更多
关键词
静音检测
小波
变分辨率频谱
支持向量机
在线阅读
下载PDF
职称材料
视频文字大小自适应提取算法
被引量:
1
2
作者
薛卫
都思丹
吴书凯
《计算机应用研究》
CSCD
北大核心
2009年第3期1146-1147,1159,共3页
视频文字大小自适应提取算法基于离散傅里叶变换(discrete Fourier transform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT...
视频文字大小自适应提取算法基于离散傅里叶变换(discrete Fourier transform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT特征作进一步分类。结果表明,该算法能提取出视频图像中不同大小的文字,识别率优于以小波、灰度、离散余弦变换系数(discrete cosine transform,DCT)等为纹理特征的算法。
展开更多
关键词
文字检测
自适应
多分辨率
离散傅里叶变换
支持向量机
在线阅读
下载PDF
职称材料
基于肤色信息与宽度优先搜索的AAM人脸特征定位算法
被引量:
1
3
作者
薛卫
梁敬东
林金星
《计算机科学》
CSCD
北大核心
2011年第8期275-277,共3页
提出了一种结合肤色信息与宽度优先搜索的AAM(Active Appearcance Models)人脸检测算法。该算法充分利用彩色人脸图像中的肤色信息,建立肤色模型,结合形态学运算和宽度优先搜索算法,定位人脸重心,有效地缩小了搜索窗口。实验表明,和AAM...
提出了一种结合肤色信息与宽度优先搜索的AAM(Active Appearcance Models)人脸检测算法。该算法充分利用彩色人脸图像中的肤色信息,建立肤色模型,结合形态学运算和宽度优先搜索算法,定位人脸重心,有效地缩小了搜索窗口。实验表明,和AAM算法相比,该算法不仅检测率提高,而且速度提高60%以上。
展开更多
关键词
AAM
肤色模型
形态学运算
宽度优先搜索
人脸定位
在线阅读
下载PDF
职称材料
小波变分辨率频谱特征静音检测和短时自适应混音算法
被引量:
1
4
作者
薛卫
都思丹
叶迎宪
《计算机科学》
CSCD
北大核心
2009年第7期211-214,共4页
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重。测试表明,静...
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重。测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729b静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729b静音检测算法的视频系统。
展开更多
关键词
静音检测
小波
支持向量机
短时自适应权重
在线阅读
下载PDF
职称材料
面向对象的H.264码率控制算法
5
作者
薛卫
都思丹
叶锡君
《计算机科学》
CSCD
北大核心
2010年第2期131-133,共3页
提出了H.264码率控制改进算法。首先,基于帧间运动估计残差(mean absolutely difference,MAD)的空间和时间相关性提出了"十字"MAD预测模型;为了平衡缓冲的占有率,在分配帧比特时将前一帧的比特使用情况作为当前帧比特分配时...
提出了H.264码率控制改进算法。首先,基于帧间运动估计残差(mean absolutely difference,MAD)的空间和时间相关性提出了"十字"MAD预测模型;为了平衡缓冲的占有率,在分配帧比特时将前一帧的比特使用情况作为当前帧比特分配时的惩罚因子;最后,结合视频文字对象提取技术实现了基于文字对象的宏块比特分配以及量化步长的计算。实验结果表明,改进算法能在准确控制码率的情况下,提高输出序列的峰值信噪比。
展开更多
关键词
H.264
码率控制
文字对象
在线阅读
下载PDF
职称材料
题名
基于小波变分辨率频谱特征的静音检测
被引量:
2
1
作者
薛卫
都思丹
叶迎宪
机构
南京农业大学计算机系
南京
大学
电子科学与工程
系
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第13期232-233,236,共3页
基金
国家自然科学基金资助项目(60472026)
南京农业大学青年教师基金资助项目
文摘
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。
关键词
静音检测
小波
变分辨率频谱
支持向量机
Keywords
Voice Activity Detection(VAD)
wavelet
multiresolution spectrum
Support Vector Machines(SVM)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
视频文字大小自适应提取算法
被引量:
1
2
作者
薛卫
都思丹
吴书凯
机构
南京农业大学计算机系
南京
大学
电子科学与工程
系
出处
《计算机应用研究》
CSCD
北大核心
2009年第3期1146-1147,1159,共3页
基金
国家自然科学基金资助项目(60472026)
南京农业大学青年教师基金资助项目
文摘
视频文字大小自适应提取算法基于离散傅里叶变换(discrete Fourier transform,DFT)特征、多分辨率处理及支持向量机分类技术。算法在不同分辨率下结合梯度信息、文字边界定位技术提取出文字候选区域,然后用支持向量机对于候选图像块DFT特征作进一步分类。结果表明,该算法能提取出视频图像中不同大小的文字,识别率优于以小波、灰度、离散余弦变换系数(discrete cosine transform,DCT)等为纹理特征的算法。
关键词
文字检测
自适应
多分辨率
离散傅里叶变换
支持向量机
Keywords
text detection
adaptive
multi-resolution
DFT
SVM
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于肤色信息与宽度优先搜索的AAM人脸特征定位算法
被引量:
1
3
作者
薛卫
梁敬东
林金星
机构
南京农业大学计算机系
南京
邮电
大学
自动化
系
出处
《计算机科学》
CSCD
北大核心
2011年第8期275-277,共3页
文摘
提出了一种结合肤色信息与宽度优先搜索的AAM(Active Appearcance Models)人脸检测算法。该算法充分利用彩色人脸图像中的肤色信息,建立肤色模型,结合形态学运算和宽度优先搜索算法,定位人脸重心,有效地缩小了搜索窗口。实验表明,和AAM算法相比,该算法不仅检测率提高,而且速度提高60%以上。
关键词
AAM
肤色模型
形态学运算
宽度优先搜索
人脸定位
Keywords
AAM
Skin model
Morphological operation
Breadth-first search
Face location
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
小波变分辨率频谱特征静音检测和短时自适应混音算法
被引量:
1
4
作者
薛卫
都思丹
叶迎宪
机构
南京农业大学计算机系
南京
大学
电子科学与工程
系
出处
《计算机科学》
CSCD
北大核心
2009年第7期211-214,共4页
基金
国家自然科学基金(60472026)资助
文摘
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重。测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729b静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729b静音检测算法的视频系统。
关键词
静音检测
小波
支持向量机
短时自适应权重
Keywords
Voice activity detection, Wavelet, SVM, Short-time adaptive weighted
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向对象的H.264码率控制算法
5
作者
薛卫
都思丹
叶锡君
机构
南京农业大学计算机系
南京
大学
电子科学与工程
系
出处
《计算机科学》
CSCD
北大核心
2010年第2期131-133,共3页
基金
国家自然科学基金(60472026)
南京农业大学青年科技创新基金(KJ09027)资助
文摘
提出了H.264码率控制改进算法。首先,基于帧间运动估计残差(mean absolutely difference,MAD)的空间和时间相关性提出了"十字"MAD预测模型;为了平衡缓冲的占有率,在分配帧比特时将前一帧的比特使用情况作为当前帧比特分配时的惩罚因子;最后,结合视频文字对象提取技术实现了基于文字对象的宏块比特分配以及量化步长的计算。实验结果表明,改进算法能在准确控制码率的情况下,提高输出序列的峰值信噪比。
关键词
H.264
码率控制
文字对象
Keywords
H. 264,Rate control,Text object
分类号
TN919.81 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于小波变分辨率频谱特征的静音检测
薛卫
都思丹
叶迎宪
《计算机工程》
CAS
CSCD
北大核心
2009
2
在线阅读
下载PDF
职称材料
2
视频文字大小自适应提取算法
薛卫
都思丹
吴书凯
《计算机应用研究》
CSCD
北大核心
2009
1
在线阅读
下载PDF
职称材料
3
基于肤色信息与宽度优先搜索的AAM人脸特征定位算法
薛卫
梁敬东
林金星
《计算机科学》
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
4
小波变分辨率频谱特征静音检测和短时自适应混音算法
薛卫
都思丹
叶迎宪
《计算机科学》
CSCD
北大核心
2009
1
在线阅读
下载PDF
职称材料
5
面向对象的H.264码率控制算法
薛卫
都思丹
叶锡君
《计算机科学》
CSCD
北大核心
2010
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部