-
题名分段语音时长规整算法
被引量:4
- 1
-
-
作者
黄昊
郭立
郑东飞
-
机构
中国科学技术大学电子科学与技术系
-
出处
《声学技术》
CSCD
北大核心
2007年第6期1191-1195,共5页
-
基金
安徽省自然科学基金(050420102)
-
文摘
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱变化快慢和能量大小将语音划分为感知敏感,非敏感和次敏感部分,对各部分采用不同压扩比进行同步叠加的分段时长规整算法,希望能够提高合成语音质量。实验证明该算法在压扩程度高、低采样率时对语音质量有显著改善。
-
关键词
语音处理
时长规整
同步叠加
梅尔倒谱系数
-
Keywords
speech signal processing
time-scale modification
SOLA
MFCC
-
分类号
TB556
[理学—声学]
-
-
题名一种快速实时语音个人特征改变方法
被引量:2
- 2
-
-
作者
毛启容
詹永照
杜守富
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2007年第2期434-438,共5页
-
基金
国家自然科学基金(60273040)
江苏省青蓝工程(1191170004)
江苏大学青年科学基金(1241170005)资助课题
-
文摘
为保护实时语音通信中的个人特征,该文提出了一种新的实时语音个人特征改变方法,该方法采用PLAR(PseudoLogAreaRatio)系数曲线变换方法和基于线性预测的基音同步叠加(LP-PSOLA)算法分别对语音信号的谱参数和韵律参数进行修改,从而实现语音信号个人特征的改变;此外,针对目前时长规整大多采用的同步叠加(SOLA)算法计算量大、不适合实时语音处理的缺点,采用课题组提出的一种新的基于同步叠加方法的时长规整算法——自适应同步叠加(ASOLA)算法,对个人特征改变后的语音信号进行时间上的弥补,保证语音处理的实时性。最后,利用该方法实现了实时语音的隐私保护。实验结果表明,该方法合成的语音质量高、实时性好。
-
关键词
语音改变
隐私保护
音高规整
时长规整
实时
-
Keywords
speech modification
Privacy protection
Pitch-scale
time-scale
Real-time
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于共振峰合成和韵律调整的语音验证码方法研究
被引量:4
- 3
-
-
作者
汪成亮
张玉维
-
机构
重庆大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第7期2458-2461,共4页
-
基金
国家自然科学基金资助项目(61004112)
中国博士后科学基金资助项目(20080430750)
-
文摘
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。
-
关键词
语音合成
验证码
共振峰合成
韵律调整
时长规整
-
Keywords
speech synthesis
CAPTCHA
formant synthesis
prosody adjustment
time scale modification
-
分类号
TN912.33
[电子电信—通信与信息系统]
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于感知敏感成分划分的语音时长规整算法
被引量:4
- 4
-
-
作者
黄昊
郭立
李琳
-
机构
中国科学技术大学电子科学与技术系
-
出处
《数据采集与处理》
CSCD
北大核心
2008年第6期740-745,共6页
-
基金
国家自然科学基金(60772031)资助项目
安徽省自然科学基金(050420102)资助项目
-
文摘
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。
-
关键词
语音处理
时长规整
同步叠加
瞬态成分
梅尔倒谱系数
-
Keywords
speech signal processing
time-scale modification
synchronous overlap and add (SOLA)
transient portion
Mel-frequency cepstral eoefficient (MFCC)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于重心的抗同步攻击的音频水印算法
被引量:1
- 5
-
-
作者
黄雄华
王宏霞
蒋伟贞
崔更申
-
机构
西南交通大学信息科学与技术学院
桂林电子科技大学广西可信软件重点实验室
暨南大学信息科学技术学院
-
出处
《自动化学报》
EI
CSCD
北大核心
2013年第8期1321-1329,共9页
-
文摘
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成的水印由混沌序列加密后以量化的方法嵌入载体音频三级小波近似分量均值中.为了降低同步攻击后同步位置的连续偏移,水印嵌入提取过程采用了均匀分帧的方法.实验结果表明提出的算法能抵抗常规信号处理操作,同时能抵抗20%的TSM操作(包含音调不变TSM和重采样操作)和1/10的抖动操作,有很好的鲁棒性.
-
关键词
音频水印
相对重心
tsm
均匀分帧
-
Keywords
Audio watermarking, normalized gravity of center, time scale modification (tsm), dividing frame evenly
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-
-
题名基于发音机制的贪婪自适应语音时长规整算法
- 6
-
-
作者
杨燕
雷颖思
岳辉
-
机构
兰州交通大学电子与信息工程学院
兰州交通大学铁道技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第8期212-217,共6页
-
基金
甘肃省科技厅自然科学基金资助项目(1310RJZA050)
甘肃省高等学校基本科研业务费专项基金资助项目(214138)
-
文摘
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规整因子,动态改变规整因子,进一步改进整体规整比例缺陷,从而设计贪婪自适应语音时长规整算法。在Matlab环境下对TIMIT语音库进行语音对比的结果表明,与波形相似同步叠加算法、时域基音同步叠加算法相比,该算法能提高合成语音的自然度,减小规整时长误差。
-
关键词
语音时长规整
规整因子
同步叠加算法
自适应算法
贪婪自适应算法
-
Keywords
speech time scale modification(tsm)
modification factor
Synchronized Overlap-add(SOLA) algorithm
adaptive algorithm
greedy adaptive algorithm
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名语音时长调整快速算法
被引量:1
- 7
-
-
作者
莫双燕
关海欣
郑可欣
-
机构
法源司法科学证据鉴定中心声像部
-
出处
《声学技术》
CSCD
2010年第5期507-511,共5页
-
基金
广西科学基金资助项目(0639028)
-
文摘
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性原则),在保证语音质量不降低的同时,大幅减少冗余的计算量,实验结果表明,该方法调整后的语音质量高、计算速度快,通过与原始算法的对比证明了以上结论,该方法能广泛应用于实际中,尤其是应用于实时性要求较高的场合。
-
关键词
语音
时长调整
快速算法
-
Keywords
speech
time-scale modification
fast algorithm
speed and quality
-
分类号
TN912.3
[电子电信—通信与信息系统]
-