期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
噪声环境下应用于语音标注的端点检测算法研究 被引量:3
1
作者 俞景彦 赵晓群 《南京邮电大学学报(自然科学版)》 北大核心 2021年第1期25-33,共9页
端点检测是语音标注的重要前序技术,针对语音标注,设计了一种基于信噪比分类的自适应端点检测算法。该算法首先对标注语音的信噪比分布范围进行分析,将信噪比分类,在每类信噪比范围内选择对应较优的算法。在高信噪比范围选择子带谱熵法... 端点检测是语音标注的重要前序技术,针对语音标注,设计了一种基于信噪比分类的自适应端点检测算法。该算法首先对标注语音的信噪比分布范围进行分析,将信噪比分类,在每类信噪比范围内选择对应较优的算法。在高信噪比范围选择子带谱熵法,在中等信噪比范围内选择均匀子带频带方差法,而在低信噪比环境下先对带噪语音进行谱减法去噪处理,再采用基于均匀子带频带方差的端点检测算法。仿真实验表明,对语音标注采用的音频信号进行端点检测,该算法能达到较高的检测正确率,证明了算法的有效性。 展开更多
关键词 端点检测 信噪比分类 子带谱熵 子带频带方差 语音标注
在线阅读 下载PDF
汉语双模情感语音数据库标注及一致性检测 被引量:7
2
作者 景少玲 毛峡 +1 位作者 陈立江 张娜娜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2015年第10期1925-1934,共10页
对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数据库的特色制定了详细的标注规则和方法,由5名标注者按照制定... 对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数据库的特色制定了详细的标注规则和方法,由5名标注者按照制定的标注规则对情感语音数据库进行标注.其次,为了确保情感语音数据库的标注质量和测试标注规则的完整性,标注者在正式标注之前先进行了测试性标注,测试语音包含280条语音(7种情感×2名说话人×20条语音).最后,根据语音标注规则设计了相应的一致性检测算法.结果表明,在5 ms的时间误差范围内,5名标注者对相同语音标注的一致性平均可以达到60%以上,当误差范围增大至8 ms和10 ms时,一致性平均可提高5%和8%.实验说明5名标注者对语音的理解较一致,制定的标注规则比较完整,情感语音数据库的质量也较高. 展开更多
关键词 汉语 双模 情感语音数据库 语音标注 一致性检测
在线阅读 下载PDF
利用人类计算技术的语音语料库标注方法及其实现 被引量:2
3
作者 沈映泉 刘勇进 +1 位作者 蔡骏 史晓东 《智能系统学报》 2009年第3期270-277,共8页
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算... 提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注. 展开更多
关键词 语音语料库标注 人类计算 分布式知识获取 基于Web的语言学习
在线阅读 下载PDF
电视剧语音识别中的半监督自动语音分割算法 被引量:4
4
作者 龙艳花 茅红伟 叶宏 《数据采集与处理》 CSCD 北大核心 2019年第2期281-287,共7页
针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对... 针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧"神秘博士"数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分割后各语音段时间标签及其对应文本的准确性。 展开更多
关键词 语音识别 半监督 语音标注
在线阅读 下载PDF
基于分形维的连续语音实时分割技术 被引量:2
5
作者 阙大顺 李星星 胡慧玲 《电讯技术》 2008年第11期33-37,共5页
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音... 为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。 展开更多
关键词 语音识别 语音分割 积分-差分分形维 两级搜索实时分割 在线语音标注
在线阅读 下载PDF
Improved hidden Markov model for speech recognition and POS tagging 被引量:4
6
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第2期511-516,共6页
In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language proc... In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system. 展开更多
关键词 hidden Markov model Markov family model speech recognition part-of-speech tagging
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部