期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于分层语块分析的统计翻译研究 被引量:7
1
作者 魏玮 杜金华 徐波 《中文信息学报》 CSCD 北大核心 2007年第5期87-90,117,共5页
本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统... 本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。 展开更多
关键词 人工智能 机器翻译 基于分层语块分析的统计翻译模型 条件随机场 CKY算法
在线阅读 下载PDF
基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究 被引量:2
2
作者 关勇 李鹏 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第4期410-416,共7页
传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition,ASR)系统的鲁棒性问题.本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis,CASA)和语者模型信息的混合语音分离系统.该系统在CASA框架... 传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition,ASR)系统的鲁棒性问题.本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis,CASA)和语者模型信息的混合语音分离系统.该系统在CASA框架下,利用语者模型信息和因大子最大矢量量化(Factorial-max vector quantization,MAXVQ)方法进行实值掩码估计,实现了两语者混合语音中有效地分离出目标说话人语音的目标,从而为ASR系统提供了鲁棒的识别前端.在语音分离挑战(Speech separation challenge,SSC)数据集上的评估表明,相比基线系统,本文所提出的系统的语音识别正确率提高了15.68%,相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性. 展开更多
关键词 计算听觉场景分析 语音分离 鲁棒语音识别 因子最大矢量量化 语者识别
在线阅读 下载PDF
基于词汇评分的汉语作文自动评分 被引量:11
3
作者 彭星源 柯登峰 +2 位作者 赵知 陈振标 徐波 《中文信息学报》 CSCD 北大核心 2012年第2期102-108,共7页
该文研究了通过作文词汇评分来实现汉语作文自动评分的新算法。在作文评分应与词汇评分高度相关的假设基础上,实现了这种关系的量化计算。该文从通用词表方法、常规方法以及提出的三种改进算法上进行方法性能的比较,并对比了E-rater作... 该文研究了通过作文词汇评分来实现汉语作文自动评分的新算法。在作文评分应与词汇评分高度相关的假设基础上,实现了这种关系的量化计算。该文从通用词表方法、常规方法以及提出的三种改进算法上进行方法性能的比较,并对比了E-rater作文评分系统中同样采用基于词汇方法的性能。实验结果表明,基于新的词汇评分的作文评分方法相关度①接近0.7的水平,高于E-rater中采用的基于词汇的方法的相关度。同时,这一方法的结果已经接近于人工作文评分的相关度。 展开更多
关键词 词汇评分 作文自动评分
在线阅读 下载PDF
基于GMM-UBM和GLDS-SVM的英文发音错误检测方法 被引量:3
4
作者 李宏言 黄申 +2 位作者 王士进 梁家恩 徐波 《自动化学报》 EI CSCD 北大核心 2010年第2期332-336,共5页
将语种和说话人识别的方法应用到英语发音错误检测系统,提出一种基于广义线性区分序列支持向量机(Generalized linear dis-criminant sequence based SVM,GLDS-SVM)的发音错误检测方法.主要创新点为:1)提出一种基于状态拼接的特征规整方... 将语种和说话人识别的方法应用到英语发音错误检测系统,提出一种基于广义线性区分序列支持向量机(Generalized linear dis-criminant sequence based SVM,GLDS-SVM)的发音错误检测方法.主要创新点为:1)提出一种基于状态拼接的特征规整方案,增强SVM对发音特征的建模能力;2)提出一种基于多模型融合的模型训练策略,该策略可以更加充分地利用训练数据,并在一定程度上解决了由于真实发音错误数据缺乏造成的正负样本不均衡的问题;3)将GLDS-SVM与基于通用背景模型GMM(Universal background modelsbased GMM,GMM-UBM)的方法进行融合,以进一步提高发音检错性能.GLDS-SVM和GMM-UBM的融合系统在仿真测试集和真实测试集上的等错误率(Equal error rate,EER)分别达到9.92%和16.35%.同时,GLDS-SVM在模型占用空间和运算速度方面均比传统径向基函数(Radial basic function,RBF)核方法具有明显优势. 展开更多
关键词 计算机辅助语言学习 自动发音错误检测 支持向量机特征规整 多模型融合策略
在线阅读 下载PDF
基于混淆网络解码的机器翻译多系统融合 被引量:3
5
作者 杜金华 魏玮 徐波 《中文信息学报》 CSCD 北大核心 2008年第4期48-54,共7页
在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险... 在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险解码器选择一个风险最小的假设作为对齐参考;(2)将其余的-best假设结果与该参考对齐,从而构建混淆网络。多特征混淆网络基于对数线性模型,引入了更多有效的知识源参与最优路径选择,融合后的BLEU得分比融合前最好的单系统BLEU得分提高了2.19%。在对齐方法上,我们提出了一种改进的翻译错误率(Translation Error Rate,TER)准则——GIZA-TER准则,该准则可以对CN网络进行更有效的短语调序。实验中的显著性检验证明了本文方法的有效性。 展开更多
关键词 人工智能 机器翻译 多系统融合 最小贝叶斯风险解码 多特征混淆网络 GIZA—TER
在线阅读 下载PDF
一种基于互补声学模型的多系统融合语音关键词检测方法 被引量:3
6
作者 孟猛 王晓瑞 +1 位作者 梁家恩 徐波 《自动化学报》 EI CSCD 北大核心 2009年第1期39-45,共7页
采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统... 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,在等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升. 展开更多
关键词 关键词检测 高斯混合模型 神经网络
在线阅读 下载PDF
音乐噪声环境下的双声道语音活动检测 被引量:2
7
作者 廖逢钗 李鹏 徐波 《信号处理》 CSCD 北大核心 2009年第11期1820-1824,共5页
提出双声道的语音活动检测算法(DCVAD,Dual-Channel Voice Activity Detection)。该算法首先利用骨架互相关的方法估计目标语音和背景音乐的时延,然后在对目标语音进行时延补偿的基础上,利用通道间语音和背景音乐自身以及二者相互之间... 提出双声道的语音活动检测算法(DCVAD,Dual-Channel Voice Activity Detection)。该算法首先利用骨架互相关的方法估计目标语音和背景音乐的时延,然后在对目标语音进行时延补偿的基础上,利用通道间语音和背景音乐自身以及二者相互之间的相关性,实现了语音活动检测的目标。实验表明,在背景音乐环境DCVAD算法语音活动检测的平均正确率比单通道基于谱熵的方法高约22%。 展开更多
关键词 语音活动检测 时延估计 互相关 听觉滤波器
在线阅读 下载PDF
基于多模型融合的人名翻译系统 被引量:2
8
作者 庞薇 徐波 《中文信息学报》 CSCD 北大核心 2009年第1期44-49,共6页
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的... 该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。 展开更多
关键词 计算机应用 中文信息处理 多模型融合 音译 命名实体 加权有限状态转换器
在线阅读 下载PDF
基于多基音跟踪的单声道混合语音分离 被引量:1
9
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《计算机应用研究》 CSCD 北大核心 2008年第6期1660-1662,共3页
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信... 针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。 展开更多
关键词 计算听觉场景分析 多基音跟踪 语音分离
在线阅读 下载PDF
一种改进的单声道混合语音分离方法
10
作者 李鹏 关勇 +1 位作者 刘文举 徐波 《自动化学报》 EI CSCD 北大核心 2009年第8期1087-1093,共7页
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替... 在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上,针对该方法所采用的ITU-TP.563语音客观质量评估标准存在的使用限制以及计算量大的缺点,提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法,该方法在几乎不降低原方法分离性能的前提下,大大节约了算法运行所需的时间和资源消耗。 展开更多
关键词 语音分离 语音客观质量评估 计算听觉场景分析 信噪比 时域包络
在线阅读 下载PDF
一种快速说话人搜索算法
11
作者 朱磊 江杰 +1 位作者 郑榕 徐波 《中文信息学报》 CSCD 北大核心 2008年第2期60-63,共4页
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。... 随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。 展开更多
关键词 计算机应用 中文信息处理 说话人识别 说话人搜索 两遍搜索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部