本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统...本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。展开更多
将语种和说话人识别的方法应用到英语发音错误检测系统,提出一种基于广义线性区分序列支持向量机(Generalized linear dis-criminant sequence based SVM,GLDS-SVM)的发音错误检测方法.主要创新点为:1)提出一种基于状态拼接的特征规整方...将语种和说话人识别的方法应用到英语发音错误检测系统,提出一种基于广义线性区分序列支持向量机(Generalized linear dis-criminant sequence based SVM,GLDS-SVM)的发音错误检测方法.主要创新点为:1)提出一种基于状态拼接的特征规整方案,增强SVM对发音特征的建模能力;2)提出一种基于多模型融合的模型训练策略,该策略可以更加充分地利用训练数据,并在一定程度上解决了由于真实发音错误数据缺乏造成的正负样本不均衡的问题;3)将GLDS-SVM与基于通用背景模型GMM(Universal background modelsbased GMM,GMM-UBM)的方法进行融合,以进一步提高发音检错性能.GLDS-SVM和GMM-UBM的融合系统在仿真测试集和真实测试集上的等错误率(Equal error rate,EER)分别达到9.92%和16.35%.同时,GLDS-SVM在模型占用空间和运算速度方面均比传统径向基函数(Radial basic function,RBF)核方法具有明显优势.展开更多
文摘本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。