期刊文献+

基于字符层马尔科夫模型的多语种识别 被引量:5

Multiple Language Identification Based on Character-level Markov Models
在线阅读 下载PDF
导出
摘要 语种识别是机器翻译等多语种语言处理任务的必要预处理过程。但双字节编码语种的识别,如中文、日文等,尚未被充分研究和试验。本文采用 Markov 语言模型,提出并测试了一种有效的基于 EM 的训练算法。同时,给出了性能分析和与其他算法的比较。 Language identification is a necessary pre-process in machine translation and other muhi-language applications, but no experiments hase yet been reported on double-byte encoded languages, such as Chinese and Japanese. An efficient EM based training algorithm on Markov language model is proposed and evaluated. The performance analysis and comparison with other algorithms are also presented.
出处 《计算机科学》 CSCD 北大核心 2006年第1期226-228,235,共4页 Computer Science
基金 受国家自然科学基金(编号60272088)资助。
关键词 字符层马尔科夫模型 语种识别 机器翻译 多语种 马尔科夫模型 识别 字符 MARKOV 训练算法 预处理过程 Character based markov models, Language identification, Machine translation
作者简介 冯冲 博士研究生,主要研究方向为统计方法的多语种信息抽取和机器翻译。 黄河燕 研究员,主要研究方向为机器翻译。 陈肇雄 研究员,主要研究方向为机器翻译。 张亮 博士研究生,主要研究方向为自动问答系统。
  • 相关文献

参考文献7

  • 1Cavnar W B,Trenkle J M. N gram based text categorization. In 1994 Symposium on Document Analysis and Information Retrieval in Las Vegas , 1994.
  • 2Ted D. Statistical Identification of Language : [Technical report CRL MC12-94 273]. Computing Research Lab, New Mexico State University, 1994.
  • 3Jelinek F, Mercer R L. Interpolated estimation of Markov source parameters from sparse data. In: Proc. of the Workshop on Pattern Recognition in Practice, Amsterdam, The Netherlands:North Holland, 1980.
  • 4Dempster A, Laird N,Rubin D. Maximum-likelihood from Ineomplele Data via the EM algorithm. J. Royal Statist. Soe. Ser.B. 1977(39) : 278-286.
  • 5黄河燕,陈肇雄.基于多策略的交互式智能辅助翻译平台总体设计[J].计算机研究与发展,2004,41(7):1266-1272. 被引量:12
  • 6Goodman J T. A Bit of Progress in Language Modeling Extended Version : [Technical Report MSR-TR-2001-72]. Microsoft Research, Redmond, July 2004.
  • 7Chelba C. Exploiting Syntactic Structure for Natural Language Modeling:[Phd Thesis]. Johns Hopkins University, 2004.

二级参考文献2

共引文献11

同被引文献58

引证文献5

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部