拼音到汉字自动转换技术的改进与实现被引量：4

Implementation and Improvement on Automatic Conversion Technology of Pinyin into Chinese Characters

在线阅读下载PDF

导出

摘要拼音到汉字转换一直是中文信息处理研究的一个重要方面。在前人的基础上改进了他们所使用的数据平滑算法,给出了两种应用于不同场合的公式,使得在结果中能够得到不同要求的解。同时,给出了利用隐马尔可夫模型(HMM)来设计实现这样一种转换,并且利用Viterbi算法来对模型进行求解的设计细节与方法。最后利用随意选择的语料库来对计算机进行训练学习并给出了测试结果,同时分析了错误结果的原因。 The conversion of Pinyin into Chinese characters is an important aspect of Chinese mtormation processing. This paper gives improvement on cache-based natural language algorithms on the basis of predecessors, with two formulas applied to two different occasions to meet different requirements. Also it shows how to achieve such a conversion by using hidden Markov model （HMM） and Viterbi algorithm is used to solve the model. This article gives a detailed way about the design. At the end we randomly choose the corpus to train on the computer and give test results with the analysis of the wrong reasons.

作者刘佳韩秀玲

机构地区东华大学

出处《科学技术与工程》 2007年第24期6348-6352,共5页 Science Technology and Engineering

关键词拼音汉字转换隐马尔可夫模型 VITERBI 语料库学习数据平滑 conversion of Pinyin into Chinese characters hidden Markov models viterbi corpus study data cache

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

作者简介刘佳（1983-），男，研究生，研究方向：智能算法。

引文网络
相关文献

参考文献5

1马少平,夏莹,朱小燕,刘建民,刘健.基于词词同现概率的拼音汉字自动转换方法[J].电子计算机与外部设备,1997,21(3):16-19. 被引量：4
2朱巧明,倪明逸.基于统计的智能输入技术分析[J].苏州大学学报（自然科学版）,2001,17(2):43-47. 被引量：4
3周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25
4[4]HiddenMarkovModels.http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html
5[5]Kuhn R,De Mori Renato.A cache-based natural language model for speech recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,1990;12 (6),570-583

二级参考文献4

1夏莹,马少平,常新功,朱小燕,金奕江.基于统计的汉字识别文本自动后处理方法[J].模式识别与人工智能,1996,9(2):172-178. 被引量：14
2马少平,夏莹,朱小燕,刘建民,刘健.基于词词同现概率的拼音汉字自动转换方法[J].电子计算机与外部设备,1997,21(3):16-19. 被引量：4
3章森,宗成庆,陈肇雄,黄河燕.语句拼音-汉字转换的智能处理机制分析[J].中文信息学报,1998,12(2):37-43. 被引量：13
4梁南元.汉语计算机自动分词知识[J].中文信息学报,1990,4(2):29-41. 被引量：30

共引文献30

1曹娟,周经野.一种计算汉字串之间相关程度的新方法[J].中文信息学报,2004,18(4):55-59. 被引量：6
2陆勇,侯汉清.用于信息检索的同义词自动识别及其进展[J].南京农业大学学报（社会科学版）,2004,4(3):87-93. 被引量：25
3张仰森,曹元大.基于语料库的自然语言建模方法研究[J].计算机科学,2004,31(5):176-179. 被引量：1
4俞士汶,段慧明,朱学锋.汉语词的概率语法属性描述[J].语言文字应用,2001(3):21-26. 被引量：6
5周新栋,王挺.基于N元语言模型的文本分类方法[J].计算机应用,2005,25(1):11-13. 被引量：11
6詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
7顾平,朱巧明,李培峰,钱培德.智能型汉字数码输入技术的研究[J].中文信息学报,2006,20(4):100-105. 被引量：7
8王东海,赵伟,陈洁,梁贺.基于隐Markov模型汉语词性自动标注的若干分析与改进[J].长春工业大学学报,2007,28(1):48-52. 被引量：2
9郑洪静,韩卓平.统计语言模型的手机数码中文输入法研究[J].苏州市职业大学学报,2008,19(2):96-99.
10夏莹,张金岭.适合个人通信产品使用的智能型数字输入技术[J].现代电信科技,1998(11):39-41. 被引量：1

同被引文献14

1孙宏凯,王彦勋.中文数据排序与快速检索方法研究[J].微计算机信息,2007,23(3):255-257. 被引量：7
2顾平,朱巧明,李培峰,钱培德.智能型汉字数码输入技术的研究[J].中文信息学报,2006,20(4):100-105. 被引量：7
3中国社会科学院语言研究所词典编辑室.新华字典[M].11版.北京:商务印书馆,2011.
4Ken Arnold, James Gosling, David Holmes. Java程序设计语言[M].4版.陈吴鹏,译.北京:人民邮电出版社,2006.
5911汉字拼音查询网站[EB/OL].[2013-07-18].http://pinyin.911cha.com.
6中国社会科学院语言研究所词典编辑室.现代汉语词典[M].6版.北京:商务印书馆,2011.
7李江华,赵国辉.Java中文编码问题研究[J].软件导刊,2009,8(3):49-50. 被引量：1
8刘焕焕,陆锋,赵云山.一种适合Java环境的中文快速排序和模糊检索方法[J].电脑知识与技术,2009,5(3):1664-1666. 被引量：3
9姚刚,高勇.利用SQL SERVER实现拼音简码自动转换汉字[J].漯河职业技术学院学报,2010,9(2):9-10. 被引量：1
10程晓锦,徐秀花.应用程序开发中的乱码问题[J].北京印刷学院学报,2011,19(4):60-62. 被引量：4

引证文献4

1姚刚,高勇.利用SQL SERVER实现拼音简码自动转换汉字[J].漯河职业技术学院学报,2010,9(2):9-10. 被引量：1
2乔治强.在sql中实现获取汉字拼音简码[J].电脑开发与应用,2011,24(11):29-30. 被引量：2
3何明昕,炊向军,李家禹,陈宗彝.繁简体汉字按拼音与混合字符按字典序排序[J].计算机工程与设计,2014,35(6):2009-2012. 被引量：1
4陈令刚.SQL Server中获取多音字拼音首字母[J].电脑知识与技术,2018,14(3Z):5-6.

二级引证文献3

1何明昕,炊向军,李家禹,陈宗彝.繁简体汉字按拼音与混合字符按字典序排序[J].计算机工程与设计,2014,35(6):2009-2012. 被引量：1
2陈令刚.SQL Server中获取多音字拼音首字母[J].电脑知识与技术,2018,14(3Z):5-6.
3纵怀志,艾吉昆,张军辉,江磊,谭树杰,刘余贤,苏琦,徐兵.基于拓扑优化和晶格填充的四足机器人肢腿单元轻量化设计[J].机械工程学报,2024,60(4):420-429. 被引量：1

1郑叶清,刘功申.基于概率潜在语义分析优化拼音汉字转换[J].信息技术,2016,40(11):33-37. 被引量：1
2刘觉滨.中文信息处理研究的一项历史使命[J].中文信息,1992(2):25-27.
3张力.点阵汉字转换成矢量汉字的笔迹定向跟踪法[J].计算机辅助设计与图形学学报,1990,2(1):31-33.
4马少平,夏莹,朱小燕,刘建民,刘健.基于词词同现概率的拼音汉字自动转换方法[J].电子计算机与外部设备,1997,21(3):16-19. 被引量：4
5唐春生,金以慧.基于代理机制的Internet信息自动提取[J].计算机工程与应用,2001,37(10):38-41. 被引量：5
6吴庆祥.APPLE机与中华机的汉字程序自动转换技术[J].中华学习机,1990(5):15-16.
7曹兰英,严义,邬惠峰.基于模式匹配的XML自动转换技术[J].计算机工程与应用,2012,48(25):72-76. 被引量：6
8彭小平,颜清.Word中基于VBA的实验数据自动转换技术[J].计算机与现代化,2006(4):7-8. 被引量：2
9姜韶华,党延忠.基于长度递减与串频统计的文本切分算法[J].情报学报,2006,25(1):74-79. 被引量：14
10如何看待火星文？[J].读写月报（初中版）,2010(12):15-15.

科学技术与工程

2007年第24期

浏览历史

内容加载中请稍等...

拼音到汉字自动转换技术的改进与实现被引量：4

参考文献5

二级参考文献4

共引文献30

同被引文献14

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

拼音到汉字自动转换技术的改进与实现 被引量：4

参考文献5

二级参考文献4

共引文献30

同被引文献14

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

拼音到汉字自动转换技术的改进与实现被引量：4