-
题名基于中文拼音输入法数据的汉语方言词汇自动识别
被引量:1
- 1
-
-
作者
张燕
张扬
孙茂松
-
机构
清华大学计算机系
搜狗科技公司
-
出处
《中文信息学报》
CSCD
北大核心
2013年第5期22-28,共7页
-
基金
国家自然科学基金重点资助项目(61133012)
国家863计划资助项目(2012AA011102)
-
文摘
方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节。目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗时耗力。随着信息技术的发展,人们的交流广泛通过网络进行,而输入法数据包含海量的语料资源以及地域信息,可以帮助进行方言词汇语料的自动发现。然而,目前尚没有文献研究如何利用拼音输入法数据对方言词汇进行系统化分析,因此在本文中,我们探讨借助中文输入法的用户行为来自动发现各地域方言词汇的方法。特别的,我们归纳得到输入法数据中表征方言词汇的两类特征,并基于对特征的不同组合识别方言词汇。最后我们通过实验评价了两类特征的不同组合方法对方言词汇识别效果的影响。
-
关键词
方言词汇识别
中文拼音输入法
特征融合
-
Keywords
dialect detection
Chinese pinyin input method
feature combination
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Qtopia4的拼音输入法的实现
- 2
-
-
作者
王旭平
王汉功
陈小虎
-
机构
第二炮兵工程学院
-
出处
《兵工自动化》
2008年第5期91-93,共3页
-
文摘
立足于图形用户界面的中文输入环节进行相关的开发,采用Qtopia4.2.3自带的软键盘程序和开源的Murphypinyin软件包,在开发环境及拼音输入等方面经过适当的修改,完成拼音输入法的实现。
-
关键词
嵌入式
图形用户界面
QT/EMBEDDED
拼音输入法
-
Keywords
Embedded
GUI
Qt/Embedded
pinyin input method
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于龙芯2号的中文拼音输入法的移植与优化
- 3
-
-
作者
张鹏
王自强
彭成磊
周余
都思丹
-
机构
南京大学
-
出处
《电子测量技术》
2008年第11期147-149,共3页
-
基金
"863"计划资助项目(2006AA010201)
-
文摘
拼音输入法作为操作系统的首选中文输入法,在各种平台的PC和嵌入式设备上都获得了广泛的应用。为了在龙芯上更高效的运行和使用拼音输入法,本文将SCIM输入法移植到了Linux/龙芯2E上。本文从分析SCIM的系统架构出发,探讨了SCIM的工作原理,继而描述了移植过程,根据龙芯2号处理器体系结构的特点生成特殊指令,并对拼音输入法引擎的算法进行了调整和优化。实践中已经证明,特殊指令的引入和的算法的优化较好地提升了拼音输入法的性能,达到了预期的效果。
-
关键词
拼音输入法
SCIM
LINUX
龙芯2号
-
Keywords
pinyin input method
SCIM
Linux
LoongSon Ⅱ
-
分类号
TP368
[自动化与计算机技术—计算机系统结构]
-