期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于重定位的维、哈、柯文Unicode编码及多文种索引技术研究 被引量:2
1
作者 维尼拉.木沙江 吐尔地.托合提 吐尔洪.吾司曼 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期48-49,51+55,共4页
没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母,存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,... 没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母,存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,这对于维、哈、柯多文种数据的索引、排序和查询处理带来了很大困难.针对以上问题,研究了一种内部Unicode编码方法和基于词根的多文种索引技术.研究结果表明,这种方法完全解决了多文种信息的存储、排序等数据库管理问题,大大简化了索引技术及实现难度. 展开更多
关键词 UNICODE runiform MD5 倒排索引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部