期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文的同形异码字问题 被引量:1
1
作者 张小衡 《中文信息学报》 CSCD 北大核心 2015年第4期144-150,共7页
同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种"人机看法不一致"会给语言信息处理带来混乱,导致信息检索不全,统计数字不准,字词分类排序不一致等... 同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种"人机看法不一致"会给语言信息处理带来混乱,导致信息检索不全,统计数字不准,字词分类排序不一致等情况。该文结合Unicode实例专题讨论当前计算机上存在的中文同形异码字问题,包括(a)私人造字公有化所形成的同形异码字,(b)兼容编码所形成的同形异码字,(c)建立专门的笔画部首表而形成的同形异码字,(d)半宽和全宽字形分别编码而造成的同形异码字等,并探讨解决问题的方法。 展开更多
关键词 中文字符 同形异码 UNICODE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部