-
题名基于语义的多文种编码方案SemaCode
被引量:1
- 1
-
-
作者
李培峰
朱巧明
钱培德
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第6期1652-1656,共5页
-
基金
国家"863"计划资助项目(2006AA01Z147)
国家自然科学基金资助项目(60673041)
江苏省高技术研究资助项目(BG2005020)
-
文摘
分析了现有的几种常用编码方案的优点和缺陷,并提出了一个基于语义的多文种编码方案SemaCode及其模型。SemaCode模型分为六个层次,分别为交换传输层、字符码位层、词码位层、属性层、语义层和应用接口层。SemaCode是一种面向信息处理、可扩展的多文种编码方案,它在码位层SemaCode以字符为单位编码,并在编码中嵌入文种信息;在词码位层提出了以语义为轴心,以词为单位的编码理念;在属性层引入了一种对编码进行描述的标签机制,使得编码具有良好的可描述性和可扩展性;另外,在语义层以及其他层次提出了基于码位和描述协议的语义表示方法,并使得SemaCode成为一种具有部分可计算特性的编码方案。最后,在与Unicode对比的基础上,分析了SemaCode所具有的优势。
-
关键词
多文种编码方案
语义
层次结构
词编码
-
Keywords
multilingual encoding scheme
semantic
layered structure
phrases encoding
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-