期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
论贵州古彝文编码字符集构建 被引量:6
1
作者 吴勰 禄玉萍 王明贵 《中文信息学报》 CSCD 北大核心 2014年第4期153-158,共6页
依托彝文古籍文献开展古彝文字符整理和规范研究,建立古彝文编码字符集有很高的要求和极大的工作量。这项工作有助于实现古彝文规范化应用,为古彝文信息技术开发提供基础保障。实现这一构想:需要最大限度地搜集整理古彝文字符,广泛听取... 依托彝文古籍文献开展古彝文字符整理和规范研究,建立古彝文编码字符集有很高的要求和极大的工作量。这项工作有助于实现古彝文规范化应用,为古彝文信息技术开发提供基础保障。实现这一构想:需要最大限度地搜集整理古彝文字符,广泛听取彝文专家建议和意见,经过充分的科学论证,对搜集的古彝文字符进行甄别、查重、筛选和择定,剔除大量古彝文异体字形,在此基础上规范古彝文的字量、字形、字音和字序,实现计算机技术处理古彝文字符信息的规范化。 展开更多
关键词 古彝文 编码字符集 彝文信息处理
在线阅读 下载PDF
编码字符集标准及分类研究 被引量:5
2
作者 谢谦 芮建武 吴健 《中文信息学报》 CSCD 北大核心 2006年第5期83-90,共8页
编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO 2022标准及其派生标准,对ISO 2022编码机制应用于多语言环境的局限性进行了探讨,阐明... 编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO 2022标准及其派生标准,对ISO 2022编码机制应用于多语言环境的局限性进行了探讨,阐明了使用通用编码字符集UCS的必要性,并对其进行了分析。探讨了现有编码分类方法存在的问题,引入了一种对编码字符集以及实现方法进行分类的新方法,使用该方法对现有标准进行了归类;最后对汉字字符集相关的国家标准进行了分析评介。 展开更多
关键词 计算机应用 中文信息处理 编码字符集
在线阅读 下载PDF
编码字符集中子集的完整性 被引量:3
3
作者 许寿椿 《中文信息学报》 CSCD 1991年第4期56-62,共7页
本文提出编码字符集中的完整性问题。(一)中给出两类编码实例。一类严格遵从“一个字符只分配给一个码位“或”任何字符都不重复分配码位”(简称一符一码)的节约原则。另一类以一符两码可多码的方式,以码位的牺牲换取子集的完整性。(二... 本文提出编码字符集中的完整性问题。(一)中给出两类编码实例。一类严格遵从“一个字符只分配给一个码位“或”任何字符都不重复分配码位”(简称一符一码)的节约原则。另一类以一符两码可多码的方式,以码位的牺牲换取子集的完整性。(二)中解释了子集完整性概念和意义。说明了有意义的子集通常是现实中某子系统的反映。多文种编码字符集的许多子集往往与某自然语言系统相关联,这种子集的完整性,也就与相应语言文字的系统性相关联。据此提出了完整性条件,此较了完整性得失,说明了完整性的某种相对性。(三)中指出不少字符集,含ISO 10646 DP版及DIS版,的一符一码原则损害了若干子集的完整性。在那里,拉丁文字圈中除英文以外的各国家、各民族的文字字符子集大多被肢解了,只有字母表是英文字母表(含元素2×26=52个)子集者例外。斯拉夫文字圈、阿拉伯文字圈情况相似。文中指出汉语拼音字母子集,无论在汉字编码的中国国家标准中还是国际标准10646中被严重肢解了。 本文是作者另文《字符集的序性》[9]的续编。本文的讨论仍除外汉文及藏文。 展开更多
关键词 编码字符集 子集 完整性 信息处理
在线阅读 下载PDF
《信息交换用汉字编码字符集》简介 被引量:2
4
作者 陈耀星 《语文建设》 1983年第4期5-7,共3页
1979年电子工业部华北计算技术研究所根据国家标准总局下达的关于制定国家标准汉字信息交换码的任务,会同国内15个从事计算机研制、教学、生产、应用和文字研究的单位,在华北计算技术研究所已有工作的基础上,经过两年的努力。
关键词 汉字编码字符集 汉字信息交换码 信息交换 辅助集 汉字输入编码 汉字信息处理 基本集 文字研究 电子工业部 字数统计
在线阅读 下载PDF
国家标准《信息交换用汉字编码字符集·第二辅助集》和《信息交换用汉字编码字符集·第四辅助集》的研制
5
作者 高景成 魏励 傅永和 《语文建设》 1987年第1期31-33,59,共4页
国家标准《信息交换用汉字编码字符集·基本集》已于1981年5月发布实施。《基本集》规定了汉字信息交换用的基本图形字符及其二进制编码,收汉字6763个。它适用于一般汉字处理、汉字通信等系统之间的信息交换。随着我国汉字信息处理... 国家标准《信息交换用汉字编码字符集·基本集》已于1981年5月发布实施。《基本集》规定了汉字信息交换用的基本图形字符及其二进制编码,收汉字6763个。它适用于一般汉字处理、汉字通信等系统之间的信息交换。随着我国汉字信息处理技术的发展,计算机的应用范围不断扩大,使用汉字字数较多的部门迫切需要在《基本集》的基础上继续制定信息交换用汉字编码字符集各辅助集的国家标准。计算机系统的研制厂商也提出同样要求。 展开更多
关键词 汉字编码字符集 辅助集 信息交换 基本集 《简化字总表》 规范汉字 图形字符 类推简化 《广韵》 字形结构
在线阅读 下载PDF
满汉计算机辅助翻译系统的满文字符编码 被引量:6
6
作者 张俐 胡明函 +1 位作者 李晶皎 何荣伟 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第2期119-122,共4页
满文借助于蒙古文字母创制而成 ,是一种拼音文字 ,满文的拼接是以音节为单位进行的·“满汉计算机辅助翻译系统”首先建立了基于音素的满文编码 ,以及基于音节的满文输出与显示码 ,并在这两级编码之间建立起映射规则·在此基础... 满文借助于蒙古文字母创制而成 ,是一种拼音文字 ,满文的拼接是以音节为单位进行的·“满汉计算机辅助翻译系统”首先建立了基于音素的满文编码 ,以及基于音节的满文输出与显示码 ,并在这两级编码之间建立起映射规则·在此基础上实现了一个满文编辑器 ,以及基于罗马转写的满文输入法·使用的编码方式 ,使满文的输入输出方便简单 ,并能同时适应满文印刷和满文信息深层次处理的需要· 展开更多
关键词 满文 编码字符集 映射规则 编辑器 满汉计算机辅助翻译系统 汉语 蒙古文字母
在线阅读 下载PDF
《GB13000.1字符集汉字字序(笔画序)规范》的研制 被引量:5
7
作者 汉字字序规范课题组 《语文建设》 CSSCI 北大核心 1999年第5期2-4,共3页
关键词 汉字 笔画数 通用多八位编码字符集 笔形 笔顺 字序 结构方式 汉字字形 组合关系 汉字笔画
在线阅读 下载PDF
汉字编码的性能要求 被引量:1
8
作者 刘春华 《语文建设》 CSSCI 北大核心 1996年第8期44-46,共3页
汉字编码的性能要求□刘春华笔者曾提出汉字编码的四项性能指标,即规范性、易学性、高效性和通用性(见拙作《统一汉字编码的途径、条件和前景》,载于《语文建设》1996年第3期)。本文进一步讨论四项性能指标的具体要求。一、规... 汉字编码的性能要求□刘春华笔者曾提出汉字编码的四项性能指标,即规范性、易学性、高效性和通用性(见拙作《统一汉字编码的途径、条件和前景》,载于《语文建设》1996年第3期)。本文进一步讨论四项性能指标的具体要求。一、规范性规范性的最低要求,是汉字编码不... 展开更多
关键词 汉字编码 易学性 重码率 键盘输入 字符集编码 编码方案 规范性 汉语基础知识 汉字教学 编码输入
在线阅读 下载PDF
模块组配型条码编码容量研究
9
作者 刘向东 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2004年第1期90-92,共3页
阐述了模块组配型条码的概念及其最大编码容量的计算方法.采用组合数学中典型的 型分配问题的求解方法,得到求取分配数的实用递推公式,从而提出针对(n,k)码的兼容最大编码容量的小量模块编码容量计算方法.基于对模块数的选择,对几种模... 阐述了模块组配型条码的概念及其最大编码容量的计算方法.采用组合数学中典型的 型分配问题的求解方法,得到求取分配数的实用递推公式,从而提出针对(n,k)码的兼容最大编码容量的小量模块编码容量计算方法.基于对模块数的选择,对几种模块组配型国际标准条码编码字符集的设计准则进行了讨论,验证了计算方法的正确性. 展开更多
关键词 模块组配型条码 编码容量 编码字符集 分配数 (n k)码 模块数
在线阅读 下载PDF
简易日汉兼容系统MCDOS的设计与应用 被引量:2
10
作者 朱学锋 朱万森 俞士汶 《中文信息学报》 CSCD 1989年第1期40-44,共5页
根据对中日两国汉字的编码体系及字形的调查,论述了用中国汉字字模作为日本汉字模的代用品的可行性。将 CCDOS 稍加改造,使之成为一种简易的日汉兼容系统 MCDOS,为日汉机器翻译系统的研究提供了一个接近实际的环境。已经利用 MCDOS 开... 根据对中日两国汉字的编码体系及字形的调查,论述了用中国汉字字模作为日本汉字模的代用品的可行性。将 CCDOS 稍加改造,使之成为一种简易的日汉兼容系统 MCDOS,为日汉机器翻译系统的研究提供了一个接近实际的环境。已经利用 MCDOS 开发了日汉机器词典,并解决了 MCDOS 和科学院计算中心开发的KJDD 中日英处理系统之间的信息转换问题。 展开更多
关键词 日本汉字 中国汉字 机器词典 MCDOS 日文汉字 信息转换 常用汉字 使用频度 编码字符集 基本集
在线阅读 下载PDF
银行信息系统生僻字问题探究 被引量:3
11
作者 马征 《金融发展研究》 北大核心 2021年第2期88-89,共2页
一、信息系统字符集情况介绍(一)字符集概述字符是各种文字和符号的总称,包括各国文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,目前汉字字符集主要有:《信... 一、信息系统字符集情况介绍(一)字符集概述字符是各种文字和符号的总称,包括各国文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,目前汉字字符集主要有:《信息交换用汉字编码字符集基本集》(GB2312-1980),《汉字内码扩展规范》(GBK),《信息技术信息交换用汉字编码字符集基本集的扩充》(GB18030-2000),《信息技术中文编码字符集》(GB18030-2005),《信息技术通用多八位编码字符集(UCS)》(GB13000-2010)。国外软件系统考虑跨语言、跨平台处理需求,常用的字符集为Unicode,在操作系统、应用程序中广泛应用。 展开更多
关键词 汉字编码字符集 GB2312 信息技术 信息交换 汉字内码 应用程序 生僻字 银行信息系统
在线阅读 下载PDF
ISO 2022的有限状态机描述
12
作者 谢谦 芮建武 吴健 《中文信息学报》 CSCD 北大核心 2006年第6期97-103,共7页
ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解。本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征。针对FSM五元组,详细说明了其状态空间的构成,提出了输入字母表的等效分类方法... ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解。本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征。针对FSM五元组,详细说明了其状态空间的构成,提出了输入字母表的等效分类方法,给出了初始状态以及终结状态集合,分析了状态转移函数的规模,并采用FSM描述方法分析了ISO-2022-CN、EUC-CN、复合文本等标准,揭示了这些标准与ISO 2022的内在联系。这些工作有助于ISO 2022标准符合性检测、扩展标准的制订与系统实现复杂度评估。鉴于形式化描述方法在编码字符集标准领域未得到广泛应用,本文工作为该类研究引入了新的思路和方法。 展开更多
关键词 计算机应用 中文信息处理 编码字符集 ISO 2022 有限状态机
在线阅读 下载PDF
汉字进入计算机之后的问题 被引量:1
13
作者 刘涌泉 《语文建设》 1984年第6期14-16,共3页
几年来,我国在中文信息处理方面取得了巨大的成绩,其中与汉字进入计算机有直接关系的就有这样几项:(1)设计了四百来种汉字编码方案,其中上机通过试验已被采用作为输入方式的,也有数十种之多。(2)《信息交换用汉字编码字符集基本集》(简... 几年来,我国在中文信息处理方面取得了巨大的成绩,其中与汉字进入计算机有直接关系的就有这样几项:(1)设计了四百来种汉字编码方案,其中上机通过试验已被采用作为输入方式的,也有数十种之多。(2)《信息交换用汉字编码字符集基本集》(简称《汉字标准交换码》)已作为国家标准颁布。辅助集也初步制定。(3)已研制出九十种汉字信息处理系统。(4)计算机激光汉字编辑排版系统研制成功。 展开更多
关键词 汉字编码方案 中文信息处理 辅助集 基本集 交换码 汉字编码字符集 编辑排版 音码 信息交换 自动切分
在线阅读 下载PDF
托忒蒙文与维、哈、柯、汉、英文字混合兼容处理研究 被引量:1
14
作者 吴宗尧 《中文信息学报》 CSCD 1989年第2期27-34,共8页
本文研究在IBM PC/XT及其兼容机上对左、右、竖三个方向上书写的六种文字进行处理的一般原理和方法;研究在选定的M-24微机操作系统的中断处理级和系统功能调用两级上实现左、右、竖三种屏幕编辑方式;找出屏幕映射、主/辅字符处理规则、... 本文研究在IBM PC/XT及其兼容机上对左、右、竖三个方向上书写的六种文字进行处理的一般原理和方法;研究在选定的M-24微机操作系统的中断处理级和系统功能调用两级上实现左、右、竖三种屏幕编辑方式;找出屏幕映射、主/辅字符处理规则、键盘输入和屏幕转换方法;解决这些文字在不同方向上混合兼容处理、不等宽字符处理、字符编码等问题并在汉字操作系统CC-DOS 上实现。 展开更多
关键词 字符编码 微机操作 编码字符集 中断处理 辅助集 代码区 处理规则 键盘输入 信息处理技术 显示输出
在线阅读 下载PDF
普通话声调分布和声调结构频度 被引量:7
15
作者 刘连元 马亦凡 《语文建设》 1986年第3期21-23,共3页
汉语是声调语言。普通话声调的类型、连读变调、辨义功能以及同语调、语境的关系呈现出极为复杂的情况。描写汉语声调的概貌,除了定性的描述外,还需要定量的统计分析。定量分析表现为一系列的数据,在分析研究与声调有关的语言学问题时,... 汉语是声调语言。普通话声调的类型、连读变调、辨义功能以及同语调、语境的关系呈现出极为复杂的情况。描写汉语声调的概貌,除了定性的描述外,还需要定量的统计分析。定量分析表现为一系列的数据,在分析研究与声调有关的语言学问题时,这些数据可以帮助我们更精确地认识某些语言现象。例如:普通话词汇中出现连读变调的大体占多大比例?每一种声调结构的频度如何?阴平、阳平、上声、去声和轻声在词汇中的分布是否存在某种规律性? 展开更多
关键词 连读变调 双音节词 四音节词 语言学问题 定性的 定量的 汉字编码字符集 阴上 阳去 统计分析
在线阅读 下载PDF
西双版纳傣文新闻网站与数字报刊技术研究 被引量:2
16
作者 殷建民 刀福祥 +1 位作者 唐金宝 玉康龙 《中文信息学报》 CSCD 北大核心 2011年第4期11-15,44,共6页
该文介绍了西双版纳傣文新闻网站与数字报刊系统的研究内容与关键技术,涉及西双版纳新老傣文编码/显现字符集、输入法和嵌入式字库的研究以及版面数字化技术、网站发布技术、新闻信息多渠道采集技术、多媒体共享稿库技术和中文新闻信息... 该文介绍了西双版纳傣文新闻网站与数字报刊系统的研究内容与关键技术,涉及西双版纳新老傣文编码/显现字符集、输入法和嵌入式字库的研究以及版面数字化技术、网站发布技术、新闻信息多渠道采集技术、多媒体共享稿库技术和中文新闻信息标准的应用。 展开更多
关键词 西双版纳傣文 新闻网站 数字报刊 编码/显现字符集 输入法
在线阅读 下载PDF
汉字简化与汉字教学
17
作者 蒋仲仁 《课程.教材.教法》 CSSCI 北大核心 1991年第1期8-11,共4页
一 汉字简化是国家语言文字工作中汉字工作的一部分。汉字工作还有异体字的整理,字形的整理,字音的审定,通用汉字和常用汉字的调查统计,汉字检索法的研制,计算机汉字编码字符集的编订等等。这一系列的工作让沿用了几千年的汉字为适应时... 一 汉字简化是国家语言文字工作中汉字工作的一部分。汉字工作还有异体字的整理,字形的整理,字音的审定,通用汉字和常用汉字的调查统计,汉字检索法的研制,计算机汉字编码字符集的编订等等。这一系列的工作让沿用了几千年的汉字为适应时代的需要得到比较全面的整理。我们统一的国家做到了“书同文”,改变了多年来用字混乱的现象,确定了全国通用的汉字的规范。 汉字简化工作从建国之初就开始研究。 展开更多
关键词 汉字教学 汉字简化 简化字 繁体字 汉字检索法 计算机汉字编码字符集 手写体 印刷体 形声字 字理
在线阅读 下载PDF
字词频统计与汉语分词规范 被引量:1
18
作者 刘源 《语文建设》 CSSCI 北大核心 1992年第5期35-38,共4页
一、中文信息处理的字频统计我国在70年代曾组织“七四八工程”,对2100余万汉字的语料,进行汉字的字频统计,得出了《现代汉字综合使用频度表》,为《信息交换用汉字编码字符集——基本集》提供了基础。但由于当时的历史条件,统计资料有... 一、中文信息处理的字频统计我国在70年代曾组织“七四八工程”,对2100余万汉字的语料,进行汉字的字频统计,得出了《现代汉字综合使用频度表》,为《信息交换用汉字编码字符集——基本集》提供了基础。但由于当时的历史条件,统计资料有一定的局限性,而且是初次进行这项工作,技术和经验都嫌不足,致使以这一统计材料为依据的《信息交换用汉字编码字符集——基本集》中所收的一二级汉字中,有少数字的使用率极低。 展开更多
关键词 汉语分词 词频统计 中文信息处理 基本集 汉字编码字符集 分词方法 自动分词 现代汉字 使用频度 信息交换
在线阅读 下载PDF
《汉字统一部首表(草案)》修订说明 被引量:1
19
《语文建设》 CSSCI 北大核心 1998年第11期6-8,共3页
《汉字统一部首表(草案)》于1983年由中国文字改革委员会和国家出版局联合发布。该表发布后,在辞书编纂、汉字各类标准的制订、计算机信息处理、图书检索等方面得到了广泛应用。其中影响较大的有:《汉语大字典》《汉语大词典》... 《汉字统一部首表(草案)》于1983年由中国文字改革委员会和国家出版局联合发布。该表发布后,在辞书编纂、汉字各类标准的制订、计算机信息处理、图书检索等方面得到了广泛应用。其中影响较大的有:《汉语大字典》《汉语大词典》}(200部,增黹部,删业、二部... 展开更多
关键词 部首 变形部 汉字编码字符集 现代汉语通用字表 信息交换 《现代汉语规范字典》 辅助集 《汉语大字典》 《汉语大词典》 计算机信息处理
在线阅读 下载PDF
中文“三古”现代化的思考
20
作者 盛玉麒 王新华 张树铮 《语文建设》 CSSCI 北大核心 1993年第10期34-36,33,共4页
国际标准ISO—IEC10646(UCS)《通用多八位编码字符集》及即将公布的我国国家标准GB13000《信息交换用汉字编码字符集》是中文信息处理领域划时代的一件大事。它标志着“中文电脑化”由6763字现代汉语平台步上了20902字的古代汉语的平台... 国际标准ISO—IEC10646(UCS)《通用多八位编码字符集》及即将公布的我国国家标准GB13000《信息交换用汉字编码字符集》是中文信息处理领域划时代的一件大事。它标志着“中文电脑化”由6763字现代汉语平台步上了20902字的古代汉语的平台,从此,揭开了中文“ 展开更多
关键词 汉字编码字符集 古代汉语 现代汉语 信息交换 人工方式 数据检索 磁盘拷贝 远程通信技术 手工作业 人多手杂
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部