期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
蒙古文信息处理通用系统内部码体系结构详析
1
作者 拉西吉格木德 《中文信息学报》 CSCD 1996年第1期46-52,共7页
本文,归纳蒙古文字特殊性和分析现有蒙古文系统后,指出建立具备通用处理功能,又与西文、汉字兼容的蒙古文信息处理系统的关键,在于内部码体系结构的建立上.然后,对几种内部码体系结构设计方案,进行了详细地分析比较,并探讨了它... 本文,归纳蒙古文字特殊性和分析现有蒙古文系统后,指出建立具备通用处理功能,又与西文、汉字兼容的蒙古文信息处理系统的关键,在于内部码体系结构的建立上.然后,对几种内部码体系结构设计方案,进行了详细地分析比较,并探讨了它们的可行性。 展开更多
关键词 古文信息处理 信息处理 字形码体系
在线阅读 下载PDF
古文字信息化处理国际学术研讨会 被引量:3
2
作者 张再兴 《中文信息学报》 CSCD 北大核心 2002年第3期63-64,共2页
关键词 古文字研究 古文字编码 古汉字输入法 字库建设 网上发布 古文信息处理 国际学术研讨会
在线阅读 下载PDF
“工欲善其事,必先利其器”——谈古文字信息化处理应用软件的开发
3
作者 张再兴 《现代中文学刊》 2002年第2期7-9,共3页
古文字信息化处理是一个复杂的系统工程,其成果的资料容量之大是传统文本所无法比拟的。如“金文资料库”的大小为451兆(含图片411兆),其中文字数据约100万字。因此,古文字信息化处理项目的完成一般是要以大量烦琐枯燥的手工操作为基础... 古文字信息化处理是一个复杂的系统工程,其成果的资料容量之大是传统文本所无法比拟的。如“金文资料库”的大小为451兆(含图片411兆),其中文字数据约100万字。因此,古文字信息化处理项目的完成一般是要以大量烦琐枯燥的手工操作为基础的。从某种意义上说,正是这种几近天文数字的工作量。 展开更多
关键词 古文信息处理 必先利其器 中古音 古文字资料 分析统计 汉字结构分析 语料库 上古音系 出土文献 文字类型
在线阅读 下载PDF
从《金文引得》说到“金文资料库”——兼论古文字信息化处理中的若干重要问题
4
作者 之其 《现代中文学刊》 2002年第2期3-7,共5页
一感谢你们提供了一个非常杰出的研究工具,考虑周到,印刷精美。我会经年累月地在工作中使用它。我本人也用计算机编制过甲骨文索引,所以深知这本书里凝聚了多少心血。向你们表示由衷的感谢,不仅仅是为了送给了我这本书,而且为了你们为... 一感谢你们提供了一个非常杰出的研究工具,考虑周到,印刷精美。我会经年累月地在工作中使用它。我本人也用计算机编制过甲骨文索引,所以深知这本书里凝聚了多少心血。向你们表示由衷的感谢,不仅仅是为了送给了我这本书,而且为了你们为这个领域的所有研究者编制了这本书。 展开更多
关键词 古文字研究 古文信息处理 甲骨文 隶定字 古文字资料 古文字字库 研究者 工具书 基本单位 殷周金文
在线阅读 下载PDF
古文字信息化处理研究专辑
5
《现代中文学刊》 2002年第2期2-2,共1页
教育部人文社会科学重点研究基地华东师范大学中国文字研究与应用中心于2001年10月在上海举办了首届“古文字信息化处理国际学术研讨会”。美国、加拿大、法国、挪威、日本、韩国、香港、台湾及内地各高校和研究机构的60余学者光临申城。
关键词 古文信息处理 国际学术研讨会 中国文字 师范大学 研究领域 汉字 文字信息处理 研究与应用 古文字研究 研究基地
在线阅读 下载PDF
数字人文视域下的古文献文本标注与可视化研究——以《左传》知识库为例 被引量:48
6
作者 李斌 王璐 +1 位作者 陈小荷 王东波 《大学图书馆学报》 CSSCI 北大核心 2020年第5期72-80,90,共10页
在数字人文研究范式下,传统的以电子化和全文检索为基础的古籍研究模式已难以满足历史学、文献学、语言学等学科深度研究的需要。古籍文本特别是史书所记载的词语、时间、地点、人物、事件等要素都需要结构化的历史人文数据库,从而实现... 在数字人文研究范式下,传统的以电子化和全文检索为基础的古籍研究模式已难以满足历史学、文献学、语言学等学科深度研究的需要。古籍文本特别是史书所记载的词语、时间、地点、人物、事件等要素都需要结构化的历史人文数据库,从而实现历史要素的定量分析与可视化。文章以古汉语自动分析技术为基础,结合人工标注和校对,以实体标注方法解决历史人物的同名异指和异名同指问题,对史学名著《左传》进行了词语切分、词性、时间、人物ID、地点GIS信息标注,进而实现了热点人物、人物关系网、人物游历轨迹与距离等量化统计与可视化,为古籍文本的内容标注、结构化人文知识库建设提供新的研究路径。最后,讨论了知识库进一步的完善方案与应用场景。 展开更多
关键词 数字人文 《左传》 实体标注 数据库 古文信息处理
在线阅读 下载PDF
蒙古语语义信息词典SIKM的研发 被引量:1
7
作者 海银花 《计算机工程与应用》 CSCD 北大核心 2016年第10期128-134,共7页
蒙古语语义信息词典(SIKM)作为一部知识库已成为整个蒙古语语言资源的组成部分。自2009年至今,词典的研发取得了阶段性进展。SIKM现已收录5.7万多条记录,涵盖4个词典库。其中包含全部词语的1个"总库",名词、形容词、动词等3... 蒙古语语义信息词典(SIKM)作为一部知识库已成为整个蒙古语语言资源的组成部分。自2009年至今,词典的研发取得了阶段性进展。SIKM现已收录5.7万多条记录,涵盖4个词典库。其中包含全部词语的1个"总库",名词、形容词、动词等3个词类各建一个数据库。每个数据库文件都详细刻画了各词类词语及其语义属性的二维关系。目前已完成5.7万多条词语的语义分类和属性描述,该分类体系和词典的一些属性信息初步被应用到蒙古文信息处理相关基础研究和开发之中。介绍词典规模及结构,语义分类体系、属性字段描述以及研制过程中遇到的一些难点,词典的初步应用情况等内容。 展开更多
关键词 蒙古语 语义信息词典 古文信息处理 研发
在线阅读 下载PDF
第一届古代汉语分词和词性标注国际评测 被引量:7
8
作者 李斌 袁义国 +4 位作者 芦靖雅 冯敏萱 许超 曲维光 王东波 《中文信息学报》 CSCD 北大核心 2023年第3期46-53,64,共9页
中文古籍数量庞大,亟待智能处理方法进行自动处理。古文的自动分词和词性标注,是古汉语信息处理的基础任务。而大规模词库和标注语料库的缺失,导致古汉语自动分析技术发展较慢。该文介绍了第一届古代汉语分词和词性标注国际评测的概况,... 中文古籍数量庞大,亟待智能处理方法进行自动处理。古文的自动分词和词性标注,是古汉语信息处理的基础任务。而大规模词库和标注语料库的缺失,导致古汉语自动分析技术发展较慢。该文介绍了第一届古代汉语分词和词性标注国际评测的概况,评测以人工标校的精加工语料库作为统一的训练数据,以F_(1)值作为评测指标,比较了古汉语词法分析系统在测试数据(基测集和盲测集)上的优劣。评测还根据是否使用外部资源,区分出开放和封闭两种测试模式。该评测在第十三届语言资源与评测会议的第二届历史和古代语言技术研讨会上举办,共有14支队伍参赛。在基测集上,封闭测试模式分词和词性标注的F_(1)值分别达到了96.16%和92.05%,开放测试模式分词和词性标注的F_(1)值分别达到了96.34%和92.56%。在盲测集上,封闭测试分词和词性标注的F_(1)值分别达到93.64%和87.77%,开放测试分词和词性标注F_(1)值则分别达到95.03%和89.47%。未登录词依然是古代汉语词法分析的瓶颈。该评测的最优系统把目前古汉语词法分析提高到新的水平,深度学习和预训练模型有力地提高了古汉语自动分析的效果。 展开更多
关键词 古汉语 评测 自动分词 词性标注 古文信息处理
在线阅读 下载PDF
机器学习视角的人工智能研究回顾及对图书情报学的影响 被引量:17
9
作者 刘浏 王东波 黄水清 《图书与情报》 CSSCI 北大核心 2017年第6期84-95,共12页
人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进... 人工智能是近年来异常火热的话题,其对世界的影响和改变已经随处可见,这其中机器学习尤其是深度学习发挥着至关重要的作用。文章梳理了人工智能的发展脉络,阐述了机器学习在人工智能中所处的地位,对机器学习中重要和常见的模型和算法进行了简要介绍,其中包括近年最为重要的深度学习。人工智能的热潮对于图书情报来说是一个极佳的发展契机,文章也从多个角度分析了机器学习对图书情报学科产生的影响,展望了两者充分结合的发展前景和未来趋势,并以古文信息处理为例进一步阐述了机器学习方法在图书情报学研究中发挥的作用。 展开更多
关键词 人工智能 机器学习 深度学习 图书馆学 情报学 古文信息处理
在线阅读 下载PDF
数字人文视野下的古汉语实体歧义研究 被引量:12
10
作者 刘浏 王东波 +1 位作者 黄水清 苏新宁 《图书与情报》 CSSCI 北大核心 2020年第5期115-124,共10页
实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中... 实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。 展开更多
关键词 古文信息处理 实体歧义 古文智能处理 古文数字人文
在线阅读 下载PDF
计算人文下的古籍引书研究及全文本知识库的构建 被引量:7
11
作者 刘浏 齐月 +2 位作者 刘雏菲 李文祺 王东波 《情报学报》 CSSCI CSCD 北大核心 2023年第12期1498-1512,共15页
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古... 古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。 展开更多
关键词 古籍引书 计算人文 数字人文 古文信息处理 知识库
在线阅读 下载PDF
先秦词网构建及梵汉对比研究 被引量:1
12
作者 卢雪晖 徐会丹 +1 位作者 李斌 陈思瑜 《中文信息学报》 CSCD 北大核心 2023年第3期36-45,共10页
先秦汉语在汉语史研究上具有重要地位,然而以往的研究始终没有形成结构化的先秦词汇资源,难以满足古汉语信息处理和跨语言对比的研究需要。国际上以英文词网(WordNet)的义类架构为基础,建立了数十种语言的词网,已经成为多语言自然语言... 先秦汉语在汉语史研究上具有重要地位,然而以往的研究始终没有形成结构化的先秦词汇资源,难以满足古汉语信息处理和跨语言对比的研究需要。国际上以英文词网(WordNet)的义类架构为基础,建立了数十种语言的词网,已经成为多语言自然语言处理和跨语言对比的基础资源。该文综述了国内外各种词网的构建情况,特别是古代语言的词网和汉语词网,且详细介绍了先秦词网的构建和校正过程,构建了涵盖43 591个词语、61 227个义项、17 975个义类的先秦词网。该文还通过与古梵语词网的跨语言对比,尝试分析这两种古老语言在词汇上的共性和差异,初步验证先秦词网的价值。 展开更多
关键词 词网 先秦汉语 跨语言对比 古文信息处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部