检索结果-维普期刊中文期刊服务平台

藏文数词识别与翻译被引量：7: 1; 作者孙萌华却才让 +2 位作者刘凯吕雅娟刘群《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第1期75-80,共6页; 通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数... 展开更多; 关键词藏文数词基本构件自动机数词识别数词翻译; 在线阅读下载PDF 职称材料

基于判别式分类和重排序技术的藏文分词被引量：9: 2; 作者孙萌华却才让 +3 位作者才智杰姜文斌吕雅娟刘群《中文信息学报》 CSCD 北大核心 2014年第2期61-65,90,共6页; 本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构... 展开更多; 关键词判别式藏文分词构词粒度重排序; 在线阅读下载PDF 职称材料

班智达藏文标注词典设计被引量：15: 3; 作者才智杰才让卓玛《中文信息学报》 CSCD 北大核心 2010年第5期46-49,共4页; 语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的... 展开更多; 关键词藏语语料库分词标注词典索引; 在线阅读下载PDF 职称材料

藏语语料库加工方法研究被引量：13: 4; 作者才让加《计算机工程与应用》 CSCD 北大核心 2011年第6期138-139,146,共3页; 为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料... 展开更多; 关键词藏语语料库规范词类标记集词典分词标注; 在线阅读下载PDF 职称材料

藏文字频统计系统中字构件分解算法被引量：4: 5; 作者才让卓玛才智杰《计算机工程与科学》 CSCD 北大核心 2011年第3期159-162,共4页; 藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整... 展开更多; 关键词字频统计构件分解; 在线阅读下载PDF 职称材料

藏语语料库词类描述方法研究被引量：7: 6; 作者才让加《计算机工程与应用》 CSCD 北大核心 2011年第4期146-148,共3页; 藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动... 展开更多; 关键词自然语言藏文词类标记语法信息; 在线阅读下载PDF 职称材料

基于感知机模型藏文命名实体识别被引量：31: 7; 作者华却才让姜文斌 +1 位作者赵海兴刘群《计算机工程与应用》 CSCD 2014年第15期172-176,共5页; 藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模... 展开更多; 关键词藏文音节命名实体藏文命名实体感知机模型; 在线阅读下载PDF 职称材料

基于词对依存分类的藏语树库半自动构建研究被引量：9: 8; 作者华却才让姜文斌 +1 位作者赵海兴刘群《中文信息学报》 CSCD 北大核心 2013年第5期166-172,共7页; 依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,... 展开更多; 关键词藏语依存句法词对依存分类藏语树库藏语依存标注工具; 在线阅读下载PDF 职称材料

基于判别式的藏语依存句法分析被引量：18: 9; 作者华却才让赵海兴《计算机工程》 CAS CSCD 2013年第4期300-304,共5页; 现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%... 展开更多; 关键词藏语依存句法句法标注规范最大生成树特征模板依存句法感知机; 在线阅读下载PDF 职称材料

题名藏文数词识别与翻译被引量：7: 1; 作者孙萌华却才让刘凯吕雅娟刘群; 机构中国科学院计算技术研究所中国科学院研究生院青海师范大学藏文信息研究中心; 出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第1期75-80,共6页; 基金 863计划(2011AA01A207)资助; 文摘通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%,在藏汉机器翻译的测试集上的BLEU提高了2.64%。; 关键词藏文数词基本构件自动机数词识别数词翻译; Keywords Tibetan number basic component automation number indentification number translation; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于判别式分类和重排序技术的藏文分词被引量：9: 2; 作者孙萌华却才让才智杰姜文斌吕雅娟刘群; 机构中国科学院计算技术研究所中国科学院智能信息处理重点实验室中国科学院大学青海师范大学藏文信息研究中心; 出处《中文信息学报》 CSCD 北大核心 2014年第2期61-65,90,共6页; 基金 863重大项目(2011AA01A207); 文摘本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21%;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25%。; 关键词判别式藏文分词构词粒度重排序; Keywords discriminative model Tibetan word segmentation word-formation unit reranking; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名班智达藏文标注词典设计被引量：15: 3; 作者才智杰才让卓玛; 机构青海师范大学藏文信息研究中心; 出处《中文信息学报》 CSCD 北大核心 2010年第5期46-49,共4页; 基金国家语委资助项目(MZ05-118) 国家社会科学基金资助项目(07BYY035 09XYY024); 文摘语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的结构及词典库索引查询算法。对85万字节藏语实验语料的分词和标注,分词准确率达99%,标注准确率达97%。; 关键词藏语语料库分词标注词典索引; Keywords corpus of Tibetan segmentation tagging dictionory index; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏语语料库加工方法研究被引量：13: 4; 作者才让加; 机构青海师范大学藏文信息研究中心; 出处《计算机工程与应用》 CSCD 北大核心 2011年第6期138-139,146,共3页; 基金国家语委基金(No.MZ115-018) 国家社会科学基金(No.07BYY035) +1 种基金 973计划前期研究专项(No.2010CB334708); 文摘为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。; 关键词藏语语料库规范词类标记集词典分词标注; Keywords Tibetan corpus norms lexicon mark sets dictionary participle labeling; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏文字频统计系统中字构件分解算法被引量：4: 5; 作者才让卓玛才智杰; 机构青海师范大学藏文信息研究中心; 出处《计算机工程与科学》 CSCD 北大核心 2011年第3期159-162,共4页; 基金国家社科基金资助项目(09XYY024) 青海师范大学科研基金资助项目; 文摘藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整字角度统计分析藏文字频度属性,还要统计分析构成其构件的频度及位置属性。因此,在藏文字频统计系统中要分解构成藏文字的各部件。本文通过开发藏文字频统计系统,利用组合构件库结合藏文文法提出了一种藏文字构件分解算法。经测试,该算法不仅简单易行,而且可以有效地确定出各基本构件的位置特征,已应用于项目藏文字频统计系统。; 关键词字频统计构件分解; Keywords word frequency statistics component decomposition; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏语语料库词类描述方法研究被引量：7: 6; 作者才让加; 机构青海师范大学藏文信息研究中心; 出处《计算机工程与应用》 CSCD 北大核心 2011年第4期146-148,共3页; 基金国家社会科学基金(No.07BYY035) 国家社会科学重点基金(No.05AYY001) +1 种基金国家语委项目(No.MZ115-018) 国家973计划前期研究专项(No.2010CB334708); 文摘藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。; 关键词自然语言藏文词类标记语法信息; Keywords natural language Tibetan POS-tagging grammatical information; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于感知机模型藏文命名实体识别被引量：31: 7; 作者华却才让姜文斌赵海兴刘群; 机构陕西师范大学计算机学院青海师范大学藏文信息研究中心中国科学院计算技术研究所; 出处《计算机工程与应用》 CSCD 2014年第15期172-176,共5页; 基金国家自然科学基金(No.61363055 No.61063033 +1 种基金 No.61163018) 教育部"春晖计划"合作科研项目(No.Z2012102); 文摘藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。; 关键词藏文音节命名实体藏文命名实体感知机模型; Keywords Tibetan syllable Name Entity（NE） Tibetan NE perceptron model; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于词对依存分类的藏语树库半自动构建研究被引量：9: 8; 作者华却才让姜文斌赵海兴刘群; 机构青海师范大学藏文信息研究中心陕西师范大学计算机学院中国科学院计算技术研究所智能信息处理重点实验室青海师范大学藏文信息研究中心中国科学院计算技术研究所智能信息处理重点实验室; 出处《中文信息学报》 CSCD 北大核心 2013年第5期166-172,共7页; 基金国家自然科学基金资助项目(61063033,61163018,61363055) 教育部“春晖计划”合作科研资助项目(Z2012102); 文摘依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。; 关键词藏语依存句法词对依存分类藏语树库藏语依存标注工具; Keywords Tibetan dependency syntax word-pair dependency classification Tibetan Treebank Tibetan dependency annotation tool; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于判别式的藏语依存句法分析被引量：18: 9; 作者华却才让赵海兴; 机构青海师范大学藏文信息研究中心陕西师范大学计算机科学学院; 出处《计算机工程》 CAS CSCD 2013年第4期300-304,共5页; 基金国家自然科学基金资助项目(61063033 61163018) +1 种基金青海省科技基金资助项目(2011-Z-752); 文摘现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。; 关键词藏语依存句法句法标注规范最大生成树特征模板依存句法感知机; Keywords Tibetan dependency syntax syntax tagging specification maximum-spanning tree feature template dependency syntax perceptron; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	藏文数词识别与翻译	孙萌华却才让刘凯吕雅娟刘群	《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心	2013	7	在线阅读下载PDF 职称材料
2	基于判别式分类和重排序技术的藏文分词	孙萌华却才让才智杰姜文斌吕雅娟刘群	《中文信息学报》 CSCD 北大核心	2014	9	在线阅读下载PDF 职称材料
3	班智达藏文标注词典设计	才智杰才让卓玛	《中文信息学报》 CSCD 北大核心	2010	15	在线阅读下载PDF 职称材料
4	藏语语料库加工方法研究	才让加	《计算机工程与应用》 CSCD 北大核心	2011	13	在线阅读下载PDF 职称材料
5	藏文字频统计系统中字构件分解算法	才让卓玛才智杰	《计算机工程与科学》 CSCD 北大核心	2011	4	在线阅读下载PDF 职称材料
6	藏语语料库词类描述方法研究	才让加	《计算机工程与应用》 CSCD 北大核心	2011	7	在线阅读下载PDF 职称材料
7	基于感知机模型藏文命名实体识别	华却才让姜文斌赵海兴刘群	《计算机工程与应用》 CSCD	2014	31	在线阅读下载PDF 职称材料
8	基于词对依存分类的藏语树库半自动构建研究	华却才让姜文斌赵海兴刘群	《中文信息学报》 CSCD 北大核心	2013	9	在线阅读下载PDF 职称材料
9	基于判别式的藏语依存句法分析	华却才让赵海兴	《计算机工程》 CAS CSCD	2013	18	在线阅读下载PDF 职称材料