期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于网站用词调查的现代维吾尔语词干提取和应用研究 被引量:11
1
作者 艾孜尔古丽 齐向卫 玉素甫.艾白都拉 《计算机应用与软件》 CSCD 北大核心 2012年第3期32-34,97,共4页
通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应... 通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应用形式;介绍和讨论词干分布结果,最后总结以上内容。 展开更多
关键词 现代维吾尔语 网站 词干 提取
在线阅读 下载PDF
基于网站用词调查的现代维吾尔语词长研究 被引量:9
2
作者 玉素甫.艾白都拉 艾孜尔古丽 祖丽皮亚 《计算机应用与软件》 CSCD 北大核心 2012年第5期32-34,共3页
首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统... 首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统计与分析结果。 展开更多
关键词 现代维吾尔文 网络媒体 词长 研究
在线阅读 下载PDF
中小学维吾尔语文教材用词数据分析方法研究 被引量:3
3
作者 艾孜尔古丽 李晓 玉素甫.艾白都拉 《计算机工程与应用》 CSCD 2014年第3期108-111,共4页
随着社会的发展变化,语言生活也在不断地发展变化。为了切实掌握中小学维吾尔语文教材中用词情况,以中小学维吾尔语文教材作为研究对象,对用词概况进行研究。陈述研究使用的语料;介绍统计系统研究概况;中小学维吾尔语文教材用词研究包... 随着社会的发展变化,语言生活也在不断地发展变化。为了切实掌握中小学维吾尔语文教材中用词情况,以中小学维吾尔语文教材作为研究对象,对用词概况进行研究。陈述研究使用的语料;介绍统计系统研究概况;中小学维吾尔语文教材用词研究包括研究总词次、总词种数、总词干种数;讨论与分析词频与词种、词种覆盖率、词种。 展开更多
关键词 维吾尔语文 中小学维吾尔语文教材 词语 数据分析
在线阅读 下载PDF
信息处理用维语词汇标注标记集的确定 被引量:4
4
作者 玉素甫.艾白都拉 阿不都热依木.沙力 帕提古丽 《计算机应用》 CSCD 北大核心 2009年第7期2006-2008,共3页
介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合... 介绍了研究和制定信息处理用维语标注标记集的研究进展。讨论了研究与制订"维语标注标记集"必要性,说明了只靠语法角度提出的词汇一级"维语标注标记集"的有限性,论述国内外英语、汉语层次分析研究的最新成果,结合维语的本身特点研究维语语义分类体系迫切性,给出了"维语标注标记集"的工作思路、标记集制定的原则和语法语义词汇一级词性标记集的内容,比较了标记集两个版本的特点,展望了其发展。 展开更多
关键词 维吾尔语 信息处理 标注标记集
在线阅读 下载PDF
现代维吾尔语词干词类标注标记集验证性研究 被引量:2
5
作者 艾孜尔古丽 米尔夏提 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2318-2323,共6页
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;... 以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。 展开更多
关键词 现代维吾尔语词干 词类标注 标记集 验证
在线阅读 下载PDF
现代维吾尔语常用词统计关键技术研究 被引量:8
6
作者 艾孜尔古丽 努尔艾合买提 玉素甫.艾白都拉 《中文信息学报》 CSCD 北大核心 2014年第5期192-197,共6页
本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常... 本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常用词候选表,从词语的使用频度和词语的分布两方面对词语进行了基本考察,将维吾尔语词语的"词种数、频次、频率、文本数、词长"作为常用词候选表的依据。 展开更多
关键词 现代维吾尔语 语料库 常用词候选表 计量分析
在线阅读 下载PDF
现代维吾尔文网络媒体用词研究 被引量:7
7
作者 艾孜尔古丽 艾山江.阿不力孜 玉素甫.艾白都拉 《计算机应用与软件》 CSCD 北大核心 2012年第2期67-68,121,共3页
随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构... 随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构模型;然后介绍调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法以及统计结果讨论。 展开更多
关键词 现代维吾尔文 网站 词语 统计
在线阅读 下载PDF
基于德语语料库词性标注和统计方法的研究 被引量:1
8
作者 姚天昉 林莉 玉素甫.艾白都拉 《上海交通大学学报》 EI CAS CSCD 北大核心 1996年第6期35-40,共6页
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.
关键词 德语语料库 词性标注 语料统计 机器翻译
在线阅读 下载PDF
基于网站用词调查的现代维吾尔语词尾切分和应用研究 被引量:6
9
作者 玉素甫.艾白都拉 艾孜尔古丽 《计算机应用与软件》 CSCD 北大核心 2012年第4期13-15,共3页
首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次... 首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次分段分析、词尾长分段分析结果。 展开更多
关键词 现代维吾尔文 网站 词尾 切分
在线阅读 下载PDF
维吾尔文初中数学教材词干分析研究 被引量:1
10
作者 艾孜尔古丽 艾孜海尔江 +2 位作者 玉素甫.艾白都拉 祖力克尔江 米尔夏提 《中文信息学报》 CSCD 北大核心 2017年第5期108-113,共6页
该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具... 该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具,获取教材中词干基本情况、新增词干、初中数学教材高频词干,开展了初中数学维吾尔文教材词干调查,为维吾尔语研究、维吾尔文数学教学与教材编纂等提供参考依据,从而更加积极有效地促进维吾尔语语言本身研究及其信息处理的发展。 展开更多
关键词 现代维吾尔语 词干 分析 方法
在线阅读 下载PDF
基于形态分析的现代维吾尔语名词词干识别研究 被引量:4
11
作者 艾孜尔古丽 阿力木.木 玉素甫.艾白都拉 《中文信息学报》 CSCD 北大核心 2015年第6期208-212,共5页
现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特... 现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特征分析,总结词缀歧义及消解规则;该文提出研究总体思路,设计现代维吾尔语新词中名词识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等;最后将初中、高中物理维吾尔语教材作为验证对象,对名词词干进行统计与分析。 展开更多
关键词 现代维吾尔语 形态分析 名词词干识别
在线阅读 下载PDF
维语句法分析器中的词义排歧问题的研究 被引量:11
12
作者 玉素甫.艾白都拉 《计算机应用与软件》 CSCD 北大核心 2002年第4期59-62,共4页
本文论述了现代维语短语自动划分标注的基本处理算法、排歧处理、词义排歧中的搭配、现代维语词义排歧算法的语言学依据、现代维语词义排歧算法的实现。通过典型的例子,说明了分析器中存在的问题可以用短语划分标注和词义排歧相结合的... 本文论述了现代维语短语自动划分标注的基本处理算法、排歧处理、词义排歧中的搭配、现代维语词义排歧算法的语言学依据、现代维语词义排歧算法的实现。通过典型的例子,说明了分析器中存在的问题可以用短语划分标注和词义排歧相结合的方法并扩展到句义排歧方法来解决。 展开更多
关键词 句法分析 维语句法分析器 词义排歧 自然语言处理 计算机
在线阅读 下载PDF
维语中心语驱动文法句法分析器中的上下文相关处理 被引量:11
13
作者 玉素甫.艾白都拉 吾守尔.斯 《计算机应用与软件》 CSCD 1999年第6期22-25,共4页
上下文相关处理问题是维语中心语驱动文法句法分析器中的难点之一。但它又是解决维语中心语驱动文法句法分析器中的结构歧义问题的主要手段。如何巧妙地应用上下文相关技术解决维语句法分析器中的结构歧义问题便成为当前维语句法分析研... 上下文相关处理问题是维语中心语驱动文法句法分析器中的难点之一。但它又是解决维语中心语驱动文法句法分析器中的结构歧义问题的主要手段。如何巧妙地应用上下文相关技术解决维语句法分析器中的结构歧义问题便成为当前维语句法分析研究的重要课题。本文论述了维语句法分析中上下文相关的一般概念,上下文相关规则处理和几种维语并列关系的多项语句的分析过程。 展开更多
关键词 HPSG 维语 自然语言处理 句法分析器 计算机
在线阅读 下载PDF
基于语法的维吾尔语情感词汇自动获取 被引量:4
14
作者 玛尔哈巴.艾赛提 艾孜尔古丽 玉素甫.艾白都拉 《中文信息学报》 CSCD 北大核心 2017年第1期126-132,139,共8页
情感词汇的获取是文本倾向性分析的基础。为了解决人工识别方法低效的不足,并为维吾尔语情感词的研究及情感词词典的创建提供一些可供选择的方法和思路,该文首先分析了维吾尔语情感词汇在上下文中表现的特征,并结合维吾尔语本身的语法特... 情感词汇的获取是文本倾向性分析的基础。为了解决人工识别方法低效的不足,并为维吾尔语情感词的研究及情感词词典的创建提供一些可供选择的方法和思路,该文首先分析了维吾尔语情感词汇在上下文中表现的特征,并结合维吾尔语本身的语法特征,建立了扩展的维吾尔语新增特征模型,与词频逆文档频率(TF-IDF)算法相结合,实现了维吾尔语情感词汇的识别。实验结果指出该特征模型有效地提高了情感词汇的识别率。 展开更多
关键词 情感词汇 维吾尔语 语法 自动获取
在线阅读 下载PDF
基于多策略的乌孜别克语名词词干识别研究 被引量:3
15
作者 艾孜海尔江 祖力克尔江 +1 位作者 艾孜尔古丽 玉素甫.艾白都拉 《中文信息学报》 CSCD 北大核心 2018年第9期35-40,共6页
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语... 乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则。该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等。最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析。 展开更多
关键词 乌孜别克语 形态分析 多策略 名词词干识别
在线阅读 下载PDF
用于构建维吾尔文语料库的中文件格式转换技术研究 被引量:2
16
作者 艾斯卡尔.亚克甫 艾孜尔古丽 玉素甫.艾白都拉 《计算机应用与软件》 CSCD 北大核心 2012年第6期14-16,共3页
研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证... 研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大量单词收集的效率和质量。 展开更多
关键词 文件转换 RTF(Rich TEXT Format) 维吾尔文
在线阅读 下载PDF
现代维吾尔语人名汉字音译转写关键技术研究 被引量:1
17
作者 阿力木.木 艾孜尔古丽 玉素甫.艾白都拉 《计算机工程与应用》 CSCD 2014年第9期209-213,共5页
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些... 改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。 展开更多
关键词 维吾尔语 音节切分 维吾尔人名汉字音译转写 自动翻译
在线阅读 下载PDF
现代维吾尔语句子成分分析技术研究
18
作者 努尔艾合买提.艾买提 艾孜尔古丽 玉素甫.艾白都拉 《计算机工程与科学》 CSCD 北大核心 2015年第12期2339-2344,共6页
句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分... 句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。 展开更多
关键词 信息处理 维吾尔语 短语结构 句子成分
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部