期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多策略汉维句子对齐
被引量:
8
1
作者
田生伟
吐尔根.依布
拉
音
+2 位作者
禹龙
加米拉.吾守尔
杨飞宇
《计算机科学》
CSCD
北大核心
2010年第4期215-218,292,共5页
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误...
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。
展开更多
关键词
双语语料
错误抑制
句子对齐
混合策略
汉维句子
在线阅读
下载PDF
职称材料
维吾尔语依存树库构建及统计分析
被引量:
2
2
作者
麦热哈巴.艾力
吐尔根.依布
拉
音
加米拉.吾守尔
《中文信息学报》
CSCD
北大核心
2018年第11期8-15,共8页
本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计...
本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计与实现。然后根据《维吾尔语依存树库标注手册》人工标注了3 400多条句子并从三个角度对依存树库信息做了统计分析。
展开更多
关键词
依存句法
依存树库
维吾尔语
在线阅读
下载PDF
职称材料
维吾尔语比较句识别研究
3
作者
王慧云
禹龙
+2 位作者
田生伟
加米拉.吾守尔
冯冠军
《中文信息学报》
CSCD
北大核心
2016年第1期148-155,共8页
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bi...
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bidirectional CSR Mining),以挖掘的模式为特征,利用支持向量机(SVM)筛选得到比较句,实现维吾尔语比较句的识别。实验F值达到70.93%,证明提出的两层识别模型可以有效识别维吾尔语比较句。
展开更多
关键词
维吾尔语
比较句识别
双向CSR挖掘算法
文本分类
在线阅读
下载PDF
职称材料
题名
多策略汉维句子对齐
被引量:
8
1
作者
田生伟
吐尔根.依布
拉
音
禹龙
加米拉.吾守尔
杨飞宇
机构
新疆大学信息科学与工程学院
新疆大学网络中心
新疆大学国际文化交流学院
出处
《计算机科学》
CSCD
北大核心
2010年第4期215-218,292,共5页
基金
国家自然科学基金项目(60663006
60963017)
新疆维吾尔自治区高等学校科学研究计划(XJEDU2009I05)资助
文摘
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。
关键词
双语语料
错误抑制
句子对齐
混合策略
汉维句子
Keywords
Bilingual corpora,Error curb,Hybrid strategy,Sentence alignment,Chinese-Uyhur sentence
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
维吾尔语依存树库构建及统计分析
被引量:
2
2
作者
麦热哈巴.艾力
吐尔根.依布
拉
音
加米拉.吾守尔
机构
新疆大学信息科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2018年第11期8-15,共8页
基金
新疆少数民族科技人才特殊培养计划(201423120)
国家973计划(2014CB340506)
文摘
本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计与实现。然后根据《维吾尔语依存树库标注手册》人工标注了3 400多条句子并从三个角度对依存树库信息做了统计分析。
关键词
依存句法
依存树库
维吾尔语
Keywords
dependency syntax
dependency treebank
Uyghur
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
维吾尔语比较句识别研究
3
作者
王慧云
禹龙
田生伟
加米拉.吾守尔
冯冠军
机构
新疆大学信息科学与工程学院
新疆大学网络中心
新疆大学软件学院
新疆大学人文学院
出处
《中文信息学报》
CSCD
北大核心
2016年第1期148-155,共8页
基金
国家自然科学基金(61262064
60963017
+6 种基金
61063026
61063043
61331011
61563051)
国家社科基金资助项目(10BTQ045
11XTQ007)
自治区教育厅高等院校重点项目(XJEDU2011I08)
文摘
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bidirectional CSR Mining),以挖掘的模式为特征,利用支持向量机(SVM)筛选得到比较句,实现维吾尔语比较句的识别。实验F值达到70.93%,证明提出的两层识别模型可以有效识别维吾尔语比较句。
关键词
维吾尔语
比较句识别
双向CSR挖掘算法
文本分类
Keywords
Uyghur
comparative sentences identification
bidirectional CSR mining algorithm
text classification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多策略汉维句子对齐
田生伟
吐尔根.依布
拉
音
禹龙
加米拉.吾守尔
杨飞宇
《计算机科学》
CSCD
北大核心
2010
8
在线阅读
下载PDF
职称材料
2
维吾尔语依存树库构建及统计分析
麦热哈巴.艾力
吐尔根.依布
拉
音
加米拉.吾守尔
《中文信息学报》
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
3
维吾尔语比较句识别研究
王慧云
禹龙
田生伟
加米拉.吾守尔
冯冠军
《中文信息学报》
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部