期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
多策略汉维句子对齐 被引量:8
1
作者 田生伟 吐尔根.依布 +2 位作者 禹龙 加米拉.吾守尔 杨飞宇 《计算机科学》 CSCD 北大核心 2010年第4期215-218,292,共5页
提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误... 提出了一种错误抑制的多策略算法对齐汉维语句子。针对长度对齐算法无法避免错误蔓延的特点,提出了一种新的错误蔓延抑制策略:利用双语语料的词汇共现信息,自动抽取汉维语词汇搭配,结合句子长度特征,寻找1:1模式的句对作为锚点,将错误蔓延抑制在锚点内;在锚点之间,利用标点符号和长度混合方法进行句子对齐。算法实验结果验证了该多策略算法寻找的锚点的精度高,有效抑制了对齐错误的蔓延;采用的混合对齐算法,避免了基于词汇对齐算法的高时间复杂度的弱点,比传统的对齐算法性能有了较大提高,对齐准确率由95.0%提高到97.6%,召回率由96.8%提高到98.2%,采用的对齐正确性评价算法可以有效发现自动对齐中的噪音对齐。 展开更多
关键词 双语语料 错误抑制 句子对齐 混合策略 汉维句子
在线阅读 下载PDF
维吾尔语依存树库构建及统计分析 被引量:2
2
作者 麦热哈巴.艾力 吐尔根.依布 加米拉.吾守尔 《中文信息学报》 CSCD 北大核心 2018年第11期8-15,共8页
本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计... 本着构建维吾尔语依存树库的目的,该文根据黏着性语言的结构特点及其在依存属性中对依存角色的影响,提出构建维吾尔语依存树库时需要考虑的几点要素。其包含依存粒度的确定、维吾尔语依存关系、标注原则、依存树结构以及标注工具的设计与实现。然后根据《维吾尔语依存树库标注手册》人工标注了3 400多条句子并从三个角度对依存树库信息做了统计分析。 展开更多
关键词 依存句法 依存树库 维吾尔语
在线阅读 下载PDF
维吾尔语比较句识别研究
3
作者 王慧云 禹龙 +2 位作者 田生伟 加米拉.吾守尔 冯冠军 《中文信息学报》 CSCD 北大核心 2016年第1期148-155,共8页
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bi... 识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bidirectional CSR Mining),以挖掘的模式为特征,利用支持向量机(SVM)筛选得到比较句,实现维吾尔语比较句的识别。实验F值达到70.93%,证明提出的两层识别模型可以有效识别维吾尔语比较句。 展开更多
关键词 维吾尔语 比较句识别 双向CSR挖掘算法 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部