期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进DE-Tri-Training算法的汉语多词表达抽取 被引量:2
1
作者 梁颖红 谭红叶 +3 位作者 鲜学丰 黄丹丹 钱海忠 沈春泽 《数据采集与处理》 CSCD 北大核心 2017年第1期141-148,共8页
多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数... 多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DETri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-Training算法的有效性。 展开更多
关键词 多词表达 半指导 协同训练
在线阅读 下载PDF
维吾尔语多词表达抽取方法研究 被引量:3
2
作者 麦热哈巴.艾力 阿孜古丽.夏力甫 吐尔根.依布拉音 《计算机工程与应用》 CSCD 2014年第8期26-30,共5页
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔... 多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔语多词表达抽取方面的影响。根据维吾尔语的特点,将词干作为一项特征加到抽取方法中。语料的选择上考虑了覆盖面及领域,并探讨了它们对抽取方法的影响。 展开更多
关键词 多词表达 互信息 对数似然比 卡方 维吾尔语
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部