期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进DE-Tri-Training算法的汉语多词表达抽取
被引量:
2
1
作者
梁颖红
谭红叶
+3 位作者
鲜学丰
黄丹丹
钱海忠
沈春泽
《数据采集与处理》
CSCD
北大核心
2017年第1期141-148,共8页
多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数...
多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DETri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-Training算法的有效性。
展开更多
关键词
多词表达
半指导
协同训练
在线阅读
下载PDF
职称材料
维吾尔语多词表达抽取方法研究
被引量:
3
2
作者
麦热哈巴.艾力
阿孜古丽.夏力甫
吐尔根.依布拉音
《计算机工程与应用》
CSCD
2014年第8期26-30,共5页
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔...
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔语多词表达抽取方面的影响。根据维吾尔语的特点,将词干作为一项特征加到抽取方法中。语料的选择上考虑了覆盖面及领域,并探讨了它们对抽取方法的影响。
展开更多
关键词
多词表达
互信息
对数似然比
卡方
维吾尔语
在线阅读
下载PDF
职称材料
题名
基于改进DE-Tri-Training算法的汉语多词表达抽取
被引量:
2
1
作者
梁颖红
谭红叶
鲜学丰
黄丹丹
钱海忠
沈春泽
机构
金陵科技学院软件工程学院
山西大学计算机与信息技术学院
苏州市职业大学计算机工程学院
出处
《数据采集与处理》
CSCD
北大核心
2017年第1期141-148,共8页
基金
国家自然科学基金(61100138
61402134
+7 种基金
11601202)资助项目
江苏省"333"工程高层次人才培养(BRA2015108)资助项目
金陵科技学院高层次人才工作启动费(40620022)资助项目
江苏省高校自然科学研究面上(16KJB520013
14KJB520013)资助项目
山西省自然科学基金(2011011016-2)资助项目
山西省回国留学人员科研(2013-022)资助项目
山西省2012年度留学回国人员科技活动择优资助项目
文摘
多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DETri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-Training算法的有效性。
关键词
多词表达
半指导
协同训练
Keywords
multi-word expression
semi-supervised
tri-training
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
维吾尔语多词表达抽取方法研究
被引量:
3
2
作者
麦热哈巴.艾力
阿孜古丽.夏力甫
吐尔根.依布拉音
机构
新疆大学信息科学与工程学院
新疆多语种信息技术重点实验室
新疆大学人文学院
出处
《计算机工程与应用》
CSCD
2014年第8期26-30,共5页
基金
国家自然科学基金(No.61262061)
新疆多语种信息技术重点实验室开放课题
文摘
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔语多词表达抽取方面的影响。根据维吾尔语的特点,将词干作为一项特征加到抽取方法中。语料的选择上考虑了覆盖面及领域,并探讨了它们对抽取方法的影响。
关键词
多词表达
互信息
对数似然比
卡方
维吾尔语
Keywords
collocation
mutual information
log-likelihood
chi-square
Uyghur
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进DE-Tri-Training算法的汉语多词表达抽取
梁颖红
谭红叶
鲜学丰
黄丹丹
钱海忠
沈春泽
《数据采集与处理》
CSCD
北大核心
2017
2
在线阅读
下载PDF
职称材料
2
维吾尔语多词表达抽取方法研究
麦热哈巴.艾力
阿孜古丽.夏力甫
吐尔根.依布拉音
《计算机工程与应用》
CSCD
2014
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部