期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于双语协同训练的最大名词短语识别研究 被引量:5
1
作者 李业刚 黄河燕 +2 位作者 史树敏 鉴萍 苏超 《软件学报》 EI CSCD 北大核心 2015年第7期1615-1625,共11页
针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的... 针对传统方法对双语最大名词短语识别一致性差以及跨领域识别能力弱的缺点,提出一种基于半监督学习的双语最大名词短语识别算法.利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子这两个数据集看作一个数据集的两个不同的视图进行双语协同训练.在协同训练中,把双语对齐标注一致率作为标记置信度估计依据,进行增量标记数据的选择.实验结果表明:该算法显著提高了双语最大名词短语的识别能力,在跨领域测试和同领域测试中,F值分别比目前最好的最大名词短语识别模型提高了4.52%和3.08%. 展开更多
关键词 最大名词短语 半监督学习 标注投射 双语协同训练 短语识别
在线阅读 下载PDF
基于机器翻译的双语协同关系抽取 被引量:2
2
作者 胡亚楠 惠浩添 +1 位作者 钱龙华 朱巧明 《计算机应用研究》 CSCD 北大核心 2015年第3期662-665,共4页
传统的弱指导关系抽取研究主要集中于单语言内部。为了充分利用语言之间的互补性来减轻对大规模训练数据的需求,提出一种双语协同训练的关系分类方法。针对小规模标注语料和一定规模的未标注语料,通过机器翻译和实体对齐产生关系实例的... 传统的弱指导关系抽取研究主要集中于单语言内部。为了充分利用语言之间的互补性来减轻对大规模训练数据的需求,提出一种双语协同训练的关系分类方法。针对小规模标注语料和一定规模的未标注语料,通过机器翻译和实体对齐产生关系实例的双语视图,最后利用协同训练得到两种语言的分类模型。在ACE RDC 2005中英文语料上的实验表明,双语协同训练方法可以同时提高中文和英文的关系分类性能,并且减少对于标注训练数据量的需求。 展开更多
关键词 双语协同训练 机器翻译 实体对齐
在线阅读 下载PDF
基于平行语料库的双语协同中文关系抽取
3
作者 郭勃 冯旭鹏 +1 位作者 刘利军 黄青松 《计算机应用》 CSCD 北大核心 2017年第4期1051-1055,共5页
针对在中文资源的关系抽取中,由于中文长句句式复杂,句法特征提取难度大、准确度低等问题,提出了一种基于平行语料库的双语协同中文关系抽取方法。首先在中英双语平行语料库中的英文语料上利用英文成熟的句法分析工具,将得到依存句法特... 针对在中文资源的关系抽取中,由于中文长句句式复杂,句法特征提取难度大、准确度低等问题,提出了一种基于平行语料库的双语协同中文关系抽取方法。首先在中英双语平行语料库中的英文语料上利用英文成熟的句法分析工具,将得到依存句法特征用于英文关系抽取分类器的训练,然后与利用适合中文的n-gram特征在中文语料上训练的中文关系抽取分类器构成双语视图,最后再依靠标注映射后的平行语料库,将彼此高可靠性的语料加入对方训练语料进行双语协同训练,最终得到一个性能更好的中文关系抽取分类模型。通过对中文测试语料进行实验,结果表明该方法提高了基于弱监督方法的中文关系抽取性能,其F值提高了3.9个百分点。 展开更多
关键词 弱监督学习 关系抽取 N-GRAM 平行语料库 双语协同训练
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部