期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种面向术语抽取的短语过滤技术 被引量:7
1
作者 周浪 冯冲 黄河燕 《计算机工程与应用》 CSCD 北大核心 2009年第19期9-11,共3页
在术语抽取工作中,经常会遇到一些包含活跃词汇的短语或短语碎片,这些干扰项一般具有稳定的搭配模式,并且在语料中共现的概率也非常高。常用的短语过滤方法都是侧重于计算短语内部词语之间的黏合度,对这些干扰项的鉴别能力并不强。提出... 在术语抽取工作中,经常会遇到一些包含活跃词汇的短语或短语碎片,这些干扰项一般具有稳定的搭配模式,并且在语料中共现的概率也非常高。常用的短语过滤方法都是侧重于计算短语内部词语之间的黏合度,对这些干扰项的鉴别能力并不强。提出了一种基于左右熵的短语过滤方法,估算出短语或短语碎片中词语的活跃度,并过滤掉活跃度较高的短语或短语碎片。将该方法应用到一个术语抽取系统中,实验证实能够有效去除这些干扰项,提升术语抽取系统的性能。 展开更多
关键词 术语抽取 短语过滤 左右熵 活跃因子
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部