-
题名领域特征词的提取方法研究
被引量:13
- 1
-
-
作者
于娟
党延忠
-
机构
大连理工大学系统工程研究所
-
出处
《情报学报》
CSSCI
北大核心
2009年第3期368-373,共6页
-
基金
国家高技术研究发展计划(863计划)资助项目(项目号:2008AA042107).
-
文摘
本文提出领域特征词(Domain Feature,DF)的概念,将其定义为:描述领域的最恰当的词语。由一个领域中所有领域特征词组成的集合称为领域特征词集(Domain Feature Set,DFs)。为提高领域特征词集提取的效率和结果的客观性,本文给出一种以人机交互方式从自然语言语料库中提取的方法。该方法综合了长度优先切词算法和领域隶属度分析算法,前者保证召回率,后者提高准确率。实验证明,给定合适前景语料与背景语料,该方法能够显著提高领域特征词集构建的性能。领域特征词及其提取方法可以广泛地应用于信息和情报处理领域。
-
关键词
领域特征词
领域隶属度
长度优先切词
-
Keywords
domain feature, DMD analysis, length first segment
-
分类号
G254.0
[文化科学—图书馆学]
TS202.3
[轻工技术与工程—食品科学]
-