-
题名基于示例的中文文本过滤模型
被引量:13
- 1
-
-
作者
林鸿飞
姚天顺
-
机构
大连理工大学计算机科学与工程系
东北大学计算机科学与工程系
-
出处
《大连理工大学学报》
CAS
CSCD
北大核心
2000年第3期375-378,共4页
-
文摘
简要描述了文本过滤的背景 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模板 ,然后进行文本过滤 .在用户反馈的基础上 ,扩充示例文本数量 ,进而采用基于潜在语义标注的文本过滤方法 ,改进用户模板 ,提高过滤效率 .
-
关键词
广西结构
潜在语义索引
中文文本过滤模型
TREC
-
Keywords
semantic information/text filtering
text structure analysis
latent semantic indexing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-