-
题名新型标引系统的构建
- 1
-
-
作者
杨亮
王永成
-
机构
上海交通大学计算机系
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第5期1-2,84,共3页
-
基金
国家自然科学基金项目 (编号 :60 0 82 0 0 3)资助
-
文摘
本文中 ,我们提出了一种抽取主题词的新方法 ,它是基于分类系统的 ,并且能与分类系统相互改进与提高。
-
关键词
标引系统
主题词
计算机网络
自动分类
机器标引
文献标引
-
Keywords
Subject word Subject extracting Automatic classification Term weighting
-
分类号
G254.36
[文化科学—图书馆学]
-
-
题名Web页面中文文本主题的自动提取研究
被引量:12
- 2
-
-
作者
韩客松
王永成
滕伟
-
机构
上海交通大学
-
出处
《情报学报》
CSSCI
北大核心
2001年第2期217-223,共7页
-
基金
国家 8 63计划资助!(合同号 :863 30 6 ZD0 3 0 4 1)
-
文摘
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。
-
关键词
Web页面文本
主题抽取
加权
机器标引
主题标引
-
Keywords
Web pages' text,subject extracting,weighting.
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-