-
题名中文网页标引源主题表达能力的调查统计
被引量:29
- 1
-
-
作者
丁璇
侯汉清
章成志
-
机构
南京农业大学信息管理系
-
出处
《大学图书馆学报》
CSSCI
北大核心
2002年第6期70-72,共3页
-
文摘
通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。
-
关键词
标引源
主题表达能力
汉语
网页
主题标引
加权
自动标引
调查
-
Keywords
Web Pages,Automatic Indexing,Weighting Indexing,Economy Science
-
分类号
G254.2
[文化科学—图书馆学]
G250.
[文化科学—图书馆学]
-
-
题名生物学文献自动标引系统的理论和实践
被引量:8
- 2
-
-
作者
韩客松
王永成
王刚
-
机构
上海交通大学图像处理与模式识别研究所
-
出处
《情报学报》
CSSCI
北大核心
2000年第3期259-264,共6页
-
文摘
在统计分析生物学中文文献的一些特点和手工标引的经验的基础上 ,本文介绍了以文献标题和摘要为标引源的自动标引方法。文章着重介绍了折半匹配的抽词和基于非线性加权体系的标引词抽取的理论和实践。
-
关键词
生物学文献
自动标引
折半匹配
非线性加权体系
文献标题
摘要
标引源
标引词抽取
-
Keywords
automatic indexing,binary matching,nonlinear weighting.
-
分类号
G356.6
[文化科学—情报学]
-