期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向学术资源的术语区分能力的测度方法研究 被引量:7
1
作者 王昊 唐慧慧 +2 位作者 张海潮 张进 张紫玄 《情报学报》 CSSCI CSCD 北大核心 2019年第10期1078-1091,共14页
改进索引术语质量的衡量方法可以有效提高IR系统的检索效率,但术语的固有属性易受文档长度影响,难以全面衡量术语质量。对此,本文从术语内在的区分性出发,借鉴词袋模型的基本思想,提出了术语区分能力(term discriminative capacity,TDC... 改进索引术语质量的衡量方法可以有效提高IR系统的检索效率,但术语的固有属性易受文档长度影响,难以全面衡量术语质量。对此,本文从术语内在的区分性出发,借鉴词袋模型的基本思想,提出了术语区分能力(term discriminative capacity,TDC)这一理论及3种不同的计算方法。本文还采集了Web of Science的3个子数据库中包含4个著录项的900条记录作为实验数据,来实现TDC的大规模计算,并观察3种算法在实践中的差异。经过实验分析得出,计算术语区分能力的最佳方法为TDC-T,该算法在多个方面表现稳定,且不受DF值的影响,可以作为衡量术语质量的全新指标,记为TDC。但是本研究所选取的A&HCI数据库的记录较少,这或许会造成另两个领域计算结果的失衡。 展开更多
关键词 索引术语 词袋模型 术语区分能力 术语空间密度 术语质量评价
在线阅读 下载PDF
系统视角下的信息检索思考
2
作者 张进 陆伟 吴雪峰 《图书情报知识》 CSSCI 北大核心 2010年第6期66-71,共6页
信息检索自提出到现在,相关的理论不断丰富,发展空间不断增大,学科体系逐渐庞大。本文系统地阐述了信息检索的系列问题,包括信息检索的历史、相关的概念、信息检索的核心内容(包括信息检索模型、词权重算法、相似性算法及聚类算法)、信... 信息检索自提出到现在,相关的理论不断丰富,发展空间不断增大,学科体系逐渐庞大。本文系统地阐述了信息检索的系列问题,包括信息检索的历史、相关的概念、信息检索的核心内容(包括信息检索模型、词权重算法、相似性算法及聚类算法)、信息检索途径与宏/微观信息的关系、基于语言学的信息检索、信息检索领域的研究前沿,以利于领域研究者更好地开展研究工作,促进信息检索的长足发展。 展开更多
关键词 信息检索 信息检索模型 信息检索途径
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部