-
题名倒排索引中的文档序号重排技术综述
被引量:4
- 1
-
-
作者
史亮
张鸿
刘欣然
王勇
王斌
-
机构
国家计算机网络应急技术处理协调中心
中国科学院信息工程研究所
-
出处
《中文信息学报》
CSCD
北大核心
2015年第2期24-32,共9页
-
基金
国家973重点基础研究发展规划项目(2011CB302605)
科技支撑计划(2012BAH47B04)
-
文摘
倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高的压缩率。整数编码研究通过不断改进编码算法来充分利用倒排表的局部连续性特征,而文档序号重排正是一种对文档序号重新排列来产生局部连续性的技术。通过文档序号重排,索引压缩率得到显著提高。该文主要介绍近年来文档序号重排技术取得的研究成果:首先介绍索引压缩的基本原理,然后详细介绍文档序号重排技术,包括分析、对比各个方法的优劣;最后对文档序号重排技术进行总结、整理和展望。
-
关键词
搜索引擎
性能优化
索引压缩
文档序号重排
局部连续性
-
Keywords
search engine
performance optimization
index compression
document identifier reordering
locality
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名可视化XHTML合同文档编辑器的实现技术
- 2
-
-
作者
孔小宝
王成耀
-
机构
北京科技大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2005年第10期2814-2816,共3页
-
文摘
对可视化XHTML合同文档编辑器的关键实现技术进行了研究,描述了利用遍历有序树和隐藏节点、逐行推移分页等技术实现了对文档条款的序号重排、条款的提升与降级以及文档分页显示等关键算法。该编辑器已经成功地应用在美国在线房地产商务网站上。
-
关键词
XHTML
文档对象模型
编辑器
序号重排
-
Keywords
XHTML
DOM
editor
format
-
分类号
TP317.2
[自动化与计算机技术—计算机软件与理论]
-