期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
索引时间戳:一种高效的文本索引系统设计方法 被引量:2
1
作者 刘秦毅 《计算机工程与科学》 CSCD 1994年第2期1-6,共6页
特征文件索引、时间戳排序技术是数据库技术研究方面的两个重要课题,前者通常用于支持文本数据的索引和检索操作,后者为实现数据库并发控制的两个基本方法之一。本文主要讨论面向文本数据库管理系统(FIMS)基于索引时间戳概念的... 特征文件索引、时间戳排序技术是数据库技术研究方面的两个重要课题,前者通常用于支持文本数据的索引和检索操作,后者为实现数据库并发控制的两个基本方法之一。本文主要讨论面向文本数据库管理系统(FIMS)基于索引时间戳概念的文本对象索引模型的形式化描述、检索相关性计算及特征文件系统逻辑设计等问题。 展开更多
关键词 文本索引系统 设计方法 时间戳
在线阅读 下载PDF
基于概念空间的文本语义索引 被引量:7
2
作者 李源 郑毅 +1 位作者 何清 史忠植 《计算机科学》 CSCD 北大核心 2002年第1期20-22,共3页
1 引言据统计,在现今的联机存储信息中,80%以上的信息以文本的形式存在.信息的多元化、复杂化,致使信息的自动索引成为急需解决的问题.本文研究的内容是建立一个基于概念空间的文本语义索引.
关键词 概念空间 文本语义索引 HOPFIELD神经网络 索引 INTERNET 信息检索
在线阅读 下载PDF
OIQ-tree:一种支持大规模空间文本数据流上连续k近邻查询的索引 被引量:4
3
作者 杨茸 牛保宁 《计算机学报》 EI CAS CSCD 北大核心 2021年第8期1732-1750,共19页
空间文本数据流上连续k近邻查询(Continuous k-nearest neighbor Queries over Spatial-Textual data streams,CkQST)能在空间文本对象组成的数据流上检索并实时更新k个包含指定关键字的空间邻近对象,是空间文本数据流上连续查询(Contin... 空间文本数据流上连续k近邻查询(Continuous k-nearest neighbor Queries over Spatial-Textual data streams,CkQST)能在空间文本对象组成的数据流上检索并实时更新k个包含指定关键字的空间邻近对象,是空间文本数据流上连续查询(Continuous Queries over Spatial-Textual data streams,CQST)的一种,以预订(subscribe)的方式广泛应用于广告定位、微博分析、地图导航等领域.求解CkQST采用CQST的求解框架——构建空间文本混合索引组织查询,利用索引的空间过滤和文本过滤能力,为不断到来的对象匹配查询.该框架的求解效率取决于索引的过滤能力,提高索引过滤能力的主要途径是将查询的空间搜索范围映射到索引结构的最小区域,减少需要验证的查询数量.这一途径适用于查询空间搜索范围很少变化的情况.对于CkQST,覆盖k个最邻近对象的空间范围随着符合文本匹配条件的对象的数量的变化而变化,与之对应的索引项需要同步更新,代价高.针对这一问题,本文选择能够高效支持空间范围变化的Quad-tree和关键字查找的倒排索引,构成空间文本混合索引,组织CkQST.在空间过滤方面,提出内存代价模型VUMBCM(Verification and Update of Memory-Based Cost Model,VUMBCM),通过平衡索引更新代价和验证代价,优化查询空间搜索范围到Quad-tree节点的映射.在文本过滤方面,采用基于块的有序倒排索引,组织Quad-tree节点内的查询,以快速定位需要验证的查询,避免对倒排列表中大量不可能匹配查询的访问;批量处理包含共同文本项的对象,提高文本验证时的对象吞吐量.由此构建的混合索引,称为OIQ-tree.实验表明,OIQ-tree中的代价模型及基于块的有序倒排索引能够支持CkQST的高效求解.与目前先进的索引技术相比,当查询规模达到2000万时,因数据流中对象的变化导致的索引平均更新时间降低了46%,数据流中对象的平均处理时间降低了22%. 展开更多
关键词 空间文本查询 数据流 空间文本索引 K近邻 连续查询
在线阅读 下载PDF
汉英法律文献的子条级自动索引和对齐 被引量:2
4
作者 吕学强 李清隐 +1 位作者 陈文亮 姚天顺 《中文信息学报》 CSCD 北大核心 2002年第4期52-59,共8页
本文提出了基于结构标识的法律文献层次结构模型 ,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性。根据该模型实现了汉英法律文献的子条级自动索引和对齐 ,系统具有纠错和容错能力。实验结果表明每篇文献的平... 本文提出了基于结构标识的法律文献层次结构模型 ,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性。根据该模型实现了汉英法律文献的子条级自动索引和对齐 ,系统具有纠错和容错能力。实验结果表明每篇文献的平均索引时间为 3 31ms ,对齐准确率为 98 6 %。与基于词汇的方法结合后 ,对齐准确率为 99 3%。 展开更多
关键词 法律文献 子条级自动索引 文本索引 文本对齐 结构标识 层次结构模型 汉语 英语
在线阅读 下载PDF
基于位置的web搜索索引研究 被引量:1
5
作者 周英华 金培权 +1 位作者 岳丽华 龚育昌 《中国科学技术大学学报》 CAS CSCD 北大核心 2007年第2期147-152,共6页
针对基于位置的web搜索需要将网页中位置信息和文本信息相结合进行索引的应用需求,提出了先倒排表再R-tree索引和先R-tree再倒排表索引两种混合索引结构,同时处理文本和位置信息.大规模真实数据集上的实验表明,这两种方法在查询效率上... 针对基于位置的web搜索需要将网页中位置信息和文本信息相结合进行索引的应用需求,提出了先倒排表再R-tree索引和先R-tree再倒排表索引两种混合索引结构,同时处理文本和位置信息.大规模真实数据集上的实验表明,这两种方法在查询效率上明显优于已有的倒排表和R-tree相互独立的索引模式. 展开更多
关键词 基于位置的 WEB搜索 位置索引 文本索引
在线阅读 下载PDF
DICV文本分类研究框架
6
作者 李纲 夏晨曦 《情报学报》 CSSCI 北大核心 2007年第6期803-807,共5页
文本分类实验包括实验文本集准备、文本索引、特征降维、分类以及性能评估等多个步骤,每个步骤都有很多方法可供选择,而每个不同的选择都会对最终的实验结果产生影响。比较同一步骤中适用的不同算法的性能时,需要保证其他步骤使用相... 文本分类实验包括实验文本集准备、文本索引、特征降维、分类以及性能评估等多个步骤,每个步骤都有很多方法可供选择,而每个不同的选择都会对最终的实验结果产生影响。比较同一步骤中适用的不同算法的性能时,需要保证其他步骤使用相同的方法,使它们在相同的条件下运行。本文提出了文本分类的DICV研究框架,该框架包括核心数据(core data)、文本索引(text indexing)、分类算法(classification algorithm)和可视化界面(visualization interface)4个模块。该框架设计的重点在于:①提炼一个统一的文本分类模型,为每个步骤的算法提供一个接口,实现了这个接口的算法就可以通过简单的配置应用于框架中,这使得研究者可以方便地选择各种文本索引、特征降维和分类算法,或添加新的文本集和算法,来完成其需要的文本分类实验。②自动记录文本分类实验各个步骤使用的算法、参数和结果,这使得系统能够将研究者的选择和实验步骤的中间结果记录下来,供研究者在后续研究中使用,可避免不必要的重复性工作,提高文本分类研究的效率。 展开更多
关键词 文本分类 文本索引 特征降维
在线阅读 下载PDF
空间多关键词Skyline查询算法 被引量:4
7
作者 李星罗 秦小麟 +2 位作者 王宁 周杨淏 鲍斌国 《小型微型计算机系统》 CSCD 北大核心 2019年第10期2175-2181,共7页
近年来,随着用户对于查询偏好性需求的增加,基于关键词的Skyline查询逐渐成为研究热点.针对实际应用中用户从当前空间位置及对象文本属性多角度审视某一数据集的需求,充分研究空间多关键词Skyline查询问题.在分析现有查询算法的不足基础... 近年来,随着用户对于查询偏好性需求的增加,基于关键词的Skyline查询逐渐成为研究热点.针对实际应用中用户从当前空间位置及对象文本属性多角度审视某一数据集的需求,充分研究空间多关键词Skyline查询问题.在分析现有查询算法的不足基础上,建立了基于加权距离的空间文本支配模型,并提出了一种空间文本索引结构STR-Tree.该索引将空间区域信息与区域内的对象文本信息相结合,对查询无关区域进行快速且有效的剪枝.在此基础上,给出了一种空间多关键词Skyline查询算法SKS,通过采用最小值过滤等剪枝策略,进一步提升查询效率.最后,分别采用模拟数据集和真实数据集进行实验,结果表明SKS算法可以高效地处理空间多关键词Skyline查询. 展开更多
关键词 SKYLINE查询 空间关键词 空间文本索引 空间数据库
在线阅读 下载PDF
《仓央嘉措情歌》用词特征分析
8
作者 董颖红 《云南师范大学学报(哲学社会科学版)》 CSSCI 2006年第5期112-115,共4页
本文利用计算机作为分析工具,对流传在藏族地区的第六世达赖喇嘛创作的《仓央嘉措情歌》进行了词频统计和文本搭配索引,并根据计算机的处理结果对《仓央嘉措情歌》的用词特点作出了简要分析。
关键词 词频统计 文本索引 仓央嘉措情歌
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部