期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于U-tree的不确定移动对象索引策略 被引量:11
1
作者 丁晓锋 卢炎生 +2 位作者 潘鹏 洪亮 魏琼 《软件学报》 EI CSCD 北大核心 2008年第10期2696-2705,共10页
通过在U-tree中添加时间戳和速度矢量等时空因素,提出一种基于U-tree的高效率当前及未来不确定位置信息检索的索引结构TPU-tree,可以支持多维空间中不确定移动对象的索引,并提出了一种改进的基于p-bound的MP_BBRQ(modifiedp-bound based... 通过在U-tree中添加时间戳和速度矢量等时空因素,提出一种基于U-tree的高效率当前及未来不确定位置信息检索的索引结构TPU-tree,可以支持多维空间中不确定移动对象的索引,并提出了一种改进的基于p-bound的MP_BBRQ(modifiedp-bound based range query)域查询处理算法,能够引入搜索区域进行预裁剪以减少查询精炼阶段所需代价偏高的积分计算.实验仿真表明,采用MP_BBRQ算法的TPU-tree概率查询性能极大地优于传统的TPR-tree索引,且更新性能与传统索引大致相当,具有良好的实用价值. 展开更多
关键词 移动对象位置管理 索引结构 不确定性数据 TPU树 MP_BBRQ(modified p-bound based range query)算法
在线阅读 下载PDF
基于倒排索引的正则路径查询算法 被引量:1
2
作者 夏秀峰 孙翔天 +3 位作者 孙尧 邓国鹏 朱康 邱涛 《计算机工程与设计》 北大核心 2024年第8期2343-2349,共7页
对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快... 对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快速检索标签的相应倒排列表。设计的IRPQ算法将查询转化为面向倒排列表的查询计划树,经过优化以减少冗余列表合并操作。在真实数据集上进行了实验,其结果表明,IRPQ及其优化算法相比现有方法显著提高了查询性能。 展开更多
关键词 属性图模型 正则路径查询 倒排索引 查询计划树 树结构递归 启发式算法 查询树优化
在线阅读 下载PDF
基于篇章结构的文本自动标引算法 被引量:9
3
作者 张美娜 迟呈英 +1 位作者 战学刚 亓超 《计算机应用与软件》 CSCD 北大核心 2008年第9期122-124,共3页
通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示。给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自... 通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示。给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自动文摘后续工作给予了很大帮助。 展开更多
关键词 篇章结构 文本结构树 标引算法
在线阅读 下载PDF
汉语文本形式结构分析及其标引算法 被引量:5
4
作者 单永明 《中文信息学报》 CSCD 北大核心 2002年第2期14-19,26,共7页
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念 ,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法 ,提出了规范的与准规范的文本等概念 ,并以此为基础讨论了文本形式结构的标引问题 ,给出了两个标引算法。
关键词 中文信息处理 文本结构分析 标引树 自动标引算法 汉语文本分析 文本形式结构
在线阅读 下载PDF
用户相关反馈下的空间关键字语义查询方法 被引量:2
5
作者 孟祥福 赵路路 +1 位作者 张霄雁 李盼 《小型微型计算机系统》 CSCD 北大核心 2019年第12期2650-2656,共7页
现有的空间关键字查询方法通常根据查询关键字在空间对象文本信息中的出现频率进行文本相关度评估,没有考虑用户对不同查询关键字的偏好程度,并且也没有考虑语义相关性.为解决上述问题,本文提出一种基于用户相关反馈的空间关键字个性化... 现有的空间关键字查询方法通常根据查询关键字在空间对象文本信息中的出现频率进行文本相关度评估,没有考虑用户对不同查询关键字的偏好程度,并且也没有考虑语义相关性.为解决上述问题,本文提出一种基于用户相关反馈的空间关键字个性化语义查询方法.该方法分为离线处理和在线处理两个阶段,在离线处理阶段,采用Gibbs算法估计空间对象文本信息的主题概率分布,进而利用LDA模型对空间数据集进行语义扩展.在线查询处理阶段,对于用户的初始查询条件,首先利用IR-tree混合索引结构从扩展后的空间数据库中获得候选查询结果;然后,用户根据个人偏好在候选集中明确标注出相关的查询结果(即相关反馈),根据用户的反馈信息,采用Rocchio算法对用户初始查询条件进行更新,使得新的查询条件更贴近用户实际需求和偏好;利用更新后的查询条件再进行检索,从而得到新的候选集,重复执行反馈过程,直到查询结果令用户满意为止.实验结果表明,本文提出的基于用户相关反馈的空间关键字语义查询方法可以有效捕获用户隐式偏好并体现语义相关性,在一定程度上提高了空间关键字查询结果的个性化程度和准确率. 展开更多
关键词 空间数据库 Rocchio算法 IR-tree混合索引结构 用户反馈 top-k排序
在线阅读 下载PDF
一种新的基于B^+树结构索引的XML元素的连接算法 被引量:1
6
作者 郭松涛 朱征宇 《计算机工程与应用》 CSCD 北大核心 2004年第10期57-59,67,共4页
该文通过对传统的NumberingSchema进行改进,并结合B+树提出了一种新的索引———B+树结构索引。在B+树结构索引的基础上提出了一种有效的连接算法,该算法通过削减不参加连接的元素来实现快速、有效的连接。
关键词 B^+树结构索引 Numbering SCHEMA 连接算法 XML
在线阅读 下载PDF
泰森多边形与传统四株树法的天然红树林空间结构比较研究 被引量:7
7
作者 乐通潮 《中南林业科技大学学报》 CAS CSCD 北大核心 2021年第2期35-42,53,共9页
【目的】以漳江口红树林为研究对象,利用泰森多边形和四株树法划分天然红树林林木平面空间分布结构,确定对象木的最邻近竞争木,计算林分空间结构指数,对比分析两种方法的异同,探讨泰森多边形法应用红树林林分空间结构量化的适用性。【... 【目的】以漳江口红树林为研究对象,利用泰森多边形和四株树法划分天然红树林林木平面空间分布结构,确定对象木的最邻近竞争木,计算林分空间结构指数,对比分析两种方法的异同,探讨泰森多边形法应用红树林林分空间结构量化的适用性。【方法】设置20 m×20 m样地,每木调查时用钢尺测量横纵坐标,在坐标纸上标记调查木的位置和编号,同时在调查表上记录树种、树高、胸径等林分因子。利用ArcGIS软件,将外业调查的坐标纸上的样木位置图矢量化形成样木点图层,将林分因子调查表导入样木属性表,并由调查木的点位置生成泰森多边形。用VBA编程来计算林分空间结构指数:混交度、大小比数、角尺度。【结果】在福建漳江口红树林国家自然保护区选择样地进行试验,对比分析基于泰森多边形法与传统的四株树法的计算结果,结果表明:1)基于泰森多边形法确定的林分空间结构单元由1株对象木和3~12株竞争木构成,平均值为6株。2)两种方法计算的混交度的相关系数为0.828,大小比数的相关系数为0.881,角尺度的相关系数为0.225。这两种方法计算的混交度和大小比数具有较高的相关性和一致性,而角尺度,两者差异较大。3)基于泰森多边形法与四株树法的不同树种的混交度和大小比数平均值非常接近,混交度最大差0.05,大小比数最大差0.02;角尺度差异较大,最大差值达0.11;泰森多边形法计算的混交度比四株树法的略大一些,而大小比数和角尺度则略小一些。【结论】无论从单株还是从整个调查林分上看,基于泰森多边形法计算的混交度和大小比数与传统四株树法的计算结果差异小,两种方法有较高的相关性和一致性,但其中泰森多边形法与四株树法相比,混交度略大,大小比数略小;而对于角尺度,两种方法的计算结果有较大的差异,并且泰森多边形法的计算结果值小于四株树法。这种差异的根源在于泰森多边形法确定的竞争木数量波动。泰森多边形法通过最邻近原则将平面空间进行划分,不重不漏,对于量化表达林木在空间上的竞争关系具有合理性和有效性,同时外业调查时不需要判断对象木的最邻近竞争木以及距离量算和角度测量,大幅减轻外业调查工作量,适用于天然红树林林分空间结构研究。 展开更多
关键词 红树林 泰森多边形法 四株树法 林分空间结构 竞争指数
在线阅读 下载PDF
一类规范文本篇章结构的自动标引 被引量:4
8
作者 单永明 《中文信息学报》 CSCD 北大核心 1998年第4期47-52,共6页
本文通过对汉语文本中标题和段的级、标题的型等概念的描述与分析,讨论了汉语文本篇章结构的标引问题,提出了规范文本的概念,并给出了规范文本篇章结构的一种标记方法,在此基础上,讨论并实现了规范文本篇章结构的自动标引,给出了... 本文通过对汉语文本中标题和段的级、标题的型等概念的描述与分析,讨论了汉语文本篇章结构的标引问题,提出了规范文本的概念,并给出了规范文本篇章结构的一种标记方法,在此基础上,讨论并实现了规范文本篇章结构的自动标引,给出了标引算法。 展开更多
关键词 中文信息处理 文本自动分析 自动标引 篇章结构
在线阅读 下载PDF
应用于结构化文本的检索系统的设计和实现
9
作者 王剑 周之英 肖慧勇 《计算机工程与应用》 CSCD 北大核心 2003年第19期133-135,共3页
该文介绍了一个应用于结构化文本的检索系统的设计和实现。根据结构化文本的自身特点,提出了文本层次划分的思想,通过层次划分,文本被切分成有结构信息和有独立思想内容的文本单元。在此基础上,对检索词实现结构化索引,同时采用层次匹... 该文介绍了一个应用于结构化文本的检索系统的设计和实现。根据结构化文本的自身特点,提出了文本层次划分的思想,通过层次划分,文本被切分成有结构信息和有独立思想内容的文本单元。在此基础上,对检索词实现结构化索引,同时采用层次匹配嵌套查询的方法来实现用户自然语言的提问查询。用户查询处理中还综合运用了查询结果优化、相似查询、二次查询及反馈评分的技术。 展开更多
关键词 信息检索 结构化文本 文本层次划分 结构化索引 层次匹配算法
在线阅读 下载PDF
基于网格索引结构的TNN查询算法
10
作者 孙焕良 田春曼 《沈阳建筑大学学报(自然科学版)》 CAS 2008年第5期900-903,共4页
目的应用网格索引结构实现TNN查询算法,提高查询效率.方法将首次查询到的TNN路径长设为探测距离,利用它缩小有效查询区域,随着查询的进行,不断更新探测距离,直至终止条件到达查询结束.结果实验表明,在同等条件下,利用网格索引比利用R-t... 目的应用网格索引结构实现TNN查询算法,提高查询效率.方法将首次查询到的TNN路径长设为探测距离,利用它缩小有效查询区域,随着查询的进行,不断更新探测距离,直至终止条件到达查询结束.结果实验表明,在同等条件下,利用网格索引比利用R-tree索引结构进行查询的效率至少高一倍,而且随着目标点个数的增加,优势更加明显.结论运用网格索引并选择合适的网格粒度实现TNN查询优于运用R-tree索引实现的算法. 展开更多
关键词 TNN算法 R—tree索引结构 网格索引结构 网格粒度
在线阅读 下载PDF
基于计数型布隆过滤器的文本检索模型 被引量:5
11
作者 冯加军 王晓琳 田青 《计算机工程》 CAS CSCD 2014年第2期58-61,共4页
分布式文本检索系统难以兼顾高效率的数据检索和低成本的索引维护。为此,提出一种基于计数型布隆过滤器的文本检索模型CBFTRM。该模型将物理节点分为数据节点和索引节点,分别采用结构化P2P进行网络覆盖。每个数据节点负责存储文档数据... 分布式文本检索系统难以兼顾高效率的数据检索和低成本的索引维护。为此,提出一种基于计数型布隆过滤器的文本检索模型CBFTRM。该模型将物理节点分为数据节点和索引节点,分别采用结构化P2P进行网络覆盖。每个数据节点负责存储文档数据并维护与之相应的倒排索引,同时通过倒排索引中的关键词集合计算出计数型布隆过滤器值,发送给相应的索引节点。每个索引节点建立一棵以部分数据节点的特征信息(包括过滤器值)为叶节点、以过滤器值运算结果为内部节点的搜索树,并在叶节点发生变化时对搜索树进行维护。仿真实验结果表明,该模型文档定位快,索引维护通信量小,而且具有较高的查准率。 展开更多
关键词 计数型布隆过滤器 搜索树 结构化P2P 文本检索 倒排索引
在线阅读 下载PDF
基于新型索引结构的反最近邻查询 被引量:8
12
作者 刘润涛 梁建创 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1335-1346,共12页
为了提高反最近邻问题的查询效率,首先给出了空间数据的最小包围正方形定义和空间数据矩形的4种序的定义.依据这些定义,提出了一种新的空间数据索引结构——基于最小包围正方形和最近邻距离的索引树(index tree based on the minimum bo... 为了提高反最近邻问题的查询效率,首先给出了空间数据的最小包围正方形定义和空间数据矩形的4种序的定义.依据这些定义,提出了一种新的空间数据索引结构——基于最小包围正方形和最近邻距离的索引树(index tree based on the minimum bounding square and the distance of nearest neighbor,MBDNN-tree),该索引结构运用了R-树中分割空间数据的思想,将数据点用其基于最近邻距离的最小包围正方形表示,记为MBSD(minimum bounding square based on nearest neighbor distance),利用多种序关系对原始点集进行划分,从上至下、从左至右地按照结点几何分布以及对应的序关系构造树的各层结点.对建立MBDNN-树所需要的预处理过程以及构造过程的算法进行了详细描述和证明分析,给出了MBDNN-树的性质.在此基础上,给出了MBDNN-树进行反最近邻查询的剪枝规则,进而给出了MBDNN-树进行反最近邻查询的算法及其算法分析.反最近邻查询算法利用了MBDNN-树中同层结点之间的几何有序性,有效地减少了结点的访问数量,从而提高了查询效率.最后对基于此结构的反最近邻查询算法进行实验分析.实验表明:基于MBDNN-树的反最近邻查询算法的查询性能有较大的提高. 展开更多
关键词 MBDNN-树 空间数据库 索引结构 反最近邻 查询算法
在线阅读 下载PDF
基于本体的垂直搜索引擎分类索引模型设计 被引量:3
13
作者 齐鹏 张俊 李冠宇 《计算机工程与设计》 CSCD 北大核心 2010年第23期4999-5003,5011,共6页
为了改善基于关键词的垂直搜索引擎查全率低和相关排序效果不佳的缺点,提出了基于本体的垂直搜索引擎分类索引模型。设计了一种基于领域本体的分类体系,实现了基于该分类体系的细粒度文本分类,并将分类信息写入索引,增加了索引的语义信... 为了改善基于关键词的垂直搜索引擎查全率低和相关排序效果不佳的缺点,提出了基于本体的垂直搜索引擎分类索引模型。设计了一种基于领域本体的分类体系,实现了基于该分类体系的细粒度文本分类,并将分类信息写入索引,增加了索引的语义信息。在lucene原有索引结构的基础上,重新设计了索引的逻辑结构和物理结构,使类别信息和关键词信息合理融合,形成分类索引。最后提出针对该索引的检索算法,并举例验证了该模型的有效性。 展开更多
关键词 本体 文本分类 垂直搜索引擎 分类体系 分类索引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部