题名 基于信息网模型的动态数据划分策略
被引量:1
1
作者
陈诗雅
刘梦赤
机构
武汉大学计算机学院
出处
《计算机应用与软件》
北大核心
2018年第11期42-48,共7页
基金
国家自然科学基金面上项目(61672389)
国家杰出青年科学基金(外籍)项目(60688201)
文摘
为了满足大规模数据管理与查询的需要,设计并开发了基于信息网模型INM(Information Networking Model)的分布式并行数据库管理系统。分布式环境下数据的划分方式将影响系统的可扩展性和查询分析效率。根据信息网模型的数据结构和查询特性,设计一种轻量级的数据动态划分方法。该方法结合数据的水平分割和垂直分割,以INM对象为单位,未存储过的数据对象直接划分到当前操作节点,并记录数据对象的存储位置,否则根据数据对象的历史位置信息将其划分到不同的存储节点。同时,单个INM对象可能由于其包含的关联对象增多到一定程度成为大对象,而对系统的性能造成影响,因此将此类大对象分割成多个小对象,并按照一定的策略划分到不同节点进行存储。集群中的每个处理节点被赋予一个负载阈值。随着数据量的增加,如果超过负载阈值则增加新的机器,保证系统的可扩展性和各个处理节点数据量的均衡。实验结果证明,该方法能够保障系统良好的可扩展性,同时提高数据的查询分析效率。
关键词
信息网模型
数据划分
大对象分割
负载阈值
Keywords
Information network model
Data partition
Large object division
Load threshold
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 面向信息网模型的高可扩展性分布式事务处理机制
2
作者
张剑
刘梦赤
机构
武汉大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第11期16-21,26,共7页
基金
国家自然科学基金(61202035)
文摘
为应对数据规模的快速增长,许多数据库管理系统提供了横向水平扩展的特性,但为保证扩展后的性能,大多不能自动维护数据间关联的强一致性。为此,设计一种高可扩展性的分布式事务处理机制。基于信息网模型的语义性和存储特点,根据所接收事务之间的关联度动态控制组提交粒度,从而利用缓存提高吞吐量。同时在子节点和备份节点同时执行相同的事务操作,而不是发送日志进行同步,以提高响应速度。实验结果表明,与两阶段提交协议相比,该机制在保证强事务特性的同时,能够获得近似线性的高扩展性,在系统吞吐量和响应时间方面也有较大改善。
关键词
分布式事务
可扩展性
信息网模型
逻辑组提交
强一致性
Keywords
distributed transaction
scalability
information network model
logic group commitment
strong consistency
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于信息网模型的Web实体语义信息搜索平台
被引量:3
3
作者
夏翠翠
刘梦赤
胡婕
机构
武汉大学计算机学院
湖北大学计算机与信息工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第3期18-23,31,共7页
基金
国家自然科学基金(61202100)
软件工程国家重点实验室开放基金(SKLSE2012-09-20)
文摘
Web上实体信息过于分散且缺乏语义,传统基于关键词匹配的搜索引擎往往因缺少上下文等语义信息,无法搜索到精确的结果。为了对Web数据进行精确查找,使用信息网模型(INM)对Web数据进行语义表示和建模,将实体的所有语义信息组织在一个对象中,快速获取实体完整的语义信息。基于INM构建复杂语义数据库,设计实现一个可对教育领域相关实体信息进行精确搜索的TLDW系统。实验结果表明,该系统初次查询时间均在100 ms内,其搜索结果包含实体的上下文关系等多种语义信息,缓存优化后的搜索结果可在20 ms内完成。
关键词
语义表示和建模
信息网模型
语义关系
推理规则
INM查询语言
语义信息 搜索
Keywords
semantic representation and modeling
Information Network Model (INM)
semantic relationship
inference rule
INM Query Language (IQL)
semantic information searching
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于信息网模型的分布并行多连接查询优化
4
作者
徐晶
刘梦赤
机构
武汉大学软件工程国家重点实验室
武汉大学计算机学院
出处
《计算机应用与软件》
2017年第7期66-73,84,共9页
基金
国家自然科学基金项目(61672389
61202100)
软件工程国家重点实验室开放基金项目(SKLSE2012-09-20)
文摘
在分布式集群系统中,数据根据划分算法存储在集群的各个节点,这为涉及大量连接操作的复杂查询带来了昂贵的网络开销。针对该问题,基于信息网模型INM(Information Network Mode),提出最小通信量查询划分算法和多目标查询优化算法。其中查询划分算法将复杂查询划分成多个PWOC(parallelizable without communication)子查询,所有子查询可近似无通信地并行执行。多目标优化算法将子查询作为查询计划的基本操作,并将并行性和通信代价同时作为驱动目标,以传统多目标加权算法结合贪心策略作为评估依据生成查询计划树。最后,系统基于TPC-H基准生成测试数据,将原始算法与优化算法进行了对比实验,结果表明优化算法可以极大提高复杂查询的效率。
关键词
查询优化
分布并行处理
多连接
信息网模型 (
INM)
Keywords
Query optimization Distributed parallel processing Multi-join Information Network Model(INM)
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 面向OLGP的多维信息网络数据仓库模型设计
被引量:5
5
作者
聂章艳
李川
唐常杰
徐洪宇
张永辉
杨宁
机构
四川大学计算机学院
国家空管自动化系统技术重点实验室
武汉大学软件工程国家重点实验室
出处
《计算机科学与探索》
CSCD
2014年第1期51-60,共10页
基金
国家自然科学基金Nos.61103043
61173099
+5 种基金
国家"十二五"科技支撑计划重点项目No.2012BAG04B02
中央高校基本科研业务费专项资金No.2010SCU11053
四川省科技支撑计划No.2011GZ0223
高等学校博士学科点专项科研基金No.20110181120062
武汉大学软件工程国家重点实验室开放基金No.SKLSE2012-09-26
华为创新计划 No.YJCB2011036RE~~
文摘
信息网络的出现使信息由简单的数值型数据演化成较复杂的图网络结构。如何对基于图的信息网络数据进行良好的组织和存储成为一个亟待解决的问题。利用维建模的方法对基于图的信息网络数据进行模型设计,提出了多维信息网络仓库模型。该模型由边事实表、节点事实表、信息维连接属性表以及拓扑维节点属性表组成,能够为在线图处理提供底层的数据平台。实验表明该模型在消除冗余、查询时间、存储空间上均较泛关系表有明显优势。新模型在1.25万篇ACM论文上的查询时间稳定在几十毫秒,较泛关系表的查询时间约减少一个数量级。在空间性能上,随着论文数量的增加,该模型存储空间开销的增长速度远小于泛关系表的增长速度。
关键词
信息网 络
信息 维
拓扑维
在线图处理
多维信息网 络数据仓库模型
Keywords
InfoNetwork
informational dimension
topological dimension
online graph processing
multi-dimensionalinformation network datawarehouse model
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 信息网数据库管理系统规则的设计与实现
被引量:2
6
作者
胡启超
刘梦赤
胡婕
机构
武汉大学计算机学院
湖北大学计算机与信息工程学院
出处
《计算机应用与软件》
CSCD
2016年第1期16-20,84,共6页
基金
国家自然科学基金项目(61202100)
国家留学基金项目([2013]3018)
文摘
为了实现信息网数据库管理系统INMDBMS(Information Network Database Management System)的逻辑推理功能,提出了适用于INMDBMS的信息规则语言IRL(Information Rule Language)用于规则的表示。总结Datalog语言中几种传统的递归查询算法,同时结合INMDBMS的数据模型特点,设计并实现了IGQA(INMDB Goal_driven Recursive Query Algorithm)作为IRL规则语言的递归查询算法。IGQA以深度优先、回退的方式来实现递归查询。在真实数据集上的实验表明,当数据规模增长时,IGQA具有较高的执行成功率和较好的执行时间稳定性。
关键词
信息网模型
信息网 数据库管理系统
信息 规则语言
IGQA
Keywords
Information networking model Information network database management system Information rule language IGQA
分类号
TP393.01
[自动化与计算机技术—计算机应用技术]
题名 信息网数据库管理系统的查询优化
被引量:3
7
作者
金铮
刘梦赤
胡婕
机构
武汉大学计算机学院软件工程国家重点实验室
湖北大学计算机与信息工程学院
出处
《计算机科学与探索》
CSCD
北大核心
2015年第3期300-309,共10页
基金
国家自然科学基金
国家留学基金~~
文摘
查询是信息网数据库管理系统的重要组成部分。反向查询是一种被广泛应用,并且十分耗时的查询策略,因为在反向查询中对象名未知,在匹配路径之前需要通过路径反向查得对象。针对反向查询,提出了优化算法,从最后一条有价值的路径单元开始反向查询,利用路径上提供的所有信息,将搜索空间限制至最小,使得花费在路径匹配上的时间减少,查询效率得以提升。最后,原始算法和优化算法进行了对比实验,结果表明了优化算法的优越性。
关键词
信息网模型 (INM)
INM查询语言(IQL)
索引
查询优化
查询策略
搜索空间
Keywords
indexing
query optimization
query strategy
search space
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 一种恶意软件传播的离散概率模型
被引量:3
8
作者
顾亦然
王锁萍
机构
南京邮电大学控制与智能技术研究中心
出处
《电子学报》
EI
CAS
CSCD
北大核心
2010年第4期894-898,共5页
文摘
复杂网络理论为恶意软件传播的研究提供了新的思路和方法.本文针对恶意软件的实际传播机制,提出一种新的离散概率DP-SI模型,该模型可适用于任意网络拓扑.同时提出了一种节点信息网络模型方法,为大规模复杂网络及复杂网络上的传播动力学的仿真,以及离散传播动力学模型的建立,提供了有效的研究平台.仿真结果表明本模型比传统模型更接近现实,对恶意软件的控制具有一定指导意义.
关键词
恶意软件传播
SI模型
免疫
节点信息网 络模型
Keywords
malware propagation
SI model
immunization
node information network model
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 INMDB中复合事件监测机制的设计与实现
被引量:1
9
作者
贺宏达
刘梦赤
机构
武汉大学计算机学院
出处
《计算机应用与软件》
CSCD
2016年第10期41-45,97,共6页
文摘
对于大多数主动数据库来说,复合事件监测始终是个难题。介绍信息网模型INM(Information Network Model)数据库管理系统中的复合事件监测机制,详细描述利用事件树模型监测复合事件的思想,并提供具体的算法实现。经分析,该算法在运行效率和空间占用上均比常见的有限自动机和Petri网有着更好的表现。
关键词
信息网模型
主动数据库
复合事件监测
事件树
Keywords
Information network model (INM)
Active databases
Composite events detection
Event tree
分类号
TP3
[自动化与计算机技术—计算机科学与技术]