期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
初中生课外补习的影响因素研究——基于CEPS的调查数据分析 被引量:24
1
作者 吴翌琳 《教育科学》 CSSCI 北大核心 2016年第5期63-73,共11页
课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年... 课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年级比七年级课外补习的强度更大。课外补习支出与家庭经济水平呈正比例关系。女性比男性的补习参与几率、强度与支出都高。成绩排名越高,父亲受教育程度越高,学生参加补习的几率、强度与支出越大。 展开更多
关键词 课外补习 补习强度 LOGISTIC回归
在线阅读 下载PDF
企业家精神对创新影响的均衡性与差异性研究——基于创新调查与财务数据对接的微观证据 被引量:4
2
作者 吴翌琳 《财经问题研究》 CSSCI 北大核心 2019年第4期113-121,共9页
企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重... 企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重视,创新方式趋于多元化,以实现技术创新与非技术创新的优化组合,其中,企业家创新精神促进技术创新与非技术创新的均衡发展,而企业家教育背景及对创新重视程度对创新的影响具有结构性和差异性;企业家创新决策面临人才支撑不协同、知识产权保护不够和创新政策普惠性低等一系列问题制约,抑制了企业家创新精神的实现。 展开更多
关键词 企业家创新精神 协同创新系统 CDM模型
在线阅读 下载PDF
海量数据分析的One-size-fits-all OLAP技术 被引量:32
3
作者 张延松 焦敏 +2 位作者 王占伟 王珊 周烜 《计算机学报》 EI CSCD 北大核心 2011年第10期1936-1946,共11页
传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的... 传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的性能和并行处理效率的问题.以星型模型上复杂多表连接为基础的OLAP算法的复杂度和并行处理过程中的数据网络传输代价都成为制约性能的重要因素.通过深入分析OLAP存储模型和查询负载特征,提出了对OLAP查询中最基础的SPJGA-OLAP子集在存储、查询处理、数据分布、网络传输和分布式缓存等方面面向海量数据大规模并行处理框架的优化策略和实现技术.通过对TPC-H和SSB两个工业界和学术界公认的测试标准的分析,评估了技术的可行性.提出了以内存predicate-vector DDTA-JOIN算法为核心的并行内存OLAP架构,以维表上规范化的谓词向量操作替代了多样的连接执行计划,实现以一种查询处理模型同时满足集中式处理和大规模并行OLAP处理的需求,充分利用现代计算机的硬件优势,最小化网络传输和OLAP查询处理代价.实验中分析了在1TB和100TB数据集中数据分布策略的存储代价和传输代价,通过并行OLAP代价模型和实际数据的实验测试验证了技术的可行性和并行处理效率. 展开更多
关键词 OLAP 海量数据分析处理 谓词向量 星型模型
在线阅读 下载PDF
大数据时代的统计教育 被引量:89
4
作者 孟生旺 袁卫 《统计研究》 CSSCI 北大核心 2015年第4期3-7,共5页
2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要... 2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要对于推进我国统计类本科专业教育改革具有重要借鉴意义。本文首先概括性地介绍了美国统计学会发布的统计学本科专业指导性教学纲要的核心内容,包括统计专业本科生应该掌握的基本技能和应该修读的主要课程,然后分析了我国统计类本科专业教育存在的问题,并提出了在大数据时代改进我国统计类本科专业教育的几点建议。 展开更多
关键词 统计教育 大数据 课程体系 本科专业
在线阅读 下载PDF
一种基于管算存分离的内存数据库实现技术 被引量:4
5
作者 张延松 韩瑞琛 +1 位作者 刘专 张宇 《计算机学报》 EI CAS CSCD 北大核心 2023年第4期761-779,共19页
在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管... 在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管算存分离方法的内存数据库实现技术,在存算分离技术的基础上进一步根据数据库模式、数据分布与负载计算特征将数据集划分为元数据集和数值集,将统一的查询引擎分解为元数据管理引擎、计算引擎和存储引擎,将包含语义信息的元数据管理抽象为独立的管理层,将无语义的数值存储和计算抽象为计算存储层,其中计算密集型负载定义为计算层,数据密集型负载设计为存储层,并根据硬件平台的不同分离或合并计算与存储层.内存数据库的实现技术分为几个层次:1)模式优化,实现数据库存储中“数(数值)”与“据(元数据)”的分离,根据数据的内在特性选择不同的存储与计算策略;2)模型优化,采用Fusion OLAP模型,实现在关系存储模型上的高性能多维计算;3)算法优化,通过代理键索引、向量索引支持优化的向量连接、向量聚集算法,提高OLAP性能;4)系统设计优化,通过数据库引擎分层技术实现管理与计算分离、存储与计算分离以及多维计算算子下推到存储层.实验结果表明,管算存分离计算模型可以灵活地支持CPU-GPU异构计算平台、DRAM-PM(Persistent Memory,持久内存)异构存储平台和外部存储平台,采用开源的Arrow内存列存储引擎作为数据库“数”的存储引擎,以及应用多维计算算子下推到Arrow存储引擎技术的OLAP实现技术在SSB基准测试中与存算结合的内存OLAP实现技术性能相当,查询性能优于主流内存数据库Hyper和OmniSciDB,以及基于Arrow存储的GPU数据库PG-Strom. 展开更多
关键词 内存数据库 数据分离 存算分离 管算分离 向量索引
在线阅读 下载PDF
内存数据仓库集群技术研究 被引量:2
6
作者 张延松 王珊 周烜 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期117-132,共16页
随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库... 随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库团队在内存数据仓库集群技术方面的研究工作,包括:以列分布和列计算服务为中心的ScaMMDB内存数据仓库集群,以水平分片、并行计算为中心的ScaMMDBⅡ和reverse-star schema分布、集群向量计算为特征的MiNT-OLAP Cluster等技术的研究发展过程.分析了内存数据仓库集群技术的关键问题及技术挑战,并针对新的内存数据仓库集群应用需求展望未来技术的发展. 展开更多
关键词 内存数据仓库 集群 向量计算
在线阅读 下载PDF
内存数据库可控的page-color优化技术研究 被引量:1
7
作者 张延松 王占伟 +1 位作者 孙妍 王珊 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期95-104,共10页
page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能... page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能的扩展或同时依赖于硬件的特殊设计和操作系统扩展功能的支持.提出了应用软件层上基于page-color的W-order扫描优化技术,不依赖特殊的处理器硬件设计,最小化依赖操作系统的扩展功能.研究的核心思想是通过page-color控制弱局部性数据的页面地址访问顺序,将弱局部性数据与强局部性数据在cache中的冲突域由整个地址空间缩小为指定page-color的地址空间内,从而降低整体的cachemiss,降低数据处理时的延迟.与典型的page-coloring技术相比,不需要扩展操作系统内核功能,具有更好的内存地址空间利用率,能够实现查询内数据集粒度上的cache分区优化.实验中模拟了内存数据库中典型的多表连接算法,通过模拟cache行为模式和在实际查询处理时使用cache监测工具验证了W-order区优化技术的可行性与cache性能.实验结果表明,通过在应用软件层次上对顺序访问操作的控制,能够有效地降低cachemiss,提高内存数据库查询处理性能. 展开更多
关键词 内存数据库 cache污染 page-color W-order扫描
在线阅读 下载PDF
有限机会的公平分配 中国农民子女市民化的水平与模式 被引量:11
8
作者 李丁 《社会》 CSSCI 北大核心 2014年第4期91-118,共28页
本文将农民、农民工以及已经获得非农户籍的"新市民"的"农民子女"作为分析对象,以农民子女跨越城乡二元系统的市民化进程来透视中国社会系统的开放性与社会分层流动机制。基于CGSS调查数据等资料的分析表明,改革开... 本文将农民、农民工以及已经获得非农户籍的"新市民"的"农民子女"作为分析对象,以农民子女跨越城乡二元系统的市民化进程来透视中国社会系统的开放性与社会分层流动机制。基于CGSS调查数据等资料的分析表明,改革开放以来,中国农民的职业非农化水平快速提高,但身份市民化机会长期保持不变,两者之间的断裂日益扩大。这种断裂不仅表现在水平上,也表现在分配机制上。职业非农化的途径日益多元化,教育的作用相对弱化,家庭背景有着相对重要的作用。而户籍非农化(身份市民化)因升学之外的传统途径不断收缩,教育成为影响户籍非农化的主要因素,从而保持了有限的户籍非农化机会在农民子女间分配的公平性。 展开更多
关键词 农民子女 市民化 职业非农化 身份市民化
在线阅读 下载PDF
互联网企业广告收入预测研究——基于低频数据的神经网络和时间序列组合模型 被引量:6
9
作者 吴翌琳 南金伶 《统计研究》 CSSCI 北大核心 2020年第5期94-103,共10页
神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别... 神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别拟合各解释变量序列,利用BP模型拟合解释变量和自变量的非线性关系,基于某社交新闻类APP的日广告收入数据进行互联网企业广告收入预测研究。通过与循环神经网络(RNN)模型、长短期记忆神经网络(LSTM)模型等预测结果的对比发现:Holtwinters-BP组合模型的预测精度和稳定性更高;证明多维变量对于广告收入的显著影响,多变量模型的预测准确性高于单变量模型;构建的Holtwinters-BP组合模型对于低频数据预测有较好的有效性和适用性。 展开更多
关键词 广告收入预测 神经网络模型 Holtwinters模型 组合模型
在线阅读 下载PDF
“数据治国”的三个关键理念--从互联网思维到未来治理图景 被引量:7
10
作者 杜小勇 冯启娜 《学术前沿》 CSSCI 2015年第2期49-61,共13页
大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争... 大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争力的重要趋势。支撑这场大数据革命的底层力量,不仅仅是技术革命,更是涉及领导意识、组织文化和行为方式的思维革命。在国家治理层面,尤其需要形成"数据治国"的治理理念,掌握用数据思考和解决社会问题的新方法,最重要的是树立数据思维、互联网思维和计算思维这三种思维方式。 展开更多
关键词 治理现代化 数据治国 计算思维 技术革命
在线阅读 下载PDF
多核处理器下事务型数据库性能优化技术综述 被引量:11
11
作者 朱阅岸 周烜 +3 位作者 张延松 周明 牛嘉 王珊 《计算机学报》 EI CSCD 北大核心 2015年第9期1865-1879,共15页
传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载... 传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载到内存或者闪存等高速存储器中.这样,数据库的性能瓶颈由传统的I/O转移到CPU上.而传统数据库的加锁操作、闩锁竞争、日志管理以及缓冲区管理在设计时均未考虑到多核处理器的使用,因而成为了限制CPU利用率的明显瓶颈.改变传统数据库的优化重点以适应硬件的发展对应用而言是十分必要的.该文针对当前新的应用背景,主要围绕数据库系统中锁管理、日志管理、缓冲区管理以及B树索引等核心模块在多核平台下已有的优化技术进行详细介绍和归纳总结.同时介绍了中国人民大学在数据库系统的多核处理器优化方面所做的一些工作. 展开更多
关键词 数据库系统优化 日志 缓冲区管理 B树
在线阅读 下载PDF
面向多核CPU和GPU平台的数据库星形连接优化 被引量:5
12
作者 刘专 韩瑞琛 +2 位作者 张延松 陈跃国 张宇 《计算机应用》 CSCD 北大核心 2021年第3期611-617,共7页
针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量... 针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。 展开更多
关键词 联机分析处理 星形连接 向量化查询处理 向量压缩技术 异构计算
在线阅读 下载PDF
构建新型高性能与高可用的键值数据库系统 被引量:5
13
作者 朱阅岸 简怀兵 +5 位作者 龙永超 李彬 王树 吴喜亮 钟治初 张延松 《软件学报》 EI CSCD 北大核心 2021年第10期3203-3218,共16页
近年来,写密集型应用程序越来越普遍.如何有效地处理这种工作负载,是数据库系统领域深入研究的方向之一.写操作开销主要由以下两个方面的因素构成:(1)硬件级别,即写操作引起的I/O,目前无法在短时间内消除这种开销;(2)软件开销,即修改内... 近年来,写密集型应用程序越来越普遍.如何有效地处理这种工作负载,是数据库系统领域深入研究的方向之一.写操作开销主要由以下两个方面的因素构成:(1)硬件级别,即写操作引起的I/O,目前无法在短时间内消除这种开销;(2)软件开销,即修改内存数据拷贝以及构造日志记录造成的多次写操作.日志即数据(log-as-database,称其为单拷贝系统)的架构能够减少写操作引起的I/O,同时降低软件方面的开销.目前,业界对单拷贝系统展现出浓厚的兴趣.现有的单拷贝系统大部分建立在特殊的基础设施之上,例如infiniband或NVRam(非易失性随机存取存储器),这种基础设施尚未达到广泛可用或者是依托他系统(例如Dynamo)构建,这种方法缺乏灵活性与普适性.在商用机器环境中,自底向上构建了一个称为LogStore的键值数据库系统,采用log-as-database设计理念,以充分利用单拷贝系统的优点,在提升写操作性能的同时,有效缩短主备数据之间的差距.在系统中内嵌复制协议达到高可用性而不是依赖其他系统,使得系统灵活可控.系统新颖的查询执行模型将执行线程与特定分片绑定,结合多版本并发控制技术,以无锁的方式消除读写冲突、写写冲突以及上下文切换开销.用YCSB对系统性能进行了详细的评估,对比主流的键值系统HBase以及单拷贝系统实现LogBase,LogStore在写密集型工作负载上性能要优4倍左右.在崩溃恢复方面,LogStore可在1分钟之内完成TB级别数据规模的恢复,比LogBase要快1个数量级以上. 展开更多
关键词 单拷贝系统 复制协议 写优化 恢复 细粒度缓冲区管理
在线阅读 下载PDF
诈骗与信任的社会机制分析——以中国台湾跨境电信诈骗现象为例 被引量:20
14
作者 唐丽娜 王记文 《学术论坛》 CSSCI 北大核心 2016年第5期97-103,共7页
文章使用2012年东亚社会调查(EASS)数据,对中国大陆、日本、韩国和中国台湾民众的社会信任度进行对比,发现中国大陆、日本、韩国以及中国台湾民众对熟人的信任度差距较小,而对公共权威的信任存在较大差异,这说明了针对中国大陆的中国台... 文章使用2012年东亚社会调查(EASS)数据,对中国大陆、日本、韩国和中国台湾民众的社会信任度进行对比,发现中国大陆、日本、韩国以及中国台湾民众对熟人的信任度差距较小,而对公共权威的信任存在较大差异,这说明了针对中国大陆的中国台湾跨境电信诈骗现象的发生机制不是基于居民对熟人的信任,而是基于居民对权威部门的信任,即中国大陆民众对公共权威部门具有较高的信任度,因而更容易陷入诈骗集团的圈套;同时,中国台湾民众对公共权威部门的信任度较低,加之中国台湾公共权威部门对电信诈骗惩治力度不够,致使中国台湾籍电信骗子泛滥。因此政府应为居民提供足够的保护,两岸携手共同打击跨境电信诈骗。 展开更多
关键词 电信诈骗 社会信任 东亚社会 公共权威部门
在线阅读 下载PDF
我国人口结构对消费的影响:需求侧视角下多维度社会人口结构的再考量 被引量:11
15
作者 任昊 秦敏 《商业经济研究》 北大核心 2021年第23期38-41,共4页
文章通过理论分析结合实证检验,基于需求侧的视角,研究了多维度的社会人口结构对我国居民消费水平的影响。研究结果表明:人口收入结构、人口受教育结构和人口家庭结构变化对消费的影响都是非常显著的,即人口结构对消费增长的收入分配效... 文章通过理论分析结合实证检验,基于需求侧的视角,研究了多维度的社会人口结构对我国居民消费水平的影响。研究结果表明:人口收入结构、人口受教育结构和人口家庭结构变化对消费的影响都是非常显著的,即人口结构对消费增长的收入分配效应、人才红利效应和生活成本效应都是显著存在的。同时根据分位数结果,这三类影响效应都是在中低消费阶层更为强烈,即中低消费阶层对人口收入结构、受教育结构或家庭结构变化产生更加敏感的消费刺激效应。 展开更多
关键词 社会人口结构 居民消费水平 需求侧 收入分配效应 人才红利效应
在线阅读 下载PDF
面向大规模机群的可扩展OLAP查询技术 被引量:8
16
作者 王会举 覃雄派 +2 位作者 王珊 张延松 李芙蓉 《计算机学报》 EI CSCD 北大核心 2015年第1期45-58,共14页
大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,... 大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,该文对传统数据仓库的数据组织模式及处理模式进行改造,提出了全新的无连接雪花模型和TRM执行模型.无连接雪花模型基于层次编码技术,将维表层次等关键信息压缩进事实表,使得事实表可以独立处理数据,从数据模型层保证了数据计算的独立性;TRM执行模型将OLAP查询的处理抽象为Transform、Reduce、Merge 3个操作,使得OLAP查询可被划分为众多可并行执行的独立子任务,从执行层保证了系统的高度可扩展特性.在性能优化方面,该文提出了Scan-index扫描和跳跃式扫描算法,以尽可能地减少I/O访问操作;设计了并行谓词判断、批量谓词判断等优化算法,以加速本地计算速度.实验表明:LaScOLAP原型可以获得较好的扩展性和容错性,其性能比HadoopDB高出一个数量级. 展开更多
关键词 大规模可扩展 OLAP查询 无连接雪花模型 TRM执行模型 跳跃式扫描 Scan-index 大数据
在线阅读 下载PDF
一种适应GPU的混合OLAP查询处理模型 被引量:9
17
作者 张宇 张延松 +1 位作者 陈红 王珊 《软件学报》 EI CSCD 北大核心 2016年第5期1246-1265,共20页
通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上... 通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上的算法实现和性能优化技术,以哈希连接的GPU并行算法研究为中心.GPU拥有数千个并行计算单元,但其逻辑控制单元较少,相对于CPU具有更强的并行计算能力,但逻辑控制和复杂内存管理能力较弱,因此并不适合需要复杂数据结构和复杂内存管理机制的内存数据库查询处理算法直接移植到GPU平台.提出了面向GPU向量计算特性的混合OLAP多维分析模型semi-MOLAP,将MOLAP(multidimensional OLAP)模型的直接数组访问和计算特性与ROLAP模型的存储效率结合在一起,实现了一个基于完全数组结构的GPU semi-MOLAP多维分析模型,简化了GPU数据管理,降低了GPU semi-MOLAP算法复杂度,提高了GPU semiMOLAP算法的代码执行率.同时,基于GPU和CPU计算的特点,将semi-MOLAP操作符拆分为CPU和GPU平台的协同计算,提高了CPU和GPU的利用率以及OLAP的查询整体性能. 展开更多
关键词 GPU 联机分析处理 内存数据库 协同计算 数组计算
在线阅读 下载PDF
一种基于向量索引的内存OLAP星型连接加速新技术 被引量:9
18
作者 张延松 张宇 王珊 《计算机学报》 EI CSCD 北大核心 2019年第8期1686-1703,共18页
星型连接是OLAP中重要的操作,事实表与维表基于星型连接执行多维分析处理.星型连接的性能取决于连接性能.当前研究主要集中在如何在不同的处理器平台上优化哈希连接性能,然而如何获得最优的哈希连接参数或实现是一个复杂的问题.哈希连... 星型连接是OLAP中重要的操作,事实表与维表基于星型连接执行多维分析处理.星型连接的性能取决于连接性能.当前研究主要集中在如何在不同的处理器平台上优化哈希连接性能,然而如何获得最优的哈希连接参数或实现是一个复杂的问题.哈希连接不依赖于模式的语义信息,然而却可以在事实表与维表之间通过维映射特征进一步优化连接性能.该文提出了一种新颖的面向OLAP负载的向量索引以提高事实表与维表之间的连接性能.从模式的角度来看,维表可以映射为向量索引,每一个事实表记录可以直接映射到向量索引上的相应位置,无须执行基于值匹配的哈希连接操作.从实现技术的角度看,向量索引是一种位图索引、字典表压缩、主外键参照完整性约束和连接索引相结合的技术.系统化的设计使向量索引可以扮演多种角色:(1)向量索引与位图索引类似起到过滤作用;(2)向量索引相对于只存储0或1的位图索引使用更多的位来表示更多的信息;(3)映射或创建自动增长的主键作为向量索引地址并且更新相应的外键,将主外键参照完整性约束转换为向量参照约束;(4)外键连接操作简化为通过外键值引用向量单元.基于向量索引,OLAP中代价大的星形连接可以抽象为向量索引计算,OLAP查询可以简化为基于向量索引的单表扫描处理.向量索引简化的设计不仅可以提升性能,而且降低了在GPU平台实现的复杂度.本文首先讨论了向量索引机制和如何在数据库中应用向量索引;然后设计向量索引更新机制,以保证在更新时向量参照约束;最后提出基于向量索引的OLAP框架来提高内存数据库OLAP性能.基于向量索引的星型连接可以用作GPU上的OLAP加速器,使CPU可以将计算密集型负载转移到高性能GPU平台来加速OLAP处理.实验结果表明向量索引更新代价较低,而向量引用性能收益较大.更重要的是,向量索引支持OLAP中的星形连接操作在内存数据库引擎之外进行加速,降低了内存数据库的CPU负载,或者将星形连接负载通过硬件级加速器,如GPU进行加速.基于向量索引的星型连接可以显著提升CPU和GPU平台上的星型连接性能,相对于内存数据库Vector,在SSB Q4.1查询可以获得最大3倍的性能提升,平均性能提升了1.2倍. 展开更多
关键词 内存OLAP 外键连接 向量索引 向量引用 星型连接加速
在线阅读 下载PDF
内存OLAP多核并行查询优化技术研究 被引量:4
19
作者 焦敏 张延松 +1 位作者 王珊 陈红 《计算机学报》 EI CSCD 北大核心 2014年第9期1895-1910,共16页
随着以大内存和多核为代表的计算机硬件技术的发展,以cache-conscious算法为中心的查询优化技术逐渐转向以multicore-conscious为中心的查询优化技术,来提高多核处理器的并行处理性能.该文的研究目标是具备复杂星型连接特点的联机分析处... 随着以大内存和多核为代表的计算机硬件技术的发展,以cache-conscious算法为中心的查询优化技术逐渐转向以multicore-conscious为中心的查询优化技术,来提高多核处理器的并行处理性能.该文的研究目标是具备复杂星型连接特点的联机分析处理OLAP技术,以查询执行代价最大的星型连接为研究对象,提出同时满足cache-conscious和multicore-conscious的多核并行连接算法DDTA-MPJ.该算法包括基于事实表水平分片和维属性列共享访问模式的查询内多核并行算法IntraDDTA-MPJ、基于QuerySlots的查询间多核并行算法InterDDTAMPJ以及中位数多核并行算法Median-MPJ.实验结果表明该算法具有良好且稳定的并行查询处理性能,线性查询处理模型能够更好地利用多核处理器的先进性能. 展开更多
关键词 多核敏感算法 星型连接 多核并行 并行中位数聚集计算
在线阅读 下载PDF
科技金融服务体系的协同发展模式研究——中关村科技金融改革发展的经验与启示 被引量:27
20
作者 吴翌琳 谷彬 《中国科技论坛》 CSSCI 北大核心 2013年第8期134-141,共8页
本文以中关村为例,分析了中关村科技金融改革的经验与启示,基于创新调查与企业财务数据的对接,实证分析中关村科技金融改革的现状与问题,系统论述了中关村科技金融服务体系的协同发展模式与启示,旨在整合多种金融手段,强化动态协同匹配... 本文以中关村为例,分析了中关村科技金融改革的经验与启示,基于创新调查与企业财务数据的对接,实证分析中关村科技金融改革的现状与问题,系统论述了中关村科技金融服务体系的协同发展模式与启示,旨在整合多种金融手段,强化动态协同匹配,深化科技金融合作,促进科技资源与金融资本的有效对接。 展开更多
关键词 科技金融服务体系 协同发展 动态匹配
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部