期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
统一并行体系结构实验平台研制
1
作者 蔡晔 周春云 罗秋明 《实验技术与管理》 CAS 北大核心 2013年第2期62-65,69,共5页
介绍了计算机主流并行体系结构的发展,采用个人高性能计算机(personal high performance computer,PHPC)系统技术,研制了一种并行体系结构实验平台,介绍了其设计方案以及基于该实验平台的教学思路。该实验平台符合最新的"统一试验... 介绍了计算机主流并行体系结构的发展,采用个人高性能计算机(personal high performance computer,PHPC)系统技术,研制了一种并行体系结构实验平台,介绍了其设计方案以及基于该实验平台的教学思路。该实验平台符合最新的"统一试验教学"理念,并具有便携性、灵活性、统一性、开放性以及先进性等特点。应用该实验平台可将计算机专业并行体系结构系列课程的课程内容、课程体系、专业教学大纲的要求纳入到一个统一的实验体系中,在保证可独立授课的基础上,通过实验内容间良好的衔接,实现相关课程教学的完整性。 展开更多
关键词 计算机系统结构 并行体系结构 PHPC 实验设备 FPGA
在线阅读 下载PDF
基于包围跳跃的计算统一设备架构光线投射算法
2
作者 方军 房晓阳 肖亮 《科学技术与工程》 北大核心 2014年第12期245-249,共5页
针对传统光线投射算法绘制速度慢和图形处理器(graphics processing unit,GPU)不能有效进行并行计算的缺点,文章提出一种基于包围跳跃的计算统一设备架构(compute unified device architecture,CUDA)光线投射算法。首先介绍了CUDA的编... 针对传统光线投射算法绘制速度慢和图形处理器(graphics processing unit,GPU)不能有效进行并行计算的缺点,文章提出一种基于包围跳跃的计算统一设备架构(compute unified device architecture,CUDA)光线投射算法。首先介绍了CUDA的编程模型和线程结构,然后用包围盒技术隔离体数据周围无效的空体素,减少投射光线的数目;利用光线跳跃技术,在包围盒内进行快速光线的合成,跳过透明的体素,减少大量体素的重采样;最后使用CUDA强大的并行处理计算的功能实现光线投射算法。实验结果表明,在保证图像质量的同时,绘制速度上比基于GPU加速的光线投射算法有14倍的提高,能够接近实时绘制,有很好的应用价值。 展开更多
关键词 光线投射 体绘制 光线跳跃 包围盒 统一计算设备结构
在线阅读 下载PDF
图形处理器在通用计算中的应用 被引量:4
3
作者 张健 陈瑞 《计算机工程与设计》 CSCD 北大核心 2009年第14期3359-3361,共3页
基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法。在Geforce8800 GT下,完成了矩阵乘法运算实验。实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处... 基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法。在Geforce8800 GT下,完成了矩阵乘法运算实验。实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处理,速度都在减慢。数据增加100倍后,GPU上的运算时间仅增加了3.95倍,而CPU的运算时间增加了216.66倍。 展开更多
关键词 图形处理器 计算统一设备体系结构 通用计算 矩阵乘法 矩阵阶数
在线阅读 下载PDF
统一强度理论的发展及其在土木水利等工程中的应用和经济意义 被引量:28
4
作者 俞茂宏 Oda Y +12 位作者 盛谦 沈俊 顾金才 李小春 李庆斌 周小平 蒋锁红 张永兴 董毓利 刘继明 景宏君 Yoshimine M 徐栓强 《建筑科学与工程学报》 CAS 2005年第1期24-41,共18页
统一强度理论是在中国本土原创产生和发展起来的关于材料强度和结构强度的系统新理论。它从连续统力学最基本的单元体力学模型开始,到数学建模方法,理论公式的表述,以及一系列新的理论公式都不同于以往的各种理论。它将以往各种适合于... 统一强度理论是在中国本土原创产生和发展起来的关于材料强度和结构强度的系统新理论。它从连续统力学最基本的单元体力学模型开始,到数学建模方法,理论公式的表述,以及一系列新的理论公式都不同于以往的各种理论。它将以往各种适合于某一类材料的单一强度理论推进为可以适合于多种材料的统一强度理论。经过40多年的发展,它不仅自己形成了系统的理论,而且将很多著名的理论包容其中,形成了范围更宽广、功能更强大的理论体系。由于它具有一个统一的力学模型,清晰的物理意义,简单的线性数学表述式,能反映材料的基本特性,即SD效应(不同的抗拉强度和抗压强度)、静水应力效应、正应力效应、中间主应力效应和中间主剪应力效应,以及结构强度分析的破坏准则效应,并且与现有的实验数据相吻合,能容易地适合许多新情况;此外,统一强度理论既容易用来取得解析解,也容易用于计算机程序取得数值解。统一强度理论已被推广应用于很多领域。在连续介质和工程应用的框架下对统一强度理论的发展及其在土木工程中的应用和经济意义进行较为系统的小结。 展开更多
关键词 统一强度理论 经济意义 应力效应 水利 结构强度分析 力学模型 理论公式 连续统力学 计算机程序 材料强度 建模方法 理论体系 物理意义 数学表述 抗压强度 抗拉强度 sD效应 破坏准则 实验数据 推广应用 土木工程 工程应用
在线阅读 下载PDF
消解逻辑悖论建立元知识智能化体系 被引量:1
5
作者 郑智捷 《计算机科学》 CSCD 北大核心 2022年第1期9-16,共8页
高庆狮院士于2006年发表《新模糊集合论基础》专著,为消解模糊逻辑系列悖论进行逻辑理论基础探索;并于2009年在科学出版社发表《统一语言学基础》专著,为多语言计算前沿构造理论基础支撑。这两部专著在他的创新理论基础研究中为传世瑰... 高庆狮院士于2006年发表《新模糊集合论基础》专著,为消解模糊逻辑系列悖论进行逻辑理论基础探索;并于2009年在科学出版社发表《统一语言学基础》专著,为多语言计算前沿构造理论基础支撑。这两部专著在他的创新理论基础研究中为传世瑰宝。在悼念高庆狮院士逝世10周年之际,文中利用最新向量逻辑——变值体系,来展现在高老师的研究方向中元知识系统体系架构建模的最新进展。从向量逻辑出发,综合共轭结构、元知识模型以及各类新型处理机制,在现代逻辑和数学中判定一个复杂系统是否包含经典逻辑悖论,对保证该类系统能否存活起到核心判别作用。从分类和判别解析的角度,悖论可以分为两类模式:逻辑悖论和语义悖论。利用共轭环构造4条色带,系统化地消解莫比乌斯环展现的单面特性,展示一系列几何拓扑逻辑等学科内蕴的逻辑悖论,通过共轭环结构,形成完备的消解体系。相关的结构包括易经、微分几何、微分几何拓扑、整体变分泛函优化等复杂动态系统。随着系统化地消解莫比乌斯拓扑几何逻辑悖论,针对复杂知识系统体系架构,描述适配的相关模块及其子模块的体系架构,从经典逻辑出发,系统地建立经典逻辑、有限自动机、图灵机、冯纽曼体系。利用消解莫比乌斯悖论的向量逻辑、共轭结构和变值体系,系统化地构造量子图灵机、多元复函数向量机、复杂智能化系统体系架构以及统一语言学分析系统等,为新型元知识体系构造新型复杂智能化系统开辟道路。 展开更多
关键词 共轭逻辑 共轭变换结构 相空间 经典计算系统 图灵机 量子图灵机 元知识体系 统一语言学
在线阅读 下载PDF
基于宇宙计算的图形处理器算法实现
6
作者 郭祖华 贾积身 马世霞 《计算机应用研究》 CSCD 北大核心 2014年第11期3357-3360,共4页
下一代观测望远镜将会产生数以亿计的星系测量数据值,这将导致使用中央处理器处理数据时效率低下、成本较高。为了解决这一问题,提出了基于宇宙计算的图形处理器算法。研究了两点式角相关函数以及孔径质量统计这两种宇宙学的计算方法,... 下一代观测望远镜将会产生数以亿计的星系测量数据值,这将导致使用中央处理器处理数据时效率低下、成本较高。为了解决这一问题,提出了基于宇宙计算的图形处理器算法。研究了两点式角相关函数以及孔径质量统计这两种宇宙学的计算方法,构建算法代码,并使用统一计算设备架构在图形处理器上实现了这两种算法;比较了算法在中央处理器和图形处理器上使用的运行速度。实验结果表明,与中央处理器相比,使用图形处理器的计算速度得到了显著提高。 展开更多
关键词 宇宙计算 孔径质量 角相关函数 图形处理器 统一计算设备结构
在线阅读 下载PDF
基于NBD机制的高性能计算机系统内存优化方案 被引量:1
7
作者 左右 刘光明 董文睿 《计算机研究与发展》 EI CSCD 北大核心 2015年第S2期178-183,共6页
随着多核、异构等计算机技术的飞速发展,高性能计算机的计算性能现已达到亿亿次量级.随着高性能计算机技术的成熟,高性能应用对系统内存产生不同的需求.超级计算机每个结点都按一定标准配置了内存,在实际使用中,因不同应用对于内存需求... 随着多核、异构等计算机技术的飞速发展,高性能计算机的计算性能现已达到亿亿次量级.随着高性能计算机技术的成熟,高性能应用对系统内存产生不同的需求.超级计算机每个结点都按一定标准配置了内存,在实际使用中,因不同应用对于内存需求量的不同,很容易出现有的结点空闲内存较多,而有的结点内存紧张的情况.为较好地运行内存消耗量大的高性能应用,提出了一种基于网络块设备(network block device,NBD)机制使用远程结点内存构建page swap区的内存优化技术.该技术利用了超级计算机中通过网络访问远地内存性能优于访问本地磁盘性能的特点,采用了远程内存交换盘技术,使得本地节点在内存紧张时可将页面交换到远地节点的物理内存上.并将该技术应用到"天河一号"超级计算机系统上,以测试其性能并提高超级计算机的内存使用效率. 展开更多
关键词 高性能计算 内存使用率 网络块设备 page SWAP 计算体系结构
在线阅读 下载PDF
基于CUDA对RNA二级结构预测的并行研究 被引量:1
8
作者 陈飞 郝福珍 《计算机工程与设计》 CSCD 北大核心 2014年第1期297-302,314,共7页
为解决长链RNA二级结构预测面临的计算压力,分析了当前基于最小自由能预测RNA二级结构的相关串行、并行算法,提出了一种基于CUDA(compute unified device architecture)编程模型的并行加速算法。在实现时充分利用了支持CUDA编程模型的GP... 为解决长链RNA二级结构预测面临的计算压力,分析了当前基于最小自由能预测RNA二级结构的相关串行、并行算法,提出了一种基于CUDA(compute unified device architecture)编程模型的并行加速算法。在实现时充分利用了支持CUDA编程模型的GPU(graphic processing unit)设备中的共享存储器、常量存储器等硬件,对RNA二级结构预测算法中的动态规划进行了有效的并行。实验结果表明,在支持CUDA编程模型的GPU上实现的并行程序,获得了与已有的串行、并行算法相同的准确度,同时运行速度更快。 展开更多
关键词 统一计算设备架构 RNA二级结构预测 并行算法 最小自由能 动态规划
在线阅读 下载PDF
基于智能存储设备的共享存储集群系统研究
9
作者 黄蓉 俞建新 《计算机工程与设计》 CSCD 北大核心 2007年第16期3928-3931,共4页
随着越来越多的机构采用集群计算技术来实现高性能计算(HPC)——地球、海洋和大气科学、地震数据分析等科学研究和药物研究、汽车设计模型、商业业务冒险分析等商业应用,集群计算技术已经进化为开发高性能计算系统的主要的方法。所有的... 随着越来越多的机构采用集群计算技术来实现高性能计算(HPC)——地球、海洋和大气科学、地震数据分析等科学研究和药物研究、汽车设计模型、商业业务冒险分析等商业应用,集群计算技术已经进化为开发高性能计算系统的主要的方法。所有的这些应用的计算都是公认的复杂。能够有效地管理与这些应用密切相关的数据集驱动了现在的集群计算技术的发展。采用智能存储设备(OSD)大大简化了元数据服务器的工作量,并且使得系统的管理和效率都得到了很大的提高。集中描述一个新的存储体系结构──基于智能OSD的共享存储集群计算系统。 展开更多
关键词 共享存储 高性能计算 集群 对象存储设备 存储体系结构
在线阅读 下载PDF
GPU核函数细化研究 被引量:3
10
作者 焦良葆 陈瑞 《计算机工程》 CAS CSCD 北大核心 2010年第18期10-12,共3页
GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率,基于此,分析GPU核的执行方式,以及网格、线程块和线程之间的关系,采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明,核的大小设置和分布方向影响了线程块内部... GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率,基于此,分析GPU核的执行方式,以及网格、线程块和线程之间的关系,采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明,核的大小设置和分布方向影响了线程块内部的一致性,核函数的细化能增加线程块中同时运行的线程捆的数量。 展开更多
关键词 图形处理器 计算统一设备体系结构 光线跟踪
在线阅读 下载PDF
基于GPU和均匀栅格法的光线追踪算法研究 被引量:4
11
作者 童星 袁道华 《计算机工程与设计》 CSCD 北大核心 2011年第10期3499-3502,共4页
由于GPU(图形处理器)性能的大幅提高和可编程性的发展,基于GPU的光线追踪算法逐渐成为研究热点。光线追踪算法需要的计算量大,基于此,分析了光线追踪算法的基本原理,在NVIDIA公司的CUDA(计算统一设备体系结构)环境下采用均匀栅格法作为... 由于GPU(图形处理器)性能的大幅提高和可编程性的发展,基于GPU的光线追踪算法逐渐成为研究热点。光线追踪算法需要的计算量大,基于此,分析了光线追踪算法的基本原理,在NVIDIA公司的CUDA(计算统一设备体系结构)环境下采用均匀栅格法作为加速结构实现了光线追踪算法。实验结果表明,该计算模式相对于传统基于CPU的光线追踪算法具有更快的整体运算速度,GPU适合处理高密度数据计算。 展开更多
关键词 光线追踪 图形处理器 计算统一设备体系结构 均匀栅格法 并行计算
在线阅读 下载PDF
地震波能量补偿的并行反Q滤波方法研究 被引量:3
12
作者 张全 王一品 +2 位作者 张伟 彭博 胥林 《西南石油大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期24-32,共9页
在石油勘探地震资料处理中,反Q滤波方法能有效地对地震波进行振幅补偿和相位校正,为地震反演和储层预测提供更准确的信息。对于大规模的地震道集数据处理,反Q滤波方法在CPU计算平台上执行时间较长,影响了地震解释的效率。分析发现,反Q... 在石油勘探地震资料处理中,反Q滤波方法能有效地对地震波进行振幅补偿和相位校正,为地震反演和储层预测提供更准确的信息。对于大规模的地震道集数据处理,反Q滤波方法在CPU计算平台上执行时间较长,影响了地震解释的效率。分析发现,反Q滤波方法大量时间消耗在振幅相位补偿与短时傅里叶变换。在GPU平台上,首先,对振幅相位补偿部分进行并行化;其次,对批量短时傅里叶变换用CUFFT库进行加速;最后,对批量短时傅里叶变换进一步优化并将其应用于反Q滤波方法。实验结果表明,相比CPU计算环境,基于CUFFT库的反Q滤波并行算法效率提升了3.9倍,优化后的批量短时傅里叶变换进一步将效率提升了12%。 展开更多
关键词 反Q滤波 振幅补偿 傅里叶变换 并行计算 计算统一设备体系结构
在线阅读 下载PDF
CIMS/PIMS总体方案与设计模型 被引量:1
13
作者 赵涛 韩吉韬 商如斌 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2001年第9期11-14,共4页
在CIMS企业的集成化管理和决策信息系统中 ,必须建立包括设备资源数据、信息和知识在内的设备集成化管理体系 ,通过数据共享和协同管理作用 ,确保实现CIMS企业三流集成度。本文提出了设备集成化管理体系的总体解决方案 ,建立了设备集成... 在CIMS企业的集成化管理和决策信息系统中 ,必须建立包括设备资源数据、信息和知识在内的设备集成化管理体系 ,通过数据共享和协同管理作用 ,确保实现CIMS企业三流集成度。本文提出了设备集成化管理体系的总体解决方案 ,建立了设备集成化管理体系的体系结构。 展开更多
关键词 计算机集成制造系统 设备集成化管理体系 体系结构 CIMS PIMS
在线阅读 下载PDF
铁路智能运输系统中信息共享系统的研究
14
作者 徐杰 魏旭 +2 位作者 刘春煌 李平 史天运 《交通运输系统工程与信息》 EI CSCD 2005年第2期31-35,共5页
铁路智能运输系统( Railway Intelligent Transportation System,RITS)在本质上是建立在信息流基础上的人流和物流的统一体,共用信息平台是RITS中各个子系统互相通信的信息中枢.在研究和分析全路内外对信息查询的需求的基础上,对信息共... 铁路智能运输系统( Railway Intelligent Transportation System,RITS)在本质上是建立在信息流基础上的人流和物流的统一体,共用信息平台是RITS中各个子系统互相通信的信息中枢.在研究和分析全路内外对信息查询的需求的基础上,对信息共享系统进行研究.首先分析当今流行的分布式计算结构,提出适合RITS信息共享系统的体系结构;然后分析当前主流的构件技术模式,提出建设信息共享系统所采用的关键技术;同时研究数据集成模式及数据集成方式,最后建立信息共享系统的总体结构. 展开更多
关键词 铁路智能运输系统 信息共享系统 Intelligent 分布式计算结构 System 共用信息平台 RITS 信息查询 体系结构 技术模式 关键技术 集成方式 集成模式 总体结构 统一 信息流 子系统 基础 数据
在线阅读 下载PDF
PRCD技术及其软件实现
15
作者 谢长生 余铁流 《计算机工程》 CAS CSCD 北大核心 2003年第5期3-5,共3页
介绍了一种新的磁盘存储体系结构PRCD(prefetching RAM caching disk,预取主存缓冲磁盘技术)。该技术通过收集小写转换成为一次大写请求提高系统的写性能,并采用数据块预取技术大大提高系统的读性能。还介绍了基于Windows NT平台的P... 介绍了一种新的磁盘存储体系结构PRCD(prefetching RAM caching disk,预取主存缓冲磁盘技术)。该技术通过收集小写转换成为一次大写请求提高系统的写性能,并采用数据块预取技术大大提高系统的读性能。还介绍了基于Windows NT平台的PRCD的软件实现方法。 展开更多
关键词 PRCD技术 软件 磁盘存储体系结构 I/O性能 计算 外存储设备
在线阅读 下载PDF
FMM算法中PP问题在GPU上的研究与实现 被引量:2
16
作者 李正杰 徐炜民 +1 位作者 柴亚辉 郑衍衡 《计算机工程与设计》 CSCD 北大核心 2011年第9期3050-3053,3169,共5页
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合... 针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。 展开更多
关键词 图形处理器 异构体系结构 统一计算架构 快速多极子算法 PP问题
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部