期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
国产个人高性能计算机系统研制 被引量:4
1
作者 陈国良 蔡晔 罗秋明 《深圳大学学报(理工版)》 EI CAS 北大核心 2011年第6期471-477,共7页
指出面向普及型系统的个人高性能计算机(personal high performance computer,PHPC)是高性能计算发展的一个重要方向.对PHPC研究的关键问题进行了分析,系统介绍了国产PHPC的发展历程和最新研制进展.该系列系统的研制经历了从KD-50、KD-5... 指出面向普及型系统的个人高性能计算机(personal high performance computer,PHPC)是高性能计算发展的一个重要方向.对PHPC研究的关键问题进行了分析,系统介绍了国产PHPC的发展历程和最新研制进展.该系列系统的研制经历了从KD-50、KD-50-E到KD-60、SD-1(深大-1)以及KD-90三个阶段,实现了在保持计算峰值能力为万亿次规模的情况下,不断减小体积及系统功耗.最终在KD-90上实现一款真正意义的可移动个人高性能计算系统.该系列系统的显著特点在于计算核心采用国产单核或多核处理器,自主研制高性能硬件体系结构,并利用Linux操作系统以及开源软件等作为支撑软件实现了核心芯片设计、基础硬件以及基础软件等关键技术.给出KD-90面向云计算应用的推广型号SD-30(深大-30)的设计思路. 展开更多
关键词 计算机工程 个人高性能计算机系统 龙芯 并行体系结构 高性能计算 云计算
在线阅读 下载PDF
有向传感器网络覆盖增强问题的贪婪迭代算法 被引量:11
2
作者 陆克中 冯禹洪 +2 位作者 毛睿 罗秋明 刘刚 《电子学报》 EI CAS CSCD 北大核心 2012年第4期688-694,共7页
在有向传感器网络中,可以通过调整节点的感知方向来增强目标区域的覆盖率.提出了有向传感器网络覆盖增强问题的一种贪婪迭代算法,在每次迭代中,调整那些使得覆盖率增加最大的节点的感知方向,重复此迭代过程直至通过调整任一节点的感知... 在有向传感器网络中,可以通过调整节点的感知方向来增强目标区域的覆盖率.提出了有向传感器网络覆盖增强问题的一种贪婪迭代算法,在每次迭代中,调整那些使得覆盖率增加最大的节点的感知方向,重复此迭代过程直至通过调整任一节点的感知方向已不能再增加覆盖率.此外,还提出了一种通过计算几何求解该算法中区域计算问题的方法,以提高计算精度和减少计算时间.大量的仿真实验结果表明,该算法的执行时间较短,收敛速度较快,能够获得比现有算法更高的目标区域覆盖率. 展开更多
关键词 无线传感器网络 有向传感器节点 覆盖增强 贪婪算法 迭代算法
在线阅读 下载PDF
基于蜂窝结构的传感器网络覆盖问题求解算法 被引量:6
3
作者 陆克中 江钊 +2 位作者 毛睿 刘刚 明仲 《计算机研究与发展》 EI CSCD 北大核心 2012年第8期1632-1640,共9页
在无线传感器网络中,求解能够完全覆盖目标区域的最小覆盖集是个NP难问题.在传感器节点数目较多时,目前只能通过近似算法求解.蜂窝结构是覆盖二维平面的最佳拓扑结构,但不能直接用于求解无线传感器网络的覆盖问题.提出了一种基于蜂窝结... 在无线传感器网络中,求解能够完全覆盖目标区域的最小覆盖集是个NP难问题.在传感器节点数目较多时,目前只能通过近似算法求解.蜂窝结构是覆盖二维平面的最佳拓扑结构,但不能直接用于求解无线传感器网络的覆盖问题.提出了一种基于蜂窝结构的覆盖问题求解算法,在该算法迭代求解过程的每一阶段,选出一个节点加入到初始为空的节点集合中,并使得该节点集合的拓扑结构接近于蜂窝结构,直至该节点集合成为覆盖集.该算法在最坏情况下的时间复杂度为O(n3),这里n为传感器节点总数.实验结果表明该算法可在很短的时间内执行完,在所得覆盖集的大小方面要优于现有的覆盖问题求解算法. 展开更多
关键词 无线传感器网络 网络生存时间 覆盖集 NP难问题 蜂窝结构
在线阅读 下载PDF
面向龙芯3B1500体系结构的DGEMM函数优化 被引量:3
4
作者 刘刚 张恒 +1 位作者 毛睿 陆克中 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1523-1527,共5页
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现... 双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现矩阵乘法的向量化运算,同时针对矩阵乘法中各矩阵的访存特点设计合理分块策略,并运用3B1500的cache锁机制将重复利用率高的分块锁在cache中以减少cache缺失,最后针对矩阵A和B的预取时间大于计算时间这一问题,设计了一种新的矩阵预取算法.该预取算法通过增大核心计算的计算量,将矩阵A和B的预取时间全部掩藏在计算中,并且通过ld指令与$0寄存器的配合使用来实现对C矩阵的预取.优化后的DGEMM函数无论在单线程和多线程时的性能都达到了理论峰值的80%以上. 展开更多
关键词 龙芯3B1500处理器 BLAS DGEMM 矩阵乘法 数据预取
在线阅读 下载PDF
无线传感器网络最小覆盖集的贪婪近似算法 被引量:8
5
作者 陆克中 孙宏元 《软件学报》 EI CSCD 北大核心 2010年第10期2656-2665,共10页
网络生命期是限制无线传感器网络发展的一个瓶颈.在保证网络监控性能的前提下,仅调度部分节点工作而让其余节点处于低功耗的休眠状态,可以有效节省能耗,延长网络生命期.节点调度的目标是寻找一个能够覆盖监控区域的最小节点集合,这是一... 网络生命期是限制无线传感器网络发展的一个瓶颈.在保证网络监控性能的前提下,仅调度部分节点工作而让其余节点处于低功耗的休眠状态,可以有效节省能耗,延长网络生命期.节点调度的目标是寻找一个能够覆盖监控区域的最小节点集合,这是一个NP难问题,目前,其近似算法的性能较低.提出了一种基于贪婪法的最小覆盖集近似算法,在构造覆盖集的过程中,优先选择扩展面积最大的有效节点加入覆盖集.理论分析表明,该算法能够构造出较好的覆盖集,时间复杂度为O(n),其中,n为初始节点总数.实验数据表明,该算法的性能要优于现有算法,得到的覆盖集的平均大小比现有算法减小了14.2%左右,且执行时间要短于现有算法.当初始节点分布较密时,该算法得到的平均覆盖度小于1.75,近似比小于1.45. 展开更多
关键词 无线传感器网络 网络生命期 节点调度 最小覆盖集 贪婪算法 近似算法
在线阅读 下载PDF
CPU+GPU异构平台的一致性图像配准算法并行实现 被引量:1
6
作者 易见兵 陈国良 杨烜 《小型微型计算机系统》 CSCD 北大核心 2014年第1期114-120,共7页
针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台... 针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台优势,提高该算法的运行效率。实验结果表明该并行实现方法可以获得较高的加速比. 展开更多
关键词 GPU 加速比 图像配准 并行算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部