期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
面向DCU的流固耦合浸没边界算法异构实现
1
作者 商建东 熊威 +3 位作者 华浩波 宋昭璐 郭恒亮 张军 《计算机工程》 北大核心 2025年第7期263-274,共12页
直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国... 直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国产平台上对流固耦合问题的研究较少,而在国产平台上实现直接力浸没边界算法能够丰富平台的应用生态。为此,使用国产DCU(Deep Compute Unit)加速器,基于CPU-DCU异构编程,设计并实现利用三维直接力浸没边界算法求解流固耦合问题的并行程序。首先,在CPU上实现串行算法并进行热点分析,对程序热点部分使用DCU加速器进行异构加速;其次,在异构实现的基础上,结合DCU硬件特性,使用共享内存、循环分块、调整访存顺序等优化手段对核函数进行优化;最后,通过圆球绕流和仿生鱼自主游动算例对程序进行正确性验证和性能测试。实验结果表明,在雷诺数分别为100和200时,圆球的阻力系数分别为1.11和0.78,计算结果均与相关文献吻合;在雷诺数为7142的仿生鱼自主游动实验中,游动稳定后的平均前进速度为0.396,该结果与相关文献结果一致。在圆球绕流实验中,在5033万网格规模下该并行程序较串行程序获得了83.7倍的加速效果。通过两类流固耦合数值实验,验证了CPU-DCU并行直接力浸没边界算法在国产异构平台上进行计算的有效性和准确性,这为国产平台上CFD(Computational Fluid Dynamics)算法的研究提供了坚实基础。 展开更多
关键词 异构计算 dcu加速器件 访存优化 直接力浸没边界法 流固耦合
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
2
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 dcu 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
基于国产DCU异构平台的图匹配算法移植与优化 被引量:2
3
作者 郝萌 田雪洋 +3 位作者 鲁刚钊 刘义 张伟哲 何慧 《计算机科学》 CSCD 北大核心 2024年第4期67-77,共11页
子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅... 子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅度减少存储开销,提升子图匹配性能。但由于平台底层硬件架构和编译环境的不同,GENEVA无法直接应用到国产DCU异构平台。为了解决该问题,提出了GENEVA面向国产DCU的移植和优化方案。IO时间开销是GENEVA算法主要的性能瓶颈,文中采用锁页内存、预加载、调度器3种优化策略来突破该瓶颈。其中,锁页内存技术避免了从可分页内存到临时锁页内存的额外数据传输,在DCU平台上大幅度减少了IO传输的时间开销;预加载技术将IO数据传输与DCU核函数计算重叠,掩盖了IO时间开销;调度器在满足预加载需求的同时,减少了冗余数据的传输。在3个不同规模的真实数据集上进行实验,结果表明,采用优化策略后算法性能显著提高。在92.6%的测试用例上,经过优化的GENEVA-HIP算法在国产DCU平台的执行时间比移植前的GENEVA算法在GPU服务器的执行时间短。在较大规模的数据集上,优化的GENEVA-HIP算法在DCU平台上的执行时间相比移植前的GENEVA算法在GPU服务器的执行时间减少了52.73%。 展开更多
关键词 子图匹配 dcu 异构平台 HIP 移植和优化
在线阅读 下载PDF
柴油机选择催化还原系统的DCU控制研究 被引量:2
4
作者 刘军 李敏 秦国振 《汽车技术》 北大核心 2013年第1期12-14,19,共4页
简述选择性催化还原系统的工作原理,并着重对其电子控制单元DCU的控制策略进行研究。该控制策略是通过试验得到某柴油机原机排放相关数据,并利用网格节点插值计算方法将相关数据存储到DCU单元中,然后根据物理化学反应计算出尿素溶液的... 简述选择性催化还原系统的工作原理,并着重对其电子控制单元DCU的控制策略进行研究。该控制策略是通过试验得到某柴油机原机排放相关数据,并利用网格节点插值计算方法将相关数据存储到DCU单元中,然后根据物理化学反应计算出尿素溶液的基本需求量,同时用试验得到的NOx转化率MAP图和修正系数MAP图对尿素溶液的需求量进行稳态修正和瞬态修正。试验表明,该DCU控制策略能够控制NOx排放满足法规要求。 展开更多
关键词 柴油机 选择性催化还原系统 dcu 控制策略
在线阅读 下载PDF
柴油机SCR系统中DCU的研发 被引量:1
5
作者 刘军 熊明路 +2 位作者 聂斐 蔡骏宇 陶昌岭 《内燃机工程》 EI CAS CSCD 北大核心 2016年第5期80-85,共6页
简述尿素喷射控制单元(dosing control unit,DCU)的基本工作原理,对DCU的电源模块、信号输入调理模块、输出功率驱动模块、CAN通讯模块等硬件电路进行设计;并对DCU中的尿素喷射量、计量泵状态、车载诊断系统(OBD)等控制策略进行了深入研... 简述尿素喷射控制单元(dosing control unit,DCU)的基本工作原理,对DCU的电源模块、信号输入调理模块、输出功率驱动模块、CAN通讯模块等硬件电路进行设计;并对DCU中的尿素喷射量、计量泵状态、车载诊断系统(OBD)等控制策略进行了深入研究;最后将自主开发的DCU与整个选择性催化还原(SCR)系统连接,在发动机台架上进行了欧洲稳态循环(ESC)、欧洲瞬态循环(ETC)及OBD故障诊断试验。试验结果表明:所开发的DCU能较好的控制SCR系统,使柴油机的排放达到国Ⅳ标准,并且可以对SCR系统进行实时故障诊断。 展开更多
关键词 内燃机 选择性催化还原系统 尿素喷射控制单元 车载诊断系统 控制策略 开发
在线阅读 下载PDF
面向DCU非一致控制流的编译优化 被引量:2
6
作者 杨小艺 赵荣彩 +2 位作者 王洪生 韩林 徐坤坤 《计算机应用》 CSCD 北大核心 2023年第10期3170-3177,共8页
国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化... 国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化方法——部分控制流合并(PCFM)。首先,通过散度分析找到同构且含有大量相同指令和相似指令的可融合发散区域;其次,统计合并后节省的指令周期百分比,从而评估可融合发散区域的融合盈利;最后,查找对齐序列,并合并有收益的可融合发散区域。在DCU上使用PCFM测试从图形处理器(GPU)基准测试套件Rodinia和经典的排序算法中选择的测试用例,实验结果表明,PCFM对测试用例能够取得1.146的平均加速比,与分支融合+尾合并方法相比,使用PCFM的加速比平均提高了5.72%。可见,所提方法减少线程束分化的效果更好。 展开更多
关键词 dcu 单指令多线程 线程束分化 复杂控制流 编译优化
在线阅读 下载PDF
面向国产异构DCU平台的大规模并行矩量法研究 被引量:1
7
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
在线阅读 下载PDF
面向DCU的LDS访存向量化优化 被引量:3
8
作者 杨思驰 赵荣彩 +1 位作者 韩林 王洪生 《计算机工程》 CAS CSCD 北大核心 2024年第2期206-213,共8页
在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问... 在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问应遵循一定原则才能高效利用,当线程间的数据访问呈现重叠的访存特征时,访问向量化指令会因此产生延迟。针对此问题,提出面向DCU的LDS访存向量化优化方法。通过实现连续数据访问的向量化,减少LDS的访问次数,降低访存耗时,由此提高程序访存效率。在此基础上,通过设计访存特征的判断方法,提出能够有效解决数据重叠的LDS访存向量化方法,实现一种面向国产通用加速器的LDS高效访存技术,确保向量化方法对访存效率的有效提升。实验结果表明:在使用LDS的异构程序中,LDS访存向量化实现后程序性能平均提升了22.6%,验证了所提方法的有效性;同时,向量化方法能够实现LDS线程间访存数据重叠问题的优化,使异构程序得到平均30%的性能提升。 展开更多
关键词 深度计算器 本地数据共享 访存向量化 访存特征 bank冲突
在线阅读 下载PDF
基于μC/OS-Ⅱ的机车DCU模拟板设计
9
作者 耿红伟 黎步银 《仪表技术与传感器》 CSCD 北大核心 2015年第10期43-45,74,共4页
针对韶山3型(SS3B)货运列车机车传动控制单元(DCU)模拟板存在的问题,从一定通用性、高稳定性、高性能3个方面出发,采用模块化的方法,提出了一种基于飞思卡尔平台的硬件和软件解决方案。系统硬件采用冗余电路设计,滤波设计,给出了硬件原... 针对韶山3型(SS3B)货运列车机车传动控制单元(DCU)模拟板存在的问题,从一定通用性、高稳定性、高性能3个方面出发,采用模块化的方法,提出了一种基于飞思卡尔平台的硬件和软件解决方案。系统硬件采用冗余电路设计,滤波设计,给出了硬件原理图。系统软件移植了实时操作系统μC/OS-Ⅱ,在此基础上编写了应用软件和新的滤波算法。多层设计的硬件结构,可靠的主控芯片以及实时操作系统,提高了系统运行的稳定性和实时性。实验调试表明各项功能符合设计要求。 展开更多
关键词 传动控制单元 冗余 飞思卡尔 实时操作系统 可靠性
在线阅读 下载PDF
面向“嵩山”平台供水管网仿真计算的移植优化研究
10
作者 郭恒亮 李冰洋 +3 位作者 杨周凡 韩璞 胥博文 商建东 《计算机应用与软件》 北大核心 2025年第4期44-50,共7页
供水管网仿真系统拓扑结构复杂,元件数据密集,系统的高效仿真对实施平台的性能提出了很高的要求。“嵩山”超级计算机系统采用CPU+DCU异构架构,为实现仿真计算在该架构上的高效运行。根据HIP异构编程模型将计算热点映射至DCU加速器上实... 供水管网仿真系统拓扑结构复杂,元件数据密集,系统的高效仿真对实施平台的性能提出了很高的要求。“嵩山”超级计算机系统采用CPU+DCU异构架构,为实现仿真计算在该架构上的高效运行。根据HIP异构编程模型将计算热点映射至DCU加速器上实现,使用MULTPARA多级并行优化方法实现不同元件计算在DCU加速器上的并发,解决线程块间不能充分并行的问题,利用跨线程访问方法解决部分元件计算中存在的线程束分化问题。实验结果表明,相较过往实施平台取得了8.537的加速比。 展开更多
关键词 异构并行 管网仿真计算 dcu加速器 MULTPARA方法 跨线程访问
在线阅读 下载PDF
基于PXI和CompactRIO平台构建列车传动控制单元测试环境 被引量:6
11
作者 李进进 苏理 +1 位作者 段静 莫伟书 《仪器仪表学报》 EI CAS CSCD 北大核心 2013年第S1期106-112,共7页
基于PXI平台的同步采集技术、CompactRIO平台的FPGA技术,利用图形化编程软件LabVIEW,快速构建了列车传动控制单元(DCU)的测试环境。该测试环境实现了列车网络控制系统、司机控制台的全仿真模拟,通过软件配置,可实现对地铁、动车组、机... 基于PXI平台的同步采集技术、CompactRIO平台的FPGA技术,利用图形化编程软件LabVIEW,快速构建了列车传动控制单元(DCU)的测试环境。该测试环境实现了列车网络控制系统、司机控制台的全仿真模拟,通过软件配置,可实现对地铁、动车组、机车等多种车型的DCU功能及性能测试。经实际试验验证,同步采集控制软件采集数据精确、数据传输实时性好,可实现对传动控制系统软硬件功能的全面测试,能够缩短研发周期,降低调试成本,避免实车调试风险。 展开更多
关键词 dcu PXI COMPACTRIO LABVIEW 数据采集
在线阅读 下载PDF
基于矩阵乘积态的有限纠缠量子傅里叶变换模拟 被引量:2
12
作者 刘晓楠 廉德萌 +1 位作者 杜帅岐 刘正煜 《计算机科学》 CSCD 北大核心 2024年第9期80-86,共7页
与经典计算不同,在量子计算中量子比特可以处于叠加态,多个量子比特之间还可以形成纠缠态。表示n个量子比特组成的量子态需要存储2^(n)个振幅,这种指数级的存储开销使得大规模的量子模拟难以进行。然而当量子态的纠缠程度有限时,使用矩... 与经典计算不同,在量子计算中量子比特可以处于叠加态,多个量子比特之间还可以形成纠缠态。表示n个量子比特组成的量子态需要存储2^(n)个振幅,这种指数级的存储开销使得大规模的量子模拟难以进行。然而当量子态的纠缠程度有限时,使用矩阵乘积态表示量子态仅需要线性的空间复杂度,可以扩大模拟的规模。使用HIP-Clang语言,基于CPU+DCU的异构编程模型,使用矩阵乘积态表示量子态,对量子傅里叶变换进行模拟。结合矩阵乘积态的特点,对量子傅里叶变换线路进行分析,减少模拟实现时不必要的张量缩并运算与正交化构建。对模拟过程中的张量缩并进行分析,使用TTGT算法完成张量缩并运算,同时利用DCU的并行处理能力来提高效率。对模拟结果进行分析,分别通过振幅误差与半经典Draper量子加法器的结果验证了模拟的正确性。对模拟规模进行分析,当量子态的纠缠熵最大时,使用16 GB的内存空间最多只能模拟24位的量子态,而当量子态内部纠缠程度较低时,可以对上百位的量子态进行量子傅里叶变换模拟。 展开更多
关键词 量子模拟 量子傅里叶变换 矩阵乘积态 异构计算 dcu HIP-Clang
在线阅读 下载PDF
面向国产异构平台的OpenMP Offload共享内存访存优化 被引量:2
13
作者 王鑫 李嘉楠 +2 位作者 韩林 赵荣彩 周强伟 《计算机工程与应用》 CSCD 北大核心 2023年第10期75-85,共11页
国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了... 国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了面向DCU平台的OpenMP Offload执行模式和LDS的分配方法,以及特定于LDS访存的指令结构,实现了LDS访存的手动支持。另外针对于OpenMP Offload的不同执行模式,在此优化方法的基础上实现了LDS访存的自动化,形成了一套面向国产异构平台的高效访存策略。实验采用polybench标准测试集进行测试,利用手动和自动优化方法在单线程模式下平均加速比可达2.60,利用手动优化方法在多线程non-SPMD模式下平均加速比达1.38,利用自动优化方法在多线程SPMD模式下平均加速比达1.11。实验结果表明LDS访存的自动和手动支持有助于提高OpenMP异构程序运行速度。 展开更多
关键词 国产处理器dcu 本地数据共享(LDS) OpenMP Offlaod SPMD non-SPMD
在线阅读 下载PDF
基于CAN总线仿真软件的SCR系统半实物仿真验证
14
作者 刘军 袁所贤 +2 位作者 熊明路 程伟 袁俊 《汽车技术》 北大核心 2016年第1期24-28,共5页
研究与制定了尿素喷射控制单元(DCU)的控制策略,包括尿素喷射控制策略和OBD诊断策略。搭建了SCR系统的半实物仿真平台,自主开发了CAN总线仿真软件,包括CAN初始化设置、CAN网络环境创建、数据发送及接收模块、用于扩展的信息解析模块等... 研究与制定了尿素喷射控制单元(DCU)的控制策略,包括尿素喷射控制策略和OBD诊断策略。搭建了SCR系统的半实物仿真平台,自主开发了CAN总线仿真软件,包括CAN初始化设置、CAN网络环境创建、数据发送及接收模块、用于扩展的信息解析模块等。基于CAN总线仿真软件对DCU的尿素喷射控制及OBD功能进行半实物仿真分析,结果表明,本文尿素喷射控制程序及OBD模块程序设计正确。 展开更多
关键词 SCR系统 dcu CAN总线 半实物仿真
在线阅读 下载PDF
副干酪乳杆菌水牛奶酸奶品质及其通便功能的评价 被引量:2
15
作者 刘敏 潘红梅 +4 位作者 吴志霜 王松梅 冯月梅 殷建忠 吴少雄 《中国乳品工业》 CSCD 北大核心 2017年第5期19-22,31,共5页
研究了含副干酪乳杆菌LYO 50 DCU-S的水牛奶酸奶品质及其润肠通便作用。实验对副干酪乳杆菌、保加利亚乳杆菌和嗜热链球菌混合发酵的水牛奶酸奶在1、7、14、21 d的发酵过程中的活菌数、p H值、酸度、黏度、持水力、感官指标等分别进行测... 研究了含副干酪乳杆菌LYO 50 DCU-S的水牛奶酸奶品质及其润肠通便作用。实验对副干酪乳杆菌、保加利亚乳杆菌和嗜热链球菌混合发酵的水牛奶酸奶在1、7、14、21 d的发酵过程中的活菌数、p H值、酸度、黏度、持水力、感官指标等分别进行测定,将其与保加利亚乳杆菌和嗜热链球菌混合发酵的水牛奶酸奶进行对比分析,探究了LYO 50 DCU-S是否可作为附属发酵剂应用到水牛奶酸奶生产中。将昆明种雄性小鼠分为空白组、模型组、对照组和3个副干酪乳杆菌给药组。使用复方地芬诺酯建立小鼠便秘模型,副干酪乳杆菌水牛奶酸奶给药7 d后,便秘小鼠首次排便时间缩短;连续15 d灌胃副干酪乳杆菌水牛奶酸奶后,便秘小鼠墨汁推进率显著增加。结果表明,将副干酪乳杆菌LYO 50 DCU-S作为附属菌应用到水牛奶酸奶生产中具有可行性,副干酪乳杆菌LYO 50DCU-S可显著改善水牛奶酸奶的润肠通便功能。 展开更多
关键词 副干酪乳杆菌LYO50dcu—S 发酵剂 通便
在线阅读 下载PDF
基于“嵩山”超级计算机系统的量子傅里叶变换模拟 被引量:6
16
作者 谢景明 胡伟方 +2 位作者 韩林 赵荣彩 荆丽娜 《计算机科学》 CSCD 北大核心 2021年第12期36-42,共7页
"嵩山"超级计算机系统是中国自主研发的新一代异构超级计算机集群,其搭载的CPU和DCU加速器均为我国自主研发。为扩充该平台的科学计算生态,验证量子计算研究在该平台上开展的可行性,文中使用异构编程模型实现了量子傅里叶变... "嵩山"超级计算机系统是中国自主研发的新一代异构超级计算机集群,其搭载的CPU和DCU加速器均为我国自主研发。为扩充该平台的科学计算生态,验证量子计算研究在该平台上开展的可行性,文中使用异构编程模型实现了量子傅里叶变换模拟在"嵩山"超级计算机系统上的异构版本,将程序的计算热点部分分配至DCU上运行;然后使用MPI在单计算节点上开启多进程,实现DCU加速器数据传输和计算的并发;最后,通过计算与通信的隐藏避免了DCU在数据传输时处于较长时间的空闲状态。实验首次在超算系统上实现了44 Qubits规模的量子傅里叶变换模拟,结果显示,异构版本的量子傅里叶变换模拟充分利用了DCU加速器计算资源,相较于传统CPU版本,其取得了11.594的加速比,且在集群上具有良好的可拓展性,该方法为其他量子算法在"嵩山"超级计算机系统上的模拟实现以及优化提供了参考。 展开更多
关键词 异构计算 量子傅里叶变换 dcu加速器 HIP-C MPI 通信隐藏
在线阅读 下载PDF
柴油机SCR后处理控制器的研发 被引量:3
17
作者 刘传宝 颜伏伍 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期7-13,共7页
基于某重型柴油机进行选择性催化还原(SCR)的后处理系统匹配,开发了SCR后处理控制器,采用高性能芯片MC9S12XEQ512进行了控制器硬件设计,并完成性能测试,对SCR系统控制策略进行了深入研究,利用催化器下游NO x传感器和废气流量计的测量值... 基于某重型柴油机进行选择性催化还原(SCR)的后处理系统匹配,开发了SCR后处理控制器,采用高性能芯片MC9S12XEQ512进行了控制器硬件设计,并完成性能测试,对SCR系统控制策略进行了深入研究,利用催化器下游NO x传感器和废气流量计的测量值作为期望输出,采用有导师学习方式的BP神经网络开发了催化器上游NO x排放估算模型,并基于此模型设计稳态工况添蓝计量控制策略,提出了催化器载体瞬态温变滞后修正算法和瞬态工况NH3泄漏控制策略.结果表明:设计的SCR控制系统瞬态工况的鲁棒性好,NO x转化率控制在60%左右,NH3泄漏量最大值控制在2.5×10-5以下;设计的控制器应用到目标发动机,经ESC和ETC试验验证排放达到国Ⅳ标准. 展开更多
关键词 柴油机 选择性催化还原 添蓝 BP神经网络 SCR电控单元
在线阅读 下载PDF
地铁列车旅客信息系统中司机控制单元的设计及实现 被引量:2
18
作者 邵玫 《城市轨道交通研究》 北大核心 2011年第1期94-97,共4页
根据地铁列车旅客信息系统的控制要求,利用C8051F系列单片机及图形点阵液晶模块和智能键盘控制器,构建了稳定的司机控制单元硬件结构,开发了基于Modbus协议并利用RS485总线实现的司机控制单元功能。应用表明,该部件的软硬件设计及通信... 根据地铁列车旅客信息系统的控制要求,利用C8051F系列单片机及图形点阵液晶模块和智能键盘控制器,构建了稳定的司机控制单元硬件结构,开发了基于Modbus协议并利用RS485总线实现的司机控制单元功能。应用表明,该部件的软硬件设计及通信完全满足地铁列车旅客信息系统对终端设备的要求。 展开更多
关键词 地铁列车 旅客信息系统 司机控制单元 MODBUS协议 单片机
在线阅读 下载PDF
广州地铁2号线屏蔽门系统的选择 被引量:2
19
作者 孙增田 王爱仪 《城市轨道交通研究》 2003年第1期54-57,共4页
地铁屏蔽门系统是一个典型的机电一体化产品 ,它在广州地铁 2号线的应用在国内的地铁中尚属首次。根据屏蔽门系统是带载运营的特点 ,对其材质选择、控制系统、执行电机等在设计。
关键词 地铁 屏蔽门系统 选择 平均无故障次数 故障率 车站设备 材质
在线阅读 下载PDF
基于数据流的视频解码微控制器设计
20
作者 阮建国 李陆军 《计算机工程》 CAS CSCD 北大核心 2010年第12期232-233,241,共3页
针对数字视频解码芯片设计中多种视频协议的解析问题,提出一种专用微控制器设计方法。该方法采用面向视频解析的指令集,针对视频解析过程的特点对指令进行特别优化,采用配合该专用微控制器的视频解析模型,较好实现了MPEG1/2、AVS、H.26... 针对数字视频解码芯片设计中多种视频协议的解析问题,提出一种专用微控制器设计方法。该方法采用面向视频解析的指令集,针对视频解析过程的特点对指令进行特别优化,采用配合该专用微控制器的视频解析模型,较好实现了MPEG1/2、AVS、H.264等视频协议的兼容,保证了解码效率且不会增加芯片面积和功耗。 展开更多
关键词 视频解码 解码控制单元 数据流 M叉树
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部