期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
面向天河2A系统的基于蒙特卡罗方法的粒子输运异构协同计算 被引量:3
1
作者 李彪 刘杰 《计算机工程与科学》 CSCD 北大核心 2020年第11期1922-1928,共7页
粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;... 粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;在Matrix2000加速器端,通过OpenMP指令开发程序的线程级并行;优化了原MC程序串行数据收集通信模式,提出了新的二叉树通信模式,极大地减少了通信时间。实现的基于CPU/Matrix2000异构协同计算的并行程序,在天河2A系统上进行测试,大规模测试可以扩展到45万核,相对5万核并行效率保持在22.54%。 展开更多
关键词 粒子输运 异构协同计算 蒙特卡罗方法 OPENMP 国产加速器
在线阅读 下载PDF
自主机器人的伴随观察模式及其软件实现框架 被引量:2
2
作者 薛元洲 杨硕 毛新军 《计算机科学》 CSCD 北大核心 2023年第7期1-9,共9页
自主机器人是一类运行于开放环境下、可自主决策和执行其自主行为的信息物理系统,它根据任务需求进行决策产生行为策略并调度执行。环境状态的动态变化性常常导致规划的行为策略不再适用于当前环境,使得行为执行的结果不符合预期,从而... 自主机器人是一类运行于开放环境下、可自主决策和执行其自主行为的信息物理系统,它根据任务需求进行决策产生行为策略并调度执行。环境状态的动态变化性常常导致规划的行为策略不再适用于当前环境,使得行为执行的结果不符合预期,从而影响自主机器人的任务实现。上述问题对自主机器人软件的行为决策和软件构造均提出了更高的要求。一方面,自主机器人需在行为策略执行过程中加强对环境状态及其变化的观察,并基于观察的结果及时、灵活地调整行为决策,提升机器人的观察模式及行为决策算法的复杂度。另一方面,上述观察、决策、执行行为的复杂交互提升了软件构件抽象及数据交互的复杂性,如何抽象机器人的传感、决策、效应等软构件功能,并提供相适配的软件架构,成为自主机器人软件构造面临的重要挑战。针对上述挑战,首先提出自主机器人伴随行为的思想,显式定义观察与效应行为之间的伴随交互关系,根据行为执行不同阶段提出前提伴随观察模式和目标伴随观察模式,以提升自主机器人对环境变化的感知能力和决策调整能力。其次,开发了一款基于多智能体系统的自主机器人软件开发框架AutoRobot,该框架将机器人的传感器、效应器及规划器抽象为一组自主的软件智能体,智能体间通过自主决策和协同实现上述伴随观察模式。AutoRobot框架针对不同角色智能体设计和封装了一组可重用的软件组件,可有效支持自主机器人软件的复用和高效开发。最后,开展了仿真环境下的实验分析,通过与ROSPlan和DESPOT两种自主机器人任务规划和执行方法进行对比,验证了基于伴随观察模式的任务规划与执行的高效性和有效性。 展开更多
关键词 自主机器人 开放环境 伴随观察模式 任务规划 任务执行
在线阅读 下载PDF
开源软件版本发布与开源社区贡献评估的关系实证研究 被引量:2
3
作者 董晨 尹刚 《计算机应用与软件》 北大核心 2020年第4期12-16,24,共6页
软件版本发布这一软件管理活动不仅直接影响开源软件用户的使用体验,同时也会在一定程度上影响着开源社区的贡献评估过程。针对此问题,对开源软件版本发布与开源社区贡献评估的关系展开实证研究,着重分析软件版本发布对贡献的第一次评... 软件版本发布这一软件管理活动不仅直接影响开源软件用户的使用体验,同时也会在一定程度上影响着开源社区的贡献评估过程。针对此问题,对开源软件版本发布与开源社区贡献评估的关系展开实证研究,着重分析软件版本发布对贡献的第一次评估反馈以及接受概率的影响。根据实验结果,对目前的开源社区提出相应的实践建议,以促进开源社区更加有效地管理软件版本发布与贡献评估之间的关系,使得开源社区能够更加良性发展。 展开更多
关键词 开源软件 版本发布 贡献评估 实证研究
在线阅读 下载PDF
云际分布记账模型、机理与关键技术展望 被引量:1
4
作者 史佩昌 王怀民 傅翔 《电子学报》 EI CAS CSCD 北大核心 2024年第1期19-33,共15页
云际计算是支持公有云、私有云、边缘云和微云等异源异质云服务以自主对等方式纵横协作共赢的新型计算模式,可为独立云服务实体间行为交互、信任构建和贡献度量等提供防篡改、可追溯能力支持,进而最大限度削弱阻碍不同利益攸关者协作的... 云际计算是支持公有云、私有云、边缘云和微云等异源异质云服务以自主对等方式纵横协作共赢的新型计算模式,可为独立云服务实体间行为交互、信任构建和贡献度量等提供防篡改、可追溯能力支持,进而最大限度削弱阻碍不同利益攸关者协作的不确定性因素.提升云际协作意愿和效率需要基于何种机理进行何种机制创新,是云际计算成长演化中需要进一步阐述的新问题.本文首先以基于“数字空间证据”构建或增强信任关系为设计原则,提出了基于区块链的云际分布记账软件定义模型,并系统阐述了分布记账支撑云际服务独立性、可审计性以及释放云际协作潜能的内在机理;其次,面向云际复杂交互行为,深化并固化了云际分布记账运行逻辑流程及关键环节的设计,避免其在错综复杂要素综合作用下呈现不确定冲突和矛盾;再次,针对数据要素流通及复杂异步交互场景,细化并优化了云际分布记账合约逻辑模型;最后,论述了以分布共识、智能合约等为代表的云际分布记账核心技术及相应指标的现状,并对关键技术的目标属性体系、前瞻性挑战等进行了展望. 展开更多
关键词 云际计算 区块链 分布记账 分布共识 智能合约
在线阅读 下载PDF
YH-ACT:热工流体力学并行应用程序
5
作者 刘杰 龚春叶 +10 位作者 杨博 郭晓威 甘新标 李胜国 李超 陈旭光 肖调杰 穆利安 宋敏 赵冬勇 鞠羽中 《计算机工程与科学》 CSCD 北大核心 2021年第1期58-69,共12页
商业CFD程序已广泛应用于反应堆的热工水力模拟,但不能完全满足反应堆的应用需求;开源CFD程序有部分应用,但与商业CFD程序相比,在物理模型全面性、计算精度、计算效率及易用性等方面仍存在差距。为更好地满足局部精细热工水力分析的需求... 商业CFD程序已广泛应用于反应堆的热工水力模拟,但不能完全满足反应堆的应用需求;开源CFD程序有部分应用,但与商业CFD程序相比,在物理模型全面性、计算精度、计算效率及易用性等方面仍存在差距。为更好地满足局部精细热工水力分析的需求,需要更全面的物理模型、较高的计算精度和较好的并行计算效率,因此有必要开发自主热工CFD程序。详细描述了热工流体力学并行应用程序YH-ACT的设计、实现方案以及测试结果。选取3个典型案例,通过与典型商业软件Fluent计算结果进行对比验证软件正确性,程序并行计算规模达到400个结点共9600个进程,稳态计算加速比为111.7,并行效率为27.9%,瞬态计算加速比为37.2,并行效率为9.3%。 展开更多
关键词 热工流体力学 计算流体力学 并行算法 高性能计算
在线阅读 下载PDF
基于MPI的高精度归约函数设计与实现 被引量:4
6
作者 何康 黄春 +3 位作者 姜浩 谷同祥 齐进 刘杰 《计算机工程与科学》 CSCD 北大核心 2021年第4期594-602,共9页
随着科学工程计算大规模、高维数和长时程的特性越来越显著,浮点舍入误差的累积效应往往使得计算结果不可信,提高计算精度成为了并行计算领域研究的热点之一。基于MPICH3框架,采用无误差变换技术构建新的数据格式和相应运算操作符,设计... 随着科学工程计算大规模、高维数和长时程的特性越来越显著,浮点舍入误差的累积效应往往使得计算结果不可信,提高计算精度成为了并行计算领域研究的热点之一。基于MPICH3框架,采用无误差变换技术构建新的数据格式和相应运算操作符,设计了高精度归约函数MPI_ACCU_REDUCE,实现了高精度的求和、求积和求L2范数3种MPI归约运算。数值实验结果表明,提出的3种高精度归约运算有效提高了数值计算的精度。 展开更多
关键词 MPI 高精度计算 归约操作 无误差变换
在线阅读 下载PDF
潜艇使用自航式声诱饵防御鱼雷模型并行计算方法研究 被引量:8
7
作者 李雯 迟利华 +2 位作者 张会 张哲 刘杰 《计算机工程与科学》 CSCD 北大核心 2020年第12期2163-2168,共6页
潜艇使用自航式声诱饵防御声自导鱼雷是水下防御的主要手段之一,传统穷举统计方法计算量随决策参数增多而急剧增加,无法满足实时性要求。从基于多实体有限状态机的鱼雷防御模型出发,提出了2级并行策略,在进程和线程间划分仿真循环,通过... 潜艇使用自航式声诱饵防御声自导鱼雷是水下防御的主要手段之一,传统穷举统计方法计算量随决策参数增多而急剧增加,无法满足实时性要求。从基于多实体有限状态机的鱼雷防御模型出发,提出了2级并行策略,在进程和线程间划分仿真循环,通过数据交换作出最优决策。实验结果表明,并行后的模型可以在短时间内作出和实际作战情况相近的决策,在404个方案仿真的计算量下,模型运行时间从144.65 s缩短至1.2 s,获得了120倍的加速比,有效解决了实时方案决策的问题。 展开更多
关键词 自航式声诱饵 鱼雷防御 并行算法
在线阅读 下载PDF
一种改进的基于深度神经网络的偏微分方程求解方法 被引量:6
8
作者 陈新海 刘杰 +1 位作者 万仟 龚春叶 《计算机工程与科学》 CSCD 北大核心 2022年第11期1932-1940,共9页
偏微分方程求解是计算流体力学等科学与工程领域中数值分析的计算核心。由于物理的多尺度特性和对离散网格质量的敏感性,传统的数值求解方法通常包含复杂的人机交互和昂贵的网格剖分开销,限制了其在许多实时模拟和优化设计问题上的应用... 偏微分方程求解是计算流体力学等科学与工程领域中数值分析的计算核心。由于物理的多尺度特性和对离散网格质量的敏感性,传统的数值求解方法通常包含复杂的人机交互和昂贵的网格剖分开销,限制了其在许多实时模拟和优化设计问题上的应用效率。提出了一种改进的基于深度神经网络的偏微分方程求解方法TaylorPINN。该方法利用深度神经网络的万能逼近定理和泰勒公式的函数拟合能力,实现了无网格的数值求解过程。在Helmholtz、Klein-Gordon和Navier-Stokes方程上的数值实验结果表明,TaylorPINN能够很好地拟合计算域内时空点坐标与待求函数值之间的映射关系,并提供了准确的数值预测结果。与常用的基于物理信息神经网络方法相比,对于不同的数值问题,TaylorPINN将预测精度提升了3~20倍。 展开更多
关键词 偏微分方程 数值分析 神经网络 泰勒公式 无网格
在线阅读 下载PDF
基于RMC的蒙特卡罗程序性能优化 被引量:2
9
作者 徐海坤 匡邓晖 +1 位作者 刘杰 龚春叶 《计算机工程与科学》 CSCD 北大核心 2021年第4期634-640,共7页
蒙特卡罗MC方法是核反应堆设计和分析中重要的粒子输运模拟方法。MC方法能够模拟复杂几何形状且计算结果精度高,缺点是需要耗费大量时间进行上亿规模粒子模拟。如何提高蒙特卡罗程序的性能成为大规模蒙特卡罗数值模拟的挑战。基于堆用... 蒙特卡罗MC方法是核反应堆设计和分析中重要的粒子输运模拟方法。MC方法能够模拟复杂几何形状且计算结果精度高,缺点是需要耗费大量时间进行上亿规模粒子模拟。如何提高蒙特卡罗程序的性能成为大规模蒙特卡罗数值模拟的挑战。基于堆用蒙特卡罗分析程序RMC,先后开展了基于TCMalloc动态内存分配优化、OpenMP线程调度策略优化、vector内存对齐优化和基于HDF5的并行I/O优化等一系列优化手段,对于200万粒子的算例,使其总体性能提高26.45%以上。 展开更多
关键词 蒙特卡罗方法 性能优化 内存管理 并行I/O
在线阅读 下载PDF
SOTIMiner:一种基于集合运算的时序不变式挖掘方法 被引量:1
10
作者 孙德权 周竞文 周海芳 《软件学报》 EI CSCD 北大核心 2022年第2期455-472,共18页
时序不变式反映了事件间的时序逻辑关系,被广泛应用于异常检测、系统行为理解、模型推理等技术.在实际使用中,一般通过分析软件系统的日志数据挖掘时序不变式.相比全序日志,偏序日志可为挖掘算法提供更为准确的数据来源.但是,现有的基... 时序不变式反映了事件间的时序逻辑关系,被广泛应用于异常检测、系统行为理解、模型推理等技术.在实际使用中,一般通过分析软件系统的日志数据挖掘时序不变式.相比全序日志,偏序日志可为挖掘算法提供更为准确的数据来源.但是,现有的基于偏序日志的时序不变式挖掘方法存在效率较低等问题.为此,以系统执行路径为数据来源,提出了一种基于集合运算的时序不变式挖掘方法SOTIMiner,并研究了改进方案.相比现有方法,该方法不需要反向遍历日志数据,从而具有较高效率.实验显示.该方法在保证挖掘相同结果的基础上,效率平均是Synoptic挖掘工具的3.23倍. 展开更多
关键词 系统执行路径 时序不变式 集合运算 SOTIMiner
在线阅读 下载PDF
面向语音分离的深层转导式非负矩阵分解并行算法
11
作者 李雨蓉 刘杰 +2 位作者 刘亚林 龚春叶 王勇 《计算机科学》 CSCD 北大核心 2020年第8期49-55,共7页
非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算... 非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算问题,文中提出深层转导式非负矩阵分解并行算法,综合考虑迭代更新过程的数据关联性,设计了一种任务间和任务内多级并行算法。该并行算法在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务进行并行计算;在任务内部进程级把矩阵按行列划分,主进程把矩阵块分发到从进程,从进程接收当前矩阵块并计算结果矩阵子块,然后将当前进程矩阵块发送到下一进程,实现第二个矩阵中每一个矩阵块在所有进程的遍历,并计算结果矩阵对应子块的乘积,最后由主进程收集从进程数据块;在线程级子矩阵乘法运算的过程中,采取生成多线程,通过共享内存交换数据计算子矩阵块的加速策略。该算法为首个实现深层转导式非负矩阵分解的并行算法。在天河二号平台上的测试结果表明,在分离多说话人混合语音信号时,相比串行程序,所提出的并行算法能在不改变分离效果的前提下,使得预训练过程中使用64个进程的加速比为18,分离过程使用64个进程的对应加速比为24。相较于串行及MPI模型分离,混合模型分离时间大大缩短,从而证明了设计的并行算法可有效提高语音分离的效率。 展开更多
关键词 深层转导式非负矩阵分解并行算法 乘性迭代更新规则加速算法 消息传递接口 共享存储并行编程 语音分离
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部