期刊文献+
共找到272篇文章
< 1 2 14 >
每页显示 20 50 100
A fast computational method for the landing footprints of space-to-ground vehicles 被引量:2
1
作者 LIU Qingguo LIU Xinxue +1 位作者 WU Jian LI Yaxiong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第5期1062-1076,共15页
Fast computation of the landing footprint of a space-to-ground vehicle is a basic requirement for the deployment of parking orbits, as well as for enabling decision makers to develop real-time programs of transfer tra... Fast computation of the landing footprint of a space-to-ground vehicle is a basic requirement for the deployment of parking orbits, as well as for enabling decision makers to develop real-time programs of transfer trajectories. In order to address the usually slow computational time for the determination of the landing footprint of a space-to-ground vehicle under finite thrust, this work proposes a method that uses polynomial equations to describe the boundaries of the landing footprint and uses back propagation(BP) neural networks to quickly determine the landing footprint of the space-to-ground vehicle. First, given orbital parameters and a manoeuvre moment, the solution model of the landing footprint of a space-to-ground vehicle under finite thrust is established. Second, given arbitrary orbital parameters and an arbitrary manoeuvre moment, a fast computational model for the landing footprint of a space-to-ground vehicle based on BP neural networks is provided.Finally, the simulation results demonstrate that under the premise of ensuring accuracy, the proposed method can quickly determine the landing footprint of a space-to-ground vehicle with arbitrary orbital parameters and arbitrary manoeuvre moments. The proposed fast computational method for determining a landing footprint lays a foundation for the parking-orbit configuration and supports the design of real-time transfer trajectories. 展开更多
关键词 space-to-ground vehicle landing footprint back propagation(BP)neural network fast computational method Pontryagin's minimum principle
在线阅读 下载PDF
基于FastCAE的Geant4集成关键技术研究
2
作者 余昊昊 唐滨 《计算机工程与科学》 北大核心 2025年第2期210-218,共9页
蒙特卡罗应用工具包Geant4主要用于模拟粒子在物质中输运的物理过程,被广泛应用在空间应用、辐射医学以及加速器物理等领域,然而Geant4默认交互界面简单、输入文件和命令繁琐,易用性较差。首先,依托FastCAE开源前后处理集成平台,开展面... 蒙特卡罗应用工具包Geant4主要用于模拟粒子在物质中输运的物理过程,被广泛应用在空间应用、辐射医学以及加速器物理等领域,然而Geant4默认交互界面简单、输入文件和命令繁琐,易用性较差。首先,依托FastCAE开源前后处理集成平台,开展面向Geant4求解器集成的关键技术研究,包含构建集几何建模、网格划分、求解计算、后处理可视化一体化的仿真软件解决方案。其次,针对集成中的几何模型转为物理几何体问题,开发了“Geometry”和“mesh”2种文件转换方式,同时通过将Geant4的结果文件vtu和vtp转换为vtk文件,实现了Geant4计算结果的可视化。最后,通过质子放疗算例实现了Geant4完整集成流程,证明了开发的网格转换方式和可视化方法满足性能需求。提出的方案可提高Geant4二次开发效率,加速产品化进程。 展开更多
关键词 GEANT4 物理几何体生成 可视化 求解器集成 fastCAE
在线阅读 下载PDF
Orbit Design for Responsive Space Using Multiple-objective Evolutionary Computation
3
作者 FU Xiaofeng WU Meiping ZHANG Jing 《空间科学学报》 CAS CSCD 北大核心 2012年第2期238-244,共7页
Responsive orbits have exhibited advantages in emergencies for their excellent responsiveness and coverage to targets.Generally,there are several conflicting metrics to trade in the orbit design for responsive space.A... Responsive orbits have exhibited advantages in emergencies for their excellent responsiveness and coverage to targets.Generally,there are several conflicting metrics to trade in the orbit design for responsive space.A special multiple-objective genetic algorithm,namely the Nondominated Sorting Genetic AlgorithmⅡ(NSGAⅡ),is used to design responsive orbits.This algorithm has considered the conflicting metrics of orbits to achieve the optimal solution,including the orbital elements and launch programs of responsive vehicles.Low-Earth fast access orbits and low-Earth repeat coverage orbits,two subtypes of responsive orbits,can be designed using NSGAI under given metric tradeoffs,number of vehicles,and launch mode.By selecting the optimal solution from the obtained Pareto fronts,a designer can process the metric tradeoffs conveniently in orbit design.Recurring to the flexibility of the algorithm,the NSGAI promotes the responsive orbit design further. 展开更多
关键词 Multiple-objective evolutionary computation Non-dominated Sorting Genetic AlgorithmⅡ(NSGAⅡ) Low-Earth fast Access Orbit(FAO) Low-Earth Repeat Coverage Orbit(RCO) Successive-coverage constellation for responsive deployment
在线阅读 下载PDF
基于机器人–机床制造单元的开放式边缘平台数控系统开发 被引量:1
4
作者 韩振宇 郭震宇 +2 位作者 严一钊 宋剑鑫 金鸿宇 《航空制造技术》 北大核心 2025年第4期22-35,共14页
制造业逐步向智能化和柔性化的方向发展。机器人与机床协同工作可以使整个生产过程更加高效灵活,但传统的控制系统及云计算服务无法满足其数据交互的需求。本文面向机器人–机床制造单元,提出了一种开放式边缘平台的服务架构。提出了以... 制造业逐步向智能化和柔性化的方向发展。机器人与机床协同工作可以使整个生产过程更加高效灵活,但传统的控制系统及云计算服务无法满足其数据交互的需求。本文面向机器人–机床制造单元,提出了一种开放式边缘平台的服务架构。提出了以实时Linux为基础,以ROS和LinuxCNC开源平台为核心,采用EtherCAT主站通信的机器人–机床协同控制系统方案。在控制器与服务器中部署Fast DDS,实现了不同数据的网络接入,并利用容器技术构建边缘微服务环境,实现了数据的高效交互和传输。最后,搭建了试验平台,完成了系统性能测试。试验验证了所提出方案的可行性。 展开更多
关键词 边缘计算 开放式数控系统 边缘数据传输 fastDDS 工业机器人
在线阅读 下载PDF
一种基于频域内推理计算的长短期记忆神经网络硬件加速器设计
5
作者 靳松 陈诗琪 《计算机学报》 北大核心 2025年第8期1781-1794,共14页
长短期记忆神经网络(Long Short-Term Memory,LSTM)可以捕捉到序列数据间长距离的依赖关系,因此在时间序列预测、自然语言分析和语音识别等领域得到广泛应用。然而,LSTM网络独特的门控机制和状态更新过程导致其推理计算的复杂度较高,参... 长短期记忆神经网络(Long Short-Term Memory,LSTM)可以捕捉到序列数据间长距离的依赖关系,因此在时间序列预测、自然语言分析和语音识别等领域得到广泛应用。然而,LSTM网络独特的门控机制和状态更新过程导致其推理计算的复杂度较高,参数量较大,对其在资源受限的边缘设备上的部署形成挑战。本文提出一种基于频域内推理计算的长短期记忆神经网络硬件加速器设计。采用循环分块矩阵对网络的权重参数进行压缩存储,结合快速傅里叶变换(Fast Fourier Transform,FFT)和频域激活函数实现频域内网络推理计算,避免在处理不同时间样本时频繁的时域-频域切换开销。采用坐标旋转数字计算机算法(Coordinate Rotation Digital Computer,CORDIC)替换频域内的乘法运算和超函数计算,实现LSTM的低功耗硬件部署。提出的硬件加速器在PYNQ-Z2开发板上进行了原型实现。面向开源时间序列数据集的实验结果表明,加速器实现了63.6μs的网络平均推理延迟,功耗1.743 W,相比时域LSTM推理计算延迟降低了44.2%,功耗降低6.4%。同时,BRAM和FIFO的资源占用率仅为5%和2%,相比时域LSTM推理计算分别降低了83%和91.2%。 展开更多
关键词 长短期记忆神经网络 分块循环矩阵 坐标旋转数字计算机 频域推理计算 快速傅里叶变换
在线阅读 下载PDF
基于稳定性的FAST TCP参数γ调整 被引量:5
6
作者 梁伟 张顺颐 +1 位作者 宁向延 徐苏磊 《通信学报》 EI CSCD 北大核心 2010年第7期53-59,共7页
对FASTTCP拥塞控制算法中的参数γ设置范围做了研究。首先,提出了一种基于控制理论的网络流量数学模型,对方程线性化之后进行了拉普拉斯变换,得到1个带负反馈的线性窗口拥塞控制系统。接着,根据Routh-Hurwitz判据对系统进行了二阶稳定... 对FASTTCP拥塞控制算法中的参数γ设置范围做了研究。首先,提出了一种基于控制理论的网络流量数学模型,对方程线性化之后进行了拉普拉斯变换,得到1个带负反馈的线性窗口拥塞控制系统。接着,根据Routh-Hurwitz判据对系统进行了二阶稳定分析。然后,针对1个、2个以及无穷多FAST数据流共享一条瓶颈链路的情况,分析了窗口控制参数γ在满足稳定条件下选择的范围,得出了参数γ满足稳定的充分条件。最后,用ns2的数据分组仿真结果证明了所得结论的正确性。 展开更多
关键词 计算机网络 拥塞控制 fastTCP 拉普拉斯变换 奈奎斯特
在线阅读 下载PDF
基于二次反应修正的富油煤快速热解过程模拟
7
作者 杨盼曦 郭伟 +4 位作者 俞尊义 王晶 李红强 杨伯伦 吴志强 《煤炭学报》 北大核心 2025年第8期4066-4078,共13页
富油煤具有产油潜力大的资源属性,与粉煤快速热解焦油收率较高的工艺特点相匹配。将富油煤作为快速热解原料可以获得较高的焦油收率,但依旧面临着焦油中重质组分较高的挑战。挥发分之间的二次反应是影响快速热解焦油品质的重要因素,深... 富油煤具有产油潜力大的资源属性,与粉煤快速热解焦油收率较高的工艺特点相匹配。将富油煤作为快速热解原料可以获得较高的焦油收率,但依旧面临着焦油中重质组分较高的挑战。挥发分之间的二次反应是影响快速热解焦油品质的重要因素,深入分析热解二次反应的机理与特点是解决焦油低品质问题的前提与基础,然而目前缺少描述在反应器高温环境内气相挥发分之间二次反应的有效动力学模型,及其与计算流体力学进行结合以模拟真实热解反应器中二次反应作用的应用案例。从化学渗透脱挥发分(Chemical Percolation Devolatilization,CPD)模型出发,在简化煤分子结构及一次反应网络的基础上进一步构建焦油及轻质气体内部组分相互转化、焦油歧化生成气固产物的二次反应体系。采用OpenFOAM开源软件计算考虑二次反应修正的固定床快速热解过程中产物演变规律,探究了热解载气温度、颗粒粒径以及挥发分停留时间对富油煤热解产物分布的影响。结果表明:考虑二次反应修正的热解动力学模型能描述焦油产率随温度升高先增加后减小的趋势,焦油产率在载气温度为873 K下达到最高值10.1%。颗粒粒径主要影响热解的升温速率与挥发分的停留时间,从而间接影响焦油产率与品质。当粒径减小为48μm(300目),焦油产率可以进一步提升至12.4%。随着停留时间的缩短,二次反应进行的程度减小,焦油总产率与品质也会有所提高,焦油产率相对增加将近20.1%,焦油轻组分质量分数由0.621提升至0.677。研究结果有望为富油煤快速热解焦油产物的品质调控提供理论指导。 展开更多
关键词 富油煤 二次反应 快速热解 网格动力学模型 计算流体动力学
在线阅读 下载PDF
跨越开边界的测地距离传播
8
作者 岳子佳 王文嵩 +2 位作者 陈双敏 辛士庆 屠长河 《图学学报》 北大核心 2025年第5期1042-1049,共8页
在数字几何处理领域,曲面上测地距离的计算是一项基本且关键的任务。在计算过程中,每个表面点同时扮演着接收器与发射器的角色,以实现整个曲面上的距离传播。当存在开边界缺陷时,已有算法尝试在外蕴空间中填补孔洞和缝隙。然而,其在应... 在数字几何处理领域,曲面上测地距离的计算是一项基本且关键的任务。在计算过程中,每个表面点同时扮演着接收器与发射器的角色,以实现整个曲面上的距离传播。当存在开边界缺陷时,已有算法尝试在外蕴空间中填补孔洞和缝隙。然而,其在应对高度弯曲处出现的开边界缺陷时仍显不足。为此,提出在不补洞的情况下让距离传播自然跨越孔洞的新思路。观察发现,传统算法在跨越孔洞后,会形成一个“阴影”区域;该区域内的最短路径经由孔洞的边界,从而产生了比真正测地距离更大的结果。基于该观察,对经典的快速行进法(FMM)进行了3项重要改进:首先,仅将边界点视为距离接收器,阻止向其他点传播距离;其次,允许每个点向前后2个方向传播距离,使得阴影区域内的点可以从周边的可见点获得测地距离;最后,通过调整距离传播的优先级实现“由近及远”和“从可见区域到阴影区域”这2种传播方式之间的平衡。实验证明,即使是极为复杂的开边界缺陷,该方法依然产生接近于真解(模型没有缺陷情况下)的测地距离。 展开更多
关键词 计算几何 测地距离 快速行进法 缺陷网格 开边界
在线阅读 下载PDF
基于R-tree索引的卫星可见窗口快速算法
9
作者 杜丙男 康峻 +3 位作者 李佩峰 宋沛然 杜康宁 曹林 《计算机应用与软件》 北大核心 2025年第10期285-295,322,共12页
针对地球观测卫星多星多目标场景下可见窗口计算耗时过高问题提出一种快速计算方法。该方法将多对多观测问题分解为若干单对单子问题,依据星下点轨迹R-tree索引获取待观测目标周边星下点轨迹信息,结合二分法确定卫星对该目标可见时间窗... 针对地球观测卫星多星多目标场景下可见窗口计算耗时过高问题提出一种快速计算方法。该方法将多对多观测问题分解为若干单对单子问题,依据星下点轨迹R-tree索引获取待观测目标周边星下点轨迹信息,结合二分法确定卫星对该目标可见时间窗口的起止时刻。对锥形、矩形两种视场类型的卫星观测仿真结果表明,可见时刻结果精确至1 ms时,该算法得到的可见时刻与Satellite Tool Kit(STK)的平均误差为-8.5×10^(-4)s,与跟踪传播法相比能够减少99%以上的计算冗余,平均耗时是以1 ms为步长的跟踪传播法的0.01%,能够同时满足实际工程应用中对目标观测窗口计算精度和时效性要求。 展开更多
关键词 观测卫星 可见窗口 快速算法 R-tree索引 并行计算
在线阅读 下载PDF
云计算下大规模激光图像快速分类和识别方法 被引量:1
10
作者 朱阳燕 梅香香 《激光杂志》 北大核心 2025年第3期113-119,共7页
大规模激光图像识别方法受到计算能力和数据处理速度的限制,难以满足快速分类和识别需求。云计算的出现,给解决该问题提供了思路。设计一种云计算下大规模激光图像快速分类和识别方法。利用云计算平台对激光图像进行数学形态分析和预处... 大规模激光图像识别方法受到计算能力和数据处理速度的限制,难以满足快速分类和识别需求。云计算的出现,给解决该问题提供了思路。设计一种云计算下大规模激光图像快速分类和识别方法。利用云计算平台对激光图像进行数学形态分析和预处理,确保图像在后续处理中能够保持一致的形态和特征。借助平台上的小波分析技术,对预处理后的激光图像实施降噪处理,有效去除图像中的噪声干扰,提升图像质量。在得到无噪声图像后,进一步利用云计算平台的分布式资源,高效提取图像特征,获取精确描述图像纹理属性的特征参量。将这些特征参量与其他特征相结合,共同构建出完整的图像特征向量。通过比较不同图像的特征向量,准确判断它们之间的相似性和差异性,实现激光图像的精确分类和识别。实验数据对比分析表明,相较于传统方法,该方法在处理速度和识别精度上均有显著的提升,不仅能够有效地处理大规模激光图像数据,还能显著提高图像识别的准确性和效率,为激光图像识别技术的发展提供了新的思路和方法。 展开更多
关键词 云计算 大规模激光图像 降噪处理 特征提取 快速识别
在线阅读 下载PDF
基于OSG与Qt的FAST三维场景仿真 被引量:5
11
作者 李昌明 李东年 +3 位作者 赵正旭 宋立强 姜鹏 孙才红 《计算机应用与软件》 北大核心 2022年第2期1-5,62,共6页
为解决FAST基地可视化的问题,开发了一套基于OpenSceneGraph(OSG)与Qt的三维场景仿真系统。通过三维建模,计算机程序自动化布局,OSG虚拟场景搭建等,将FAST的场景进行仿真显示。通过数据驱动实现对虚拟场景的实时更新,同时采用OSG的粒子... 为解决FAST基地可视化的问题,开发了一套基于OpenSceneGraph(OSG)与Qt的三维场景仿真系统。通过三维建模,计算机程序自动化布局,OSG虚拟场景搭建等,将FAST的场景进行仿真显示。通过数据驱动实现对虚拟场景的实时更新,同时采用OSG的粒子系统来模拟雨雪天气特效场景。该系统将FAST的场景实时显现在技术工作人员面前,具有场景漫游,动态演示等基本人机交互功能,可为FAST基地的实践工作提供辅助决策依据。 展开更多
关键词 fast 三维场景仿真 自动化布局 数据驱动 人机交互
在线阅读 下载PDF
合成孔径雷达快速后向投影算法综述 被引量:13
12
作者 邢孟道 马鹏辉 +2 位作者 楼屹杉 孙光才 林浩 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期1-22,共22页
后向投影(BP)算法是合成孔径雷达成像算法发展的重要方向之一。然而,由于BP算法具有较大的计算量,阻碍了其在工程应用上的发展。因此,近年来如何有效地提高BP算法的运算效率受到了广泛的重视。该文讨论了基于多种成像面坐标系的快速BP算... 后向投影(BP)算法是合成孔径雷达成像算法发展的重要方向之一。然而,由于BP算法具有较大的计算量,阻碍了其在工程应用上的发展。因此,近年来如何有效地提高BP算法的运算效率受到了广泛的重视。该文讨论了基于多种成像面坐标系的快速BP算法,包括距离-方位平面坐标系、地平面坐标系和非欧氏坐标系。该文首先简要介绍了原始BP算法的原理和不同坐标系对加速BP算法的影响,并对BP算法的发展历程进行梳理。然后讨论了基于不同成像面坐标系的快速BP算法的研究进展,并重点介绍了作者所在研究团队近年来在快速BP成像方面完成的研究工作。最后介绍了快速BP算法在工程上的应用,并展望了未来快速BP成像算法的研究发展趋势。 展开更多
关键词 合成孔径雷达 快速后向投影算法 成像面 坐标系 运算效率
在线阅读 下载PDF
Parallel FFT Algorithm on Computer Clusters
13
作者 YU Xiu-min 《Journal of Northeast Agricultural University(English Edition)》 CAS 2005年第2期160-162,共3页
DFT is widely applied in the field of signal process and others. Most present rapid ways of calculation are either based on paralleled computers connected by such particular systems like butterfly network, hypercube e... DFT is widely applied in the field of signal process and others. Most present rapid ways of calculation are either based on paralleled computers connected by such particular systems like butterfly network, hypercube etc; or based on the assumption of instant transportation, non-conflict communication, complete connection of paralleled processors and unlimited usable processors. However, the delay of communication in the system of information transmission cannot be ignored. This paper works on the following aspects: instant transmission, dispatching missions, and the path of information through the communication link in the computer cluster systems; layout of the dynamic FFT algorithm under the different structures of computer clusters. 展开更多
关键词 fast fourier transform FFT) computer clusters ALGORITHM
在线阅读 下载PDF
钠基纳米流体中钠原子吸附行为特性模拟计算
14
作者 朴君 李春晖 +3 位作者 阿不都赛米·亚库甫 张智刚 王荣东 矫彩山 《原子能科学技术》 EI CAS CSCD 北大核心 2024年第9期1912-1919,共8页
钠基纳米流体利用过渡金属纳米颗粒吸附钠原子的性质,有效降低了钠原子的反应性,进而有效抑制钠火及钠水事故严重性,但目前相关吸附行为及规律尚不明确。研究基于密度泛函理论和电子结构分析,计算分析了钛、铁和铜纳米团簇(TM_(n),TM=Ti... 钠基纳米流体利用过渡金属纳米颗粒吸附钠原子的性质,有效降低了钠原子的反应性,进而有效抑制钠火及钠水事故严重性,但目前相关吸附行为及规律尚不明确。研究基于密度泛函理论和电子结构分析,计算分析了钛、铁和铜纳米团簇(TM_(n),TM=Ti、Fe、Cu,n=2~13)及其与钠原子间形成复合物(Na-TM_(n))的结构和性质,分析了TM_(n)的稳定性以及其与Na原子间相互作用。结果表明,Ti_(n)具有最高的稳定性,但其吸附钠原子的能力低于Fe_(n)和Cu_(n)。钠原子主要通过范德华作用吸附于TM_(n)表面,且两者间的电荷转移行为使得TM_(n)带负电荷。 展开更多
关键词 钠冷快堆 纳米流体 过渡金属 计算化学 团簇
在线阅读 下载PDF
可验证延迟函数与延迟加密研究综述 被引量:1
15
作者 李鹏 张明武 杨波 《密码学报(中英文)》 CSCD 北大核心 2024年第2期282-307,共26页
可验证延迟函数(verifiabledelayfunction,VDF)是由Boneh等人于2018年提出的一种密码学原语,无论并行与否,该函数的计算时间都是固定的,但要求验证其结果是快速的.在诸如随机信标和区块链协议设计等去中心化应用中,VDF能使用例如重复平... 可验证延迟函数(verifiabledelayfunction,VDF)是由Boneh等人于2018年提出的一种密码学原语,无论并行与否,该函数的计算时间都是固定的,但要求验证其结果是快速的.在诸如随机信标和区块链协议设计等去中心化应用中,VDF能使用例如重复平方的计算任务来提供可靠的消逝时间证明(proofofelapsedtime,PoET),以实现区块链的共识.本文重点介绍了五种VDF候选方案及其构造,比较它们之间的优劣,说明其可能存在的问题和特性,阐述VDF在随机信标、资源高效的区块链、复制证明、计算时间戳和延迟加密上的应用,尤其对于2021年刚引入的延迟加密(delayencryption,DE)做了详细的调查和分析,对现有的两种延迟加密方案及构造进行了重点分析.在现有VDF研究基础上,本文总结了VDF的现状,提出所需要关注的研究动态,进而指出Loe等人的P-VDF是目前五种VDF候选中最为实用的,优势明显.它具有空证明和高效验证的优点,且验证算法的运行时间为O(1).最后,本文对VDF的未来发展趋势作了有益的分析和展望. 展开更多
关键词 时间锁谜题 可验证延迟函数 顺序缓慢计算 快速验证 延迟加密
在线阅读 下载PDF
利用四阶样条小波快速计算信号的希尔伯特变换 被引量:2
16
作者 康会刚 余波 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期124-136,共13页
在有限区间内计算给定信号的希尔伯特变换是数据分析中的一个重要问题。在现存的最好算法中,该问题的计算复杂度为O(nlog n),其中n为信号长度。为了进一步提高计算速度,本文建立一种基于四阶样条小波计算信号的希尔伯特变换的快速算法,... 在有限区间内计算给定信号的希尔伯特变换是数据分析中的一个重要问题。在现存的最好算法中,该问题的计算复杂度为O(nlog n),其中n为信号长度。为了进一步提高计算速度,本文建立一种基于四阶样条小波计算信号的希尔伯特变换的快速算法,将计算复杂度从O(nlog n)降到O(n)。数值实验表明该算法在具有更快计算速度的同时,具有与现存最好算法可比较的计算精度。 展开更多
关键词 希尔伯特变换 样条小波 基数B-样条 快速算法 计算复杂度
在线阅读 下载PDF
电推进涵道风扇气动快速求解方法及性能分析研究 被引量:1
17
作者 刘乾 刘汉儒 +1 位作者 尚珣 王掩刚 《推进技术》 EI CAS CSCD 北大核心 2024年第3期131-138,共8页
随着绿色航空发展,为了能在设计阶段快速获得涵道风扇气动性能参数和非定常流场特征,有必要开发一种高效的数值求解方法。基于小型电推进风扇内流弱可压和尾迹耗散特性,本文将转子和涵道的面元与尾迹涡粒子耦合,使用面元法求解固壁流场... 随着绿色航空发展,为了能在设计阶段快速获得涵道风扇气动性能参数和非定常流场特征,有必要开发一种高效的数值求解方法。基于小型电推进风扇内流弱可压和尾迹耗散特性,本文将转子和涵道的面元与尾迹涡粒子耦合,使用面元法求解固壁流场,使用涡量输运方程求解远场尾迹传播特征,克服了有限体积法尾迹耗散快的问题。研究表明,本文发展的面元-涡粒子耦合方法对涵道风扇叶表压力与有限体积法趋势一致,整体推力误差为7.83%,能满足工程快速预测需求。本文发展的高效非定常计算方法的尾迹计算数值耗散低,能揭示更为复杂的非定常流动现象,仿真结果显示风扇涵道对尾迹发展有明显约束,而当尾迹传播至外部时,涡量呈现出明显的收缩和对称分布特征。在计算效率方面,本文发展的耦合方法非定常计算效率高,计算相同非定常时间步耗时仅为有限体积法的1/6,具有潜在的涵道动力非定常设计应用价值。 展开更多
关键词 电推进系统 涵道风扇 面元-涡粒子法 非定常气动计算 快速预测方法
在线阅读 下载PDF
基于整数U变换的图像压缩方法 被引量:1
18
作者 袁茜茜 蔡占川 +1 位作者 石武祯 尹文楠 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第10期124-134,共11页
整数变换方法因其较快的计算速度被国际图像和视频编码标准广泛采纳。现有基于连续正交函数系的整数变换方法不仅难以获得原始变换的准确整数形式,而且无法克服在非连续信号表达时出现的吉布斯震荡现象,降低了重构图像质量。为此,文中... 整数变换方法因其较快的计算速度被国际图像和视频编码标准广泛采纳。现有基于连续正交函数系的整数变换方法不仅难以获得原始变换的准确整数形式,而且无法克服在非连续信号表达时出现的吉布斯震荡现象,降低了重构图像质量。为此,文中提出了基于非连续正交U系统的整数变换算法及其图像压缩方法。首先,采用分段积分法和施密特正交化法计算出U系统的2维正交变换矩阵,提取行向量的缩放因子得到整数矩阵;接着,建立整数U矩阵的可逆正交变换方法,使用整数矩阵将离散图像信息的能量集中到少量数据集,同时将缩放因子与量化步骤合并以减轻计算负担;然后,采用矩阵分解法将整数U矩阵分解为稀疏矩阵的乘积,从而实现图像变换的快速计算;最后,设计基于整数U变换模块和逆变换模块的图像压缩方法,用于减轻图像存储和传输压力。实验结果表明:文中方法与其他相关方法相比,可以降低图像可逆变换的截断误差;在图像和视频压缩实验中,在相同的压缩率下文中方法获得的压缩图像质量更高,而且快速变换方法可以有效地节省运算时间。 展开更多
关键词 图像压缩 整数变换 非连续正交U系统 吉布斯现象 快速计算
在线阅读 下载PDF
基于RISC-Ⅴ的深度可分离卷积神经网络加速器 被引量:1
19
作者 曹希彧 陈鑫 魏同权 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2536-2551,共16页
人工智能时代,RISC-Ⅴ作为一种新兴的开源精简指令集架构,因其低功耗、模块化、开放性和灵活性等优势,使之成为一种能够适应不断发展的深度学习模型和算法的新平台.但是在硬件资源及功耗受限环境下,基础的RISC-Ⅴ处理器架构无法满足卷... 人工智能时代,RISC-Ⅴ作为一种新兴的开源精简指令集架构,因其低功耗、模块化、开放性和灵活性等优势,使之成为一种能够适应不断发展的深度学习模型和算法的新平台.但是在硬件资源及功耗受限环境下,基础的RISC-Ⅴ处理器架构无法满足卷积神经网络对高性能计算的需求.为了解决这一问题,本文设计了一个基于RISC-Ⅴ的轻量化深度可分离卷积神经网络加速器,旨在弥补RISC-Ⅴ处理器的卷积计算能力的不足.该加速器支持深度可分离卷积中的两个关键算子,即深度卷积和点卷积,并能够通过共享硬件结构提高资源利用效率.深度卷积计算流水线采用了高效的Winograd卷积算法,并使用2×2数据块组合拼接成4×4数据片的方式来减少传输数据冗余.同时,通过拓展RISC-Ⅴ处理器端指令,使得加速器能够实现更灵活的配置和调用.实验结果表明,相较于基础的RISC-Ⅴ处理器,调用加速器后的点卷积和深度卷积计算取得了显著的加速效果,其中点卷积加速了104.40倍,深度卷积加速了123.63倍.与此同时,加速器的性能功耗比达到了8.7GOPS/W.本文的RISC-Ⅴ处理器结合加速器为资源受限环境下卷积神经网络的部署提供了一个高效可行的选择. 展开更多
关键词 神经网络 深度可分离卷积 RISC-Ⅴ Winograd快速卷积 硬件加速
在线阅读 下载PDF
面向飞腾处理器平台的快速卷积算法优化
20
作者 赵亚飞 杨耀功 +1 位作者 王永刚 魏继增 《上海理工大学学报》 CAS CSCD 北大核心 2024年第6期610-619,共10页
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中... 为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中的访存效率。配合分块方案设计实现高性能的矩阵乘法微内核,使用向量外积运算更新数据,提高计算访存比,实现最大程度掩盖访存指令的延迟。最终实验结果表明,FastInfer在FT-2000/4处理器上的峰值计算性能达到99.56 GFLOPS。在不同输入规模的通用矩阵乘法测试中,FastInfer性能是OpenBLAS算法的1.07倍和1.52倍。在卷积测试中,FastInfer性能是ARM Compute Library算法的1.32倍,实现了在FT-2000/4多核处理器上的高性能卷积计算。 展开更多
关键词 深度学习 快速卷积算法 并行计算 通用矩阵乘法
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部