最优线程数设置是影响多线程程序性能和功耗的关键之一。然而,目前寻找最优线程数的算法通常是从单一固定起点开始搜索,往往会造成搜索精度低、搜索开销大的问题。最优线程数的分布和位置与多种因素有关,包括程序所属类型、优化目标(性...最优线程数设置是影响多线程程序性能和功耗的关键之一。然而,目前寻找最优线程数的算法通常是从单一固定起点开始搜索,往往会造成搜索精度低、搜索开销大的问题。最优线程数的分布和位置与多种因素有关,包括程序所属类型、优化目标(性能、功耗和EDP(Energy-delay Product))、并行的多线程区域、软硬件配置参数等。围绕能效优先的最优线程数搜索问题,提出了能效优先的特定起点分类最优线程数搜索算法(Energy-Efficiency-First Optimal Thread Number Search Algorithm based on Specific Starting Point Classification,简称TS^(3)方法)”,通过设计基于程序分类的特殊起点设定方法来确定搜索起点,并采用启发式算法和二分查找方法搜索最优线程数,提升搜索效率,有效提升了能效优先目标(性能最优、功耗最优、能效EDP最优)下的最优线程数搜索精度并降低了搜索开销。在两个x86和一个ARM平台上用8个benchmark对算法有效性进行了详细实验验证,结果表明,与Baseline相比,TS^(3)方法的性能平均提升0.29%(平台A)、0.17%(平台B)、10.77%(平台C);功耗平均降低2.35%(平台A)、1.87%(平台B)、15.97%(平台C);EDP平均降低6.36%(平台A)、5.07%(平台B)、46.94%(平台C)。在3个平台上,与目前经典搜索方法相比,TS^(3)方法的性能平均提升10.16%,功耗平均降低13.45%,EDP平均降低23.77%;搜索开销平均降低86.8%。展开更多
针对现有数字矢量信号分析仪上位机软件调制信号种类少、分析功能不完善、流畅性差的问题,文中提出一种基于Qt5.12的多线程信号生成和分析的高性能软件架构,设计了一种利用星座映射表进行快速调制的通用调制解调结构体和一种基于环形缓...针对现有数字矢量信号分析仪上位机软件调制信号种类少、分析功能不完善、流畅性差的问题,文中提出一种基于Qt5.12的多线程信号生成和分析的高性能软件架构,设计了一种利用星座映射表进行快速调制的通用调制解调结构体和一种基于环形缓冲器结构的多相分解成型滤波方法用于基带信号处理。所设计算法对生成信号解调的EVM小于0.1%,对软件无线电生成信号解调的平均EVM小于2.95%。程序使用互斥锁和线程同步保证内存安全,软件生成处理10亿个码元并绘制多域图像用时3 h 27 min 12 s,图像刷新率为72 f/s,全程运行流畅。测试结果表明,该软件算法准确度高、性能优异,可应用于实际信号测量分析。展开更多
文摘最优线程数设置是影响多线程程序性能和功耗的关键之一。然而,目前寻找最优线程数的算法通常是从单一固定起点开始搜索,往往会造成搜索精度低、搜索开销大的问题。最优线程数的分布和位置与多种因素有关,包括程序所属类型、优化目标(性能、功耗和EDP(Energy-delay Product))、并行的多线程区域、软硬件配置参数等。围绕能效优先的最优线程数搜索问题,提出了能效优先的特定起点分类最优线程数搜索算法(Energy-Efficiency-First Optimal Thread Number Search Algorithm based on Specific Starting Point Classification,简称TS^(3)方法)”,通过设计基于程序分类的特殊起点设定方法来确定搜索起点,并采用启发式算法和二分查找方法搜索最优线程数,提升搜索效率,有效提升了能效优先目标(性能最优、功耗最优、能效EDP最优)下的最优线程数搜索精度并降低了搜索开销。在两个x86和一个ARM平台上用8个benchmark对算法有效性进行了详细实验验证,结果表明,与Baseline相比,TS^(3)方法的性能平均提升0.29%(平台A)、0.17%(平台B)、10.77%(平台C);功耗平均降低2.35%(平台A)、1.87%(平台B)、15.97%(平台C);EDP平均降低6.36%(平台A)、5.07%(平台B)、46.94%(平台C)。在3个平台上,与目前经典搜索方法相比,TS^(3)方法的性能平均提升10.16%,功耗平均降低13.45%,EDP平均降低23.77%;搜索开销平均降低86.8%。
文摘针对现有数字矢量信号分析仪上位机软件调制信号种类少、分析功能不完善、流畅性差的问题,文中提出一种基于Qt5.12的多线程信号生成和分析的高性能软件架构,设计了一种利用星座映射表进行快速调制的通用调制解调结构体和一种基于环形缓冲器结构的多相分解成型滤波方法用于基带信号处理。所设计算法对生成信号解调的EVM小于0.1%,对软件无线电生成信号解调的平均EVM小于2.95%。程序使用互斥锁和线程同步保证内存安全,软件生成处理10亿个码元并绘制多域图像用时3 h 27 min 12 s,图像刷新率为72 f/s,全程运行流畅。测试结果表明,该软件算法准确度高、性能优异,可应用于实际信号测量分析。