-
题名多处理部件并行优化方法研究
- 1
-
-
作者
李钊
郑红
-
机构
北京航空航天大学自动化科学与电气工程学院
-
出处
《计算机工程》
CAS
CSCD
2014年第9期305-311,共7页
-
基金
国家自然科学基金资助项目(60543006)
博士点基金资助项目(201003259)
光电信息重点实验室基金资助项目(9140C150105100C1502)
-
文摘
针对多处理单元(PE)并行优化中运行时间和资源消耗随PE数量变化而增加的问题,分析多PE并行中运行时间和资源消耗随PE数量的变化规律,建立基于运行时间和资源消耗的优化目标函数,并从理论上证明优化目标函数最小值的存在性和唯一性,提出基于运行时间与资源消耗的多PE并行优化方法。该优化方法可在最小资源消耗的情况下实现运行时间的最优化。利用灰度共生矩阵和单精度浮点矩阵乘法的多PE优化方法进行验证。实验结果表明,多PE并行的优化方法实现了运行时间和资源消耗的优化,在运行时间上该方法比已有方法最高快6.79倍,在运行时间和资源消耗的综合对比上该方法最高为已有方法的3.3倍,能够实现基于运行时间和资源消耗的优化。
-
关键词
多处理单元并行
优化方法
运行时间
资源消耗
灰度共生矩阵
单精度浮点矩阵乘法
-
Keywords
multiple processing element(pe)in parallel
optimization method
runtime
area consumption
gray level co-occurrence matrix
single float matrix multiplication
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种高性能固定语音识别并行处理架构
被引量:1
- 2
-
-
作者
于志华
张兴明
杨镇西
张丽
-
机构
国家数字交换系统工程技术研究中心
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第8期2419-2421,2446,共4页
-
基金
国家"863"计划资助项目(2011AA010603)
-
文摘
针对固定语音识别系统后端大量的模板匹配识别运算,提出了一种多处理单元并行超标量匹配处理架构,有效地提升了大容量模板库条件下实时处理性能。将所提出的并行匹配处理架构在Virtex-6 FPGA上进行了实现,其结果显示,在保证识别精度的情况下,处理能力得到显著提高。
-
关键词
固定语音识别
处理单元
匹配
并行
FPGA
-
Keywords
specific speech recognition
processing element(pe)
matching
parallel
FPGA
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名数据并行计算机体系结构研究
- 3
-
-
作者
王鹏飞
张发存
段敬红
-
机构
西安理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第15期249-251,共3页
-
基金
陕西省教育厅基金资助项目(07JK357)
西安理工大学校创新基金资助项目(116-210711)
-
文摘
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。
-
关键词
PIM技术
数据并行体系结构
可重构总线
处理元阵列
指令集体系结构
-
Keywords
PIM technology
data parallel architecture
reconfigurable bus
processing element(pe) array
instruction set architecture
-
分类号
N945
[自然科学总论—系统科学]
-