期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
FCC:多处理机上的并行图归约
1
作者
沈宁川
《计算机研究与发展》
EI
CSCD
北大核心
1991年第5期19-23,12,共6页
FCC是在多处理机上实现的FC 机。FC 机是CD-FFP2(FFP 的方言)的抽象并行图归约机。本文详细描述了如何在一个具有共享存储器的多处理机上实现CD-FFP2的并行图归约。
关键词
多处理机
并行
图
归约
计算机
在线阅读
下载PDF
职称材料
面向异构并行架构的大规模原型学习算法
2
作者
苏统华
李松泽
+2 位作者
邓胜春
于洋
白薇
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2016年第11期53-60,共8页
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少...
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题.
展开更多
关键词
原型学习
学习矢量量化
手写汉字识别
并行归约
异构
并行
计算
在线阅读
下载PDF
职称材料
项重写系统的并行实现方案
3
作者
肖勇
陈意云
《小型微型计算机系统》
CSCD
北大核心
1993年第12期16-21,共6页
项重写系统的并行归约可以提高归约的效率,在无共享内存的Transput-er网络上实现时要考虑任务的分配、项的拼装、归约任务的控制等问题,其中怎么样减少机间和机内进程的通讯是提高系统效率的关键。本文从控制方式角度讨论在不同拓扑结构...
项重写系统的并行归约可以提高归约的效率,在无共享内存的Transput-er网络上实现时要考虑任务的分配、项的拼装、归约任务的控制等问题,其中怎么样减少机间和机内进程的通讯是提高系统效率的关键。本文从控制方式角度讨论在不同拓扑结构的Transputer网络上实现项重写系统的方案,重点介绍基于树形结构下的控制方法,进程安排和通讯形式。
展开更多
关键词
项重写系统
并行归约
程序语言
在线阅读
下载PDF
职称材料
题名
FCC:多处理机上的并行图归约
1
作者
沈宁川
机构
电子科技大学计算机系
出处
《计算机研究与发展》
EI
CSCD
北大核心
1991年第5期19-23,12,共6页
基金
国家"863"计划资助课题
文摘
FCC是在多处理机上实现的FC 机。FC 机是CD-FFP2(FFP 的方言)的抽象并行图归约机。本文详细描述了如何在一个具有共享存储器的多处理机上实现CD-FFP2的并行图归约。
关键词
多处理机
并行
图
归约
计算机
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
面向异构并行架构的大规模原型学习算法
2
作者
苏统华
李松泽
邓胜春
于洋
白薇
机构
哈尔滨工业大学软件学院
中建八局大连公司
诺基亚通信系统技术(北京)有限公司浙江分公司
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2016年第11期53-60,共8页
基金
国家自然科学基金(61203260)
黑龙江省自然科学基金重点项目(ZD2015017)
哈尔滨工业大学科研创新基金(HIT.NSRIF.2015083)
文摘
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题.
关键词
原型学习
学习矢量量化
手写汉字识别
并行归约
异构
并行
计算
Keywords
prototype learning
learning vector quantization
Chinese character recognition
parallel reduction
heterogeneous parallel computing
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
项重写系统的并行实现方案
3
作者
肖勇
陈意云
机构
中国科技大学计算机系
出处
《小型微型计算机系统》
CSCD
北大核心
1993年第12期16-21,共6页
基金
国家自然科学基金
文摘
项重写系统的并行归约可以提高归约的效率,在无共享内存的Transput-er网络上实现时要考虑任务的分配、项的拼装、归约任务的控制等问题,其中怎么样减少机间和机内进程的通讯是提高系统效率的关键。本文从控制方式角度讨论在不同拓扑结构的Transputer网络上实现项重写系统的方案,重点介绍基于树形结构下的控制方法,进程安排和通讯形式。
关键词
项重写系统
并行归约
程序语言
Keywords
Term rewriting system Parallel reduction Transputer Communication link
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
FCC:多处理机上的并行图归约
沈宁川
《计算机研究与发展》
EI
CSCD
北大核心
1991
0
在线阅读
下载PDF
职称材料
2
面向异构并行架构的大规模原型学习算法
苏统华
李松泽
邓胜春
于洋
白薇
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
3
项重写系统的并行实现方案
肖勇
陈意云
《小型微型计算机系统》
CSCD
北大核心
1993
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部