期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
Kaffe在龙芯2E上的移植
1
作者 辛博坤 王永吉 +1 位作者 潘远明 徐帆江 《计算机工程与设计》 CSCD 北大核心 2010年第2期330-334,共5页
为了在龙芯2E处理器上建立稳定的Java运行环境,丰富龙芯平台的上层软件库,以Kaffe这款开源Java虚拟机为移植对象,分析了其运行机制,确定了其代码结构中平台相关的3个主要模块:SysCallMethod、Trampoline和JIT,并结合龙芯2E处理器的特点... 为了在龙芯2E处理器上建立稳定的Java运行环境,丰富龙芯平台的上层软件库,以Kaffe这款开源Java虚拟机为移植对象,分析了其运行机制,确定了其代码结构中平台相关的3个主要模块:SysCallMethod、Trampoline和JIT,并结合龙芯2E处理器的特点,给出了相关模块的修改方案。最后用第三方的测试标准对移植后的虚拟机进行了测试,表明了移植的有效性。 展开更多
关键词 JAVA虚拟机 KAFFe 龙芯2e MIPS指令 及时编译器
在线阅读 下载PDF
基于龙芯SIMD技术的H.264视频解码优化 被引量:5
2
作者 顾丽红 王锐 +1 位作者 陈华才 吴少刚 《计算机工程与设计》 北大核心 2017年第12期3361-3367,3373,共8页
为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热... 为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。 展开更多
关键词 指令流多数据流 龙芯3A GS464 GS464e微架构 FFmpeg多媒体 H.264解码优化
在线阅读 下载PDF
龙芯2号处理器功能部件设计 被引量:1
3
作者 张戈 齐子初 胡伟武 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期967-973,共7页
功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现... 功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现,除实现完整的MIPS定、浮点指令集外,还实现了龙芯2号类MMX自定义多媒体指令集以及定点操作在浮点部件(FPU)中的数据通路复用.龙芯2号浮点部件遵照IEEE754和MIPS相关标准,浮点加法4拍完成,浮点乘法5拍完成,浮点除法4~17拍完成.物理设计支持0.18μm工艺下主频500MHz的标准单元实现,浮点单精度峰值性能达到2GFLOPS.双精度峰值性能达到1GFLOPS. 展开更多
关键词 龙芯2号处理器 功能部件设计 浮点部件 多媒体指令
在线阅读 下载PDF
面向龙芯平台的快速DCT算法及其实现 被引量:1
4
作者 王明 彭成磊 都思丹 《计算机工程》 CAS CSCD 北大核心 2009年第17期223-225,228,共4页
针对龙芯2E平台不能流畅播放视频文件的问题,对视频变换过程进行优化,采用一种新的离散余弦变换(DCT)算法,基于龙芯2E多媒体指令集对其进行实现,用该算法替代FFmpeg软件中的DCT算法。测试结果表明,新的DCT算法性能比传统DCT算法提高近11... 针对龙芯2E平台不能流畅播放视频文件的问题,对视频变换过程进行优化,采用一种新的离散余弦变换(DCT)算法,基于龙芯2E多媒体指令集对其进行实现,用该算法替代FFmpeg软件中的DCT算法。测试结果表明,新的DCT算法性能比传统DCT算法提高近11倍,优化后的FFmpeg软件编码速度提高10%左右。 展开更多
关键词 离散余弦变换算法 龙芯2e多媒体指令集 FFmpeg软件
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部