-
题名Kaffe在龙芯2E上的移植
- 1
-
-
作者
辛博坤
王永吉
潘远明
徐帆江
-
机构
中国科学院软件研究所互联网软件技术实验室
中国科学院研究生院
中国科学院软件研究所基础软件研究中心
中国科学院软件研究所综合信息系统技术国家级重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第2期330-334,共5页
-
基金
国家863高技术研究发展计划基金项目(2006AA010201)
国家十一五国防预研基金项目
-
文摘
为了在龙芯2E处理器上建立稳定的Java运行环境,丰富龙芯平台的上层软件库,以Kaffe这款开源Java虚拟机为移植对象,分析了其运行机制,确定了其代码结构中平台相关的3个主要模块:SysCallMethod、Trampoline和JIT,并结合龙芯2E处理器的特点,给出了相关模块的修改方案。最后用第三方的测试标准对移植后的虚拟机进行了测试,表明了移植的有效性。
-
关键词
JAVA虚拟机
KAFFe
龙芯2e
MIPS指令集
及时编译器
-
Keywords
JVM
Kaffe
Godson2e
MIPS
JIT
-
分类号
TP311.54
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于龙芯SIMD技术的H.264视频解码优化
被引量:5
- 2
-
-
作者
顾丽红
王锐
陈华才
吴少刚
-
机构
中国石油大学(华东)计算机与通信工程学院
江苏中科梦兰电子科技有限公司国家级企业技术中心
-
出处
《计算机工程与设计》
北大核心
2017年第12期3361-3367,3373,共8页
-
基金
江苏省工业和信息产业转型升级专项基金项目
-
文摘
为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。
-
关键词
单指令流多数据流
龙芯3A
GS464
GS464e微架构
FFmpeg多媒体库
H.264解码优化
-
Keywords
SIMD
Loongson 3A
GS464/GS464 eprocessor architecture
FFmpeg multimedia framework
H.264 decoder optimization
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名龙芯2号处理器功能部件设计
被引量:1
- 3
-
-
作者
张戈
齐子初
胡伟武
-
机构
中国科学院计算技术研究所计算机系统结构重点实验室
中国科学院研究生院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第6期967-973,共7页
-
基金
国家"八六三"高技术研究发展计划基金项目(2002AA111100
2002AA110010)~~
-
文摘
功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现,除实现完整的MIPS定、浮点指令集外,还实现了龙芯2号类MMX自定义多媒体指令集以及定点操作在浮点部件(FPU)中的数据通路复用.龙芯2号浮点部件遵照IEEE754和MIPS相关标准,浮点加法4拍完成,浮点乘法5拍完成,浮点除法4~17拍完成.物理设计支持0.18μm工艺下主频500MHz的标准单元实现,浮点单精度峰值性能达到2GFLOPS.双精度峰值性能达到1GFLOPS.
-
关键词
龙芯2号处理器
功能部件设计
浮点部件
多媒体指令集
-
Keywords
Godson-2 processor
functional units design
floating-point units
multimedia instruction set
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名面向龙芯平台的快速DCT算法及其实现
被引量:1
- 4
-
-
作者
王明
彭成磊
都思丹
-
机构
南京大学电子科学与工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第17期223-225,228,共4页
-
基金
国家"863"计划基金资助项目(2006AA010201)
-
文摘
针对龙芯2E平台不能流畅播放视频文件的问题,对视频变换过程进行优化,采用一种新的离散余弦变换(DCT)算法,基于龙芯2E多媒体指令集对其进行实现,用该算法替代FFmpeg软件中的DCT算法。测试结果表明,新的DCT算法性能比传统DCT算法提高近11倍,优化后的FFmpeg软件编码速度提高10%左右。
-
关键词
离散余弦变换算法
龙芯2e多媒体指令集
FFmpeg软件
-
Keywords
Discrete Cosine Transform(DCT) algorithm
Loongson 2e multimedia instruction set
FFmpeg software
-
分类号
TP51
[自动化与计算机技术]
-