期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
过渡金属X(X=Cr、Mn、Fe、Tc、Re)掺杂Janus Ga_(2)SSe的第一性原理研究
1
作者 张基麟 梁前 +1 位作者 钱国林 谢泉 《原子与分子物理学报》 CAS 北大核心 2024年第2期166-174,共9页
利用密度泛函理论的第一性原理赝势平面波方法,研究过渡金属X(X=Cr、Mn、Fe、Tc、Re)原子掺杂Janus Ga_(2)SSe的磁性、电子性质及光学性质.研究表明:过渡金属掺杂Janus Ga_(2)SSe体系在Chalcogen-rich条件下有着比Ga-rich条件下更好的... 利用密度泛函理论的第一性原理赝势平面波方法,研究过渡金属X(X=Cr、Mn、Fe、Tc、Re)原子掺杂Janus Ga_(2)SSe的磁性、电子性质及光学性质.研究表明:过渡金属掺杂Janus Ga_(2)SSe体系在Chalcogen-rich条件下有着比Ga-rich条件下更好的稳定性.其中Mn掺杂体系形成能在两种条件下皆为最低.本征Ga_(2)SSe是具有2.02 eV带隙的间接带隙半导体,在紫外区域有着很好的光伏吸收能力.与本征Ga_(2)SSe相比,Cr掺杂体系自旋向上通道出现杂质能级,自旋向上与向下通道不对称,呈磁矩为2.797μB铁磁性半金属.Mn掺杂体系在其自旋向上通道产生的杂质能级,呈磁矩为3.645μB的磁性P型半导体.Fe掺杂体系自旋向下通道产生的杂质能级,呈磁矩为3.748μB磁性P型半导体.在Tc与Re掺杂后,带隙皆由间接变直接带隙,呈无磁性的P型半导体.从光学性质来看,各掺杂体系与未掺杂Ga_(2)SSe在介电常数和折射系数上相比有着明显的增强,吸收系数在高能量区(3~10 eV)出现蓝移现象.有着在紫外探测器和光伏吸收领域潜在的应用前景. 展开更多
关键词 二维Janus Ga_(2)sse 过渡金属掺杂 磁学性质 电子结构 光学性质
在线阅读 下载PDF
在医学图像处理中使用MMX及SSE指令 被引量:5
2
作者 罗若愚 鲁强 曾绍群 《计算机应用研究》 CSCD 北大核心 2005年第1期239-242,共4页
介绍了使用MMX及SSE指令来提高医学图像处理软件运行效率的原理和方法,并在深层次上对处理器工作原理进行了探讨,分析了在实际软件开发中使用的例程,并提供了部分源代码。
关键词 mmx sse 医学图像处理
在线阅读 下载PDF
基于SSE2的Smith-Waterman算法 被引量:2
3
作者 戴正华 张庆丹 +2 位作者 徐琳 谭光明 冯圣中 《计算机工程与应用》 CSCD 北大核心 2006年第11期85-87,共3页
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Sm... Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。 展开更多
关键词 Smith-Waterman 算法 细粒度并行算法 SIMD sse2
在线阅读 下载PDF
H.264编码器的SSE2指令级优化 被引量:2
4
作者 王琰 向校萱 祁燕 《计算机工程与应用》 CSCD 2012年第10期217-221,共5页
H.264视频编码标准采用了很多新技术,具有更优越的编码效率,同时也增加了计算复杂度,无法满足实时应用。由于单指令多数据扩展指令集2(SSE2)的并行运算能力可以提高计算机对多媒体数据的实时处理。文中主要采用了SSE2对H.264中的一些耗... H.264视频编码标准采用了很多新技术,具有更优越的编码效率,同时也增加了计算复杂度,无法满足实时应用。由于单指令多数据扩展指令集2(SSE2)的并行运算能力可以提高计算机对多媒体数据的实时处理。文中主要采用了SSE2对H.264中的一些耗时较多的关键模块,例如整数像素运动估计中计算SAD、整数DCT变换、量化、Hadamard变换以及亚像素运动估计中计算SATD进行了指令级优化。实验结果表明,经过优化后,在保持视频图像质量的前提下,相应模块运行速度得到了提高,使H.264编码器整体的编码速度较好地满足实时要求。 展开更多
关键词 H.264编码 绝对误差和 整数DCT变换 变换绝对差值总和 单指令多数据扩展指令集2(sse2)
在线阅读 下载PDF
SSE2指令在代码优化中的关键作用研究 被引量:2
5
作者 范建军 《华中师范大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第4期423-426,共4页
代码优化是提高应用程序性能的重要手段,单指令多数据流作为一项动态改善应用程序性能的技术已被工业界广泛接受.通过对Intel的第二代单指令多数据流扩展指令系统SSE2在程序优化中的重要方法和关键实现的研究,给出实践中有关代码优化的... 代码优化是提高应用程序性能的重要手段,单指令多数据流作为一项动态改善应用程序性能的技术已被工业界广泛接受.通过对Intel的第二代单指令多数据流扩展指令系统SSE2在程序优化中的重要方法和关键实现的研究,给出实践中有关代码优化的解决方法. 展开更多
关键词 代码优化 sse2 SIMD技术
在线阅读 下载PDF
活泼配盐[(μ-RE)(μ-E′)Fe_2(CO)_6][Et_3NH][E,E′=S,Se]的亲电反应研究——蝶状Fe_2SSe及Fe_2Se_2簇合物的合成及表征
6
作者 宋礼成 颜朝国 胡青眉 《无机化学学报》 SCIE CAS CSCD 北大核心 1997年第2期207-211,共5页
本文由[(μtBuS)(μCO)Fe2(CO)6][Et3NH]和硒粉形成的[(μtBuS)(μSe)Fe2(CO)6][Et3NH],分别与溴化苄,二碘甲烷及邻一、间一、对一双(溴甲基)苯反应,合成了蝶... 本文由[(μtBuS)(μCO)Fe2(CO)6][Et3NH]和硒粉形成的[(μtBuS)(μSe)Fe2(CO)6][Et3NH],分别与溴化苄,二碘甲烷及邻一、间一、对一双(溴甲基)苯反应,合成了蝶状Fe2SSe单簇物(μtBuS)(μPhCH2Se)Fe2(CO)6(3a)和双簇物[(μtBuS)Fe2(CO)6]2(μSeZSeμ)[Z=CH2,o.m.p双(亚甲基)苯](4ad)。类似地,由[(μPhSe)(μCO)Fe2(CO)6][Et3NH]和硫粉或硒粉所形成的[(μPhSe)(μS)Fe2(CO)6][Et3NH]或[(μPhSe)(μSe)Fe2(CO)6][Et3NH]分别与对一双(溴甲基)苯反应合成了蝶状Fe2SSe和Fe2Se2双簇物[(μPhSe)Fe2(CO)6]2[μS(pCH2C6H4CH2)Sμ](5a)及[(μPhSe)Fe2(CO)6]2[μSe(PCH2C6H4CH2)Seμ](5b)。所有产物均经元素分析、IR和1HNMR表征。 展开更多
关键词 簇合物 蝶状 Fe2sse Fe2Se2 亲电反应
在线阅读 下载PDF
视频编码中环路滤波的SSE2优化方法研究 被引量:1
7
作者 董志平 陈水仙 艾浩军 《计算机工程与应用》 CSCD 北大核心 2006年第8期34-36,140,共4页
视频编码中的环路滤波是计算密集运算,利用SSE2指令系统的特性,提出了数据重排和位掩蔽两种优化策略。实验结果表明,可使平均性能提高77%以上。
关键词 环路滤波 视频编码 sse2
在线阅读 下载PDF
基于SSE2的模板匹配并行算法改进 被引量:1
8
作者 龚浩 戚其丰 《控制工程》 CSCD 2005年第S1期120-122,共3页
Intel处理器的SSE2(Streaming SIMD Extensions 2,数据流单指令多数据扩展)技术,支持指令级SIMD操作,提供了单处理器上并行处理的解决方法。将模板匹配算法用SSE2 技术并行化,在Linux平台下用GCC编译实现。试验结果表明:SSE2技术大大加... Intel处理器的SSE2(Streaming SIMD Extensions 2,数据流单指令多数据扩展)技术,支持指令级SIMD操作,提供了单处理器上并行处理的解决方法。将模板匹配算法用SSE2 技术并行化,在Linux平台下用GCC编译实现。试验结果表明:SSE2技术大大加快了模板匹配的速度,能够在保证原有精度和稳定性基础上,解决了模板匹配方法计算量大、耗时多, 成本高的问题,有效地满足了在电子产品与制造等众多领域对计算机视觉技术的实时要求。 展开更多
关键词 GCC 内嵌汇编 sse2 模板匹配
在线阅读 下载PDF
基于SSE2指令集的RC6-64/r/b在IA-32平台上的快速实现
9
作者 陈佳康 李晖 +1 位作者 王珺 邓冠阳 《计算机应用与软件》 CSCD 北大核心 2012年第10期85-88,108,共5页
目前64位与32位计算机广泛共存,RC6-64/r/b的常规实现方法在64位计算机上可以达到很高的性能,但在32位计算机上性能较低,这限制了RC6-64/r/b算法的广泛应用。利用SSE2指令集对RC6-64/r/b算法中的64位运算进行简化,并实现SIMD并行,使得RC... 目前64位与32位计算机广泛共存,RC6-64/r/b的常规实现方法在64位计算机上可以达到很高的性能,但在32位计算机上性能较低,这限制了RC6-64/r/b算法的广泛应用。利用SSE2指令集对RC6-64/r/b算法中的64位运算进行简化,并实现SIMD并行,使得RC6-64/r/b在IA-32平台上的运行速度成倍提升,该方法也可用于其他含有64位运算的密码算法的快速实现上。 展开更多
关键词 sse2 SIMD IA-32 RC6 对称密码算法
在线阅读 下载PDF
基于SSE2对H.265/HEVC中分像素插值的优化
10
作者 陈丽丽 沈燕飞 +1 位作者 邓米克 蔡志峰 《计算机工程与应用》 CSCD 2014年第19期136-142,共7页
分像素插值算法是视频编码算法中的一项关键技术,对视频编码性能有非常重要的影响。在最新的视频编码标准H.265/HEVC中,提出了使用DCT插值滤波器(DCTIF)分别进行半像素和1/4像素插值,但是计算复杂度较大,尤其对于高分辨率和超高分辨... 分像素插值算法是视频编码算法中的一项关键技术,对视频编码性能有非常重要的影响。在最新的视频编码标准H.265/HEVC中,提出了使用DCT插值滤波器(DCTIF)分别进行半像素和1/4像素插值,但是计算复杂度较大,尤其对于高分辨率和超高分辨率的视频编码应用。对滤波器系数的理论推导过程进行了详细介绍,并利用SSE2指令集进行了优化设计和实现,实验结果表明该方法比参考代码中的方法提高了217%~259%的性能。 展开更多
关键词 分像素插值 视频编码 H.265/HEVC标准 sse2指令集
在线阅读 下载PDF
直接Z型In_(2)SSe/Sb范德华异质结光催化水分解的第一性原理研究
11
作者 曹圣哲 黄欣 杨志红 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 2023年第8期107-112,共6页
采用第一性原理方法研究了In_(2)SSe/Sb范德华异质结的光催化性质.计算结果表明,In_(2)SSe/Sb异质结是直接带隙半导体,带隙为0.82 eV,其能带结构呈交错型排列,在异质结界面处会形成由Sb指向In_(2)SSe的内置电场,构成Z型异质结结构,有利... 采用第一性原理方法研究了In_(2)SSe/Sb范德华异质结的光催化性质.计算结果表明,In_(2)SSe/Sb异质结是直接带隙半导体,带隙为0.82 eV,其能带结构呈交错型排列,在异质结界面处会形成由Sb指向In_(2)SSe的内置电场,构成Z型异质结结构,有利于电子-空穴对的有效分离.异质结的带边位置跨越水的氧化还原电位并表现出从红光到紫外光的强光吸收.该研究结果为基于In_(2)SSe/Sb异质结的设计提供了理论参考. 展开更多
关键词 In_(2)sse/Sb 范德华异质结 第一性原理 光催化
在线阅读 下载PDF
基于SSE指令的大内存快速拷贝 被引量:1
12
作者 钱昌松 刘志刚 刘代志 《计算机应用研究》 CSCD 北大核心 2005年第2期113-114,120,共3页
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各... 在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各内存拷贝函数拷贝速度与拷贝内存量之间的对应关系。 展开更多
关键词 单指令多数据流扩展指令集 内存拷贝 mmx 代码优化
在线阅读 下载PDF
AltiVec技术与MMX及其扩展技术的对比
13
作者 李承伟 郭丽娟 倪明 《计算机工程》 CAS CSCD 北大核心 2006年第3期261-263,共3页
对AltiVec技术和MMX及其扩展技术进行对比分析,让软/硬件人员对它们的硬件结构、指令集有进一步的了解,有利于在开发过程中根据应用需求选择性价比最好的技术。
关键词 AltiVec mmx sse
在线阅读 下载PDF
一种基于奔腾SIMD指令的快速背景提取方法 被引量:2
14
作者 周西汉 刘勃 +1 位作者 周荷琴 袁非牛 《计算机工程与应用》 CSCD 北大核心 2004年第27期81-83,共3页
论文提出一种基于Intel奔腾SIMD指令的快速背景提取方法。在一种改进的混合高斯背景模型中,Jeffrey值的计算和背景模型的更新等存在着很高的内在SIMD并行性,通过将数据按照SSE数据类型组织,实现了混合高斯背景模型的SIMD算法。实验结果... 论文提出一种基于Intel奔腾SIMD指令的快速背景提取方法。在一种改进的混合高斯背景模型中,Jeffrey值的计算和背景模型的更新等存在着很高的内在SIMD并行性,通过将数据按照SSE数据类型组织,实现了混合高斯背景模型的SIMD算法。实验结果表明:嵌入奔腾SIMD指令的方法比传统计算提高75%左右的性能,加速了背景提取的速度,达到了实时处理的要求,具有较大的实际应用价值。 展开更多
关键词 背景提取 混合高斯模型 SIMD mmx/sse/sse2
在线阅读 下载PDF
SIMD技术与向量数学库研究 被引量:10
15
作者 解庆春 张云泉 +2 位作者 王可 李焱 许亚武 《计算机科学》 CSCD 北大核心 2011年第7期298-301,共4页
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell ... 首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。 展开更多
关键词 向量化 sse mmx 3DNow! SIMD
在线阅读 下载PDF
基于硬件计数器的MPEG4视频应用性能特征分析 被引量:1
16
作者 车永刚 王正华 李晓梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2004年第2期46-50,55,共6页
通过指令集扩展来增强多媒体应用性能是微处理器发展的一个趋势,IntelMMX、SSE和SSE2是很好的例子。但应用本身的特点是否支持这些体系结构特性,应用软件是否充分发挥了多媒体指令集的潜力,都是值得关注的问题。采用动态Profiling的方法... 通过指令集扩展来增强多媒体应用性能是微处理器发展的一个趋势,IntelMMX、SSE和SSE2是很好的例子。但应用本身的特点是否支持这些体系结构特性,应用软件是否充分发挥了多媒体指令集的潜力,都是值得关注的问题。采用动态Profiling的方法,研究MPEG4视频应用在基于IntelP4处理器的桌面机上的性能特性,使用硬件计数器工具来获取指令级的性能数据,并进行了深入分析。发现MPEG4播放软件较好地利用了IntelP4的64位MMX指令集,但对SSE和SSE2指令集几乎没有利用上;两级Cache不命中导致的性能损失很大。为提高视频播放性能,改进存储层次设计与优化播放软件比改进多媒体指令集更加有效。 展开更多
关键词 NPEG4视频 硬件性能监视 性能特征 mmx sse sse2
在线阅读 下载PDF
视频编码的并行处理 被引量:1
17
作者 李明 胡瑞敏 李伟 《计算机工程与应用》 CSCD 北大核心 2003年第16期109-112,共4页
在视频压缩中存在大量可并行的计算如DCT/IDCT、运动估计、运动补偿、量化/反量化等,它们占计算量的主要部分,特别是DCT和运动估计,成为视频压缩处理的瓶颈,因此必须研究适应视频压缩处理的并行算法。文章就DCT和运动估计在SIMD(单指令... 在视频压缩中存在大量可并行的计算如DCT/IDCT、运动估计、运动补偿、量化/反量化等,它们占计算量的主要部分,特别是DCT和运动估计,成为视频压缩处理的瓶颈,因此必须研究适应视频压缩处理的并行算法。文章就DCT和运动估计在SIMD(单指令多数据)的处理器PIII上算法实现的方法,进行具体研究。 展开更多
关键词 并行处理 加速 视频编码 mmx sse
在线阅读 下载PDF
应用SIMD并行技术的SHA-1加密算法的批量实现 被引量:1
18
作者 陈亦欢 严伟超 《重庆理工大学学报(自然科学)》 CAS 2012年第7期74-80,共7页
介绍了当今最为流行的加密算法———SHA-1算法,并对其原理及实现过程进行了分析,探讨了基于SHA-1算法使用SIMD技术提高CPU计算的并行能力的方法,为大量数据的散列运算以及如何在C程序中加入SHA-1算法的批量实现提供参考。
关键词 SHA-1加密算法 SIMD并行技术 sse2指令集
在线阅读 下载PDF
一种基于PLCM序列的软件加密算法
19
作者 张源安 吴楚 万娟 《计算机工程与应用》 CSCD 北大核心 2005年第27期151-153,共3页
网络视频信号实时保密通信是网络通信研究的热点之一。为提高加密速度和通信的安全性,文章提出了一种基于PLCM序列的软件加密算法。该算法利用SSE2指令集来进行浮点运算,通过对不同时刻迭代生成的混沌序列进行基于位逻辑运算的非线性变... 网络视频信号实时保密通信是网络通信研究的热点之一。为提高加密速度和通信的安全性,文章提出了一种基于PLCM序列的软件加密算法。该算法利用SSE2指令集来进行浮点运算,通过对不同时刻迭代生成的混沌序列进行基于位逻辑运算的非线性变换,来达到既能快速生成密码序列,又能保证加密安全性的目的。分析表明该算法能有效地抵抗多分辨率攻击以及已知明文攻击。实验结果证明使用该算法能达到网络视频信号保密通信实时加解密的要求。 展开更多
关键词 PLCM sse2 非线性位逻辑运算 混沌加密
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部