期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向语音分离的深层转导式非负矩阵分解并行算法
1
作者 李雨蓉 刘杰 +2 位作者 刘亚林 龚春叶 王勇 《计算机科学》 CSCD 北大核心 2020年第8期49-55,共7页
非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算... 非负矩阵分解(Non-negative Matrix Factorization,NMF)能保存语音信号的非负特征,是用于语音分离的重要方法,但该方法存在数据运算复杂、计算量太大的问题,需要研究能减少计算时间的并行计算方法。针对语音分离预训练及分离过程的计算问题,文中提出深层转导式非负矩阵分解并行算法,综合考虑迭代更新过程的数据关联性,设计了一种任务间和任务内多级并行算法。该并行算法在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务进行并行计算;在任务内部进程级把矩阵按行列划分,主进程把矩阵块分发到从进程,从进程接收当前矩阵块并计算结果矩阵子块,然后将当前进程矩阵块发送到下一进程,实现第二个矩阵中每一个矩阵块在所有进程的遍历,并计算结果矩阵对应子块的乘积,最后由主进程收集从进程数据块;在线程级子矩阵乘法运算的过程中,采取生成多线程,通过共享内存交换数据计算子矩阵块的加速策略。该算法为首个实现深层转导式非负矩阵分解的并行算法。在天河二号平台上的测试结果表明,在分离多说话人混合语音信号时,相比串行程序,所提出的并行算法能在不改变分离效果的前提下,使得预训练过程中使用64个进程的加速比为18,分离过程使用64个进程的对应加速比为24。相较于串行及MPI模型分离,混合模型分离时间大大缩短,从而证明了设计的并行算法可有效提高语音分离的效率。 展开更多
关键词 深层转导式非负矩阵分解并行算法 乘性迭代更新规则加速算法 消息传递接口 共享存储并行编程 语音分离
在线阅读 下载PDF
基于非均匀变分节块法的pin-by-pin计算加速算法研究 被引量:1
2
作者 张滕飞 吴宏春 +4 位作者 曹良志 李云召 刘晓晶 熊进标 柴翔 《原子能科学技术》 EI CAS CSCD 北大核心 2019年第7期1160-1164,共5页
计算效率是制约pin-by-pin计算工程应用的主要因素之一。本文利用三维扩散的非均匀变分节块法的非均匀节块的描述能力,在不改变原问题栅元均匀化材料分布的前提下,将传统pin-by-pin计算中使用的均匀材料细网剖分方式替代为非均匀材料粗... 计算效率是制约pin-by-pin计算工程应用的主要因素之一。本文利用三维扩散的非均匀变分节块法的非均匀节块的描述能力,在不改变原问题栅元均匀化材料分布的前提下,将传统pin-by-pin计算中使用的均匀材料细网剖分方式替代为非均匀材料粗网剖分方式(粗网加速方法),既能保证pin-by-pin的计算分辨率,又能显著降低红-黑迭代所需的浮点数操作数目,减小内迭代的计算代价。针对外迭代,运用广义矩阵分离加速(GPM)算法和粗网有限差分(CMFD)算法提高源迭代的收敛速度,降低计算时间。数值结果表明,提出的加速算法能在保证计算精度的前提下,有效提高pin-by-pin计算的效率。 展开更多
关键词 加速pin-by-pin计算 非均匀变分节块法 粗网加速方法 广义矩阵分离加速算法 粗网有限差分算法
在线阅读 下载PDF
基于非线性PCA准则的两个盲信号分离算法 被引量:5
3
作者 高鹰 谢胜利 《计算机工程与应用》 CSCD 北大核心 2005年第22期24-26,共3页
该文首先基于Oja定义的非线性PCA准则J1(W),利用矩阵广义逆递推得到一种盲信号分离算法,然后对Karhunen给出的非线性PCA加权误差平方和准则J2(W),采用梯度下降算法和线性寻优而得到另一种自适应盲信号分离算法。对这两个分离算法进行了... 该文首先基于Oja定义的非线性PCA准则J1(W),利用矩阵广义逆递推得到一种盲信号分离算法,然后对Karhunen给出的非线性PCA加权误差平方和准则J2(W),采用梯度下降算法和线性寻优而得到另一种自适应盲信号分离算法。对这两个分离算法进行了计算机仿真,仿真结果表明它们的有效性。 展开更多
关键词 盲信号分离 非线性PCA准则 矩阵广义逆递推 梯度下降算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部