期刊文献+
共找到146篇文章
< 1 2 8 >
每页显示 20 50 100
藏语语声识别声学模型建模单元研究
1
作者 王嘉文 高定国 索朗曲珍 《应用声学》 北大核心 2025年第2期405-412,共8页
语声识别建模单元的选择是藏语语声识别任务中的关键问题,决定了语声识别声学模型的训练质量和识别准确性。针对藏语语声识别研究中多种建模单元在不同数据集上进行的实验,导致难以探寻合适建模单元进行藏语语声识别,使得相关科研成果... 语声识别建模单元的选择是藏语语声识别任务中的关键问题,决定了语声识别声学模型的训练质量和识别准确性。针对藏语语声识别研究中多种建模单元在不同数据集上进行的实验,导致难以探寻合适建模单元进行藏语语声识别,使得相关科研成果难以相互支持的问题,该文提出了适用性更高同时识别效果更优秀的藏语语声识别声学模型建模单元。该文总结改进了4种建模单元,并在3种方言数据上进行了消融实验,分别训练了5种声学模型。实验结果表明,基于拉丁音素的建模单元适用于卫藏方言和康巴方言,基于拉丁音节的建模单元适用于安多方言,改进的基于注意力机制的深度卷积声学模型在安多方言上达到了最好的识别效果,测试集字错误率为14.67%。 展开更多
关键词 藏语 语声识别 声学模型 建模单元
在线阅读 下载PDF
海洋声学模型评估研究
2
作者 甘忠良 周元龙 郑彤彤 《声学技术》 北大核心 2025年第4期541-546,共6页
海洋声学模型是对海洋中声传播物理过程的数学描述,在声呐系统设计与性能预测、海洋环境参数声学反演等领域发挥着重要作用。迄今为止,国内外已开发形成多个海洋声学模型,针对不同应用场景,如何从众多模型中选择最合适的模型成为广大模... 海洋声学模型是对海洋中声传播物理过程的数学描述,在声呐系统设计与性能预测、海洋环境参数声学反演等领域发挥着重要作用。迄今为止,国内外已开发形成多个海洋声学模型,针对不同应用场景,如何从众多模型中选择最合适的模型成为广大模型应用者关注的焦点。文章在总结国内外海洋声学模型评估现状的基础上,基于VV&A经典建模理论,提出海洋声学模型评估步骤及方法,并以声传播模型为例,阐述了评估过程中需注意的事项,对评估方法的局限性进行了分析,为海洋声学模型评估和模型选择提供参考。 展开更多
关键词 海洋声学模型 模型评估 校核 验证 认证
在线阅读 下载PDF
汉语连续语音识别中不同基元声学模型的复合 被引量:7
3
作者 张辉 杜利民 《电子与信息学报》 EI CSCD 北大核心 2006年第11期2045-2049,共5页
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合... 该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。 展开更多
关键词 语音识别 声学模型复合 声学模型选择 错误率
在线阅读 下载PDF
基于声学特征空间非线性流形结构的语音识别声学模型 被引量:9
4
作者 张文林 牛铜 +2 位作者 屈丹 李弼程 裴喜龙 《自动化学报》 EI CSCD 北大核心 2015年第5期1024-1033,共10页
从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型.将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而得到混合因子分析模型.将上下文相关状态的... 从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型.将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而得到混合因子分析模型.将上下文相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型.最终,每个状态由一个服从稀疏约束的权重矢量和若干个服从标准正态分布的低维局部因子矢量所决定.文中给出了局部区域潜在维数的确定准则及模型参数的迭代估计算法.基于RM语料库的连续语音识别实验表明,相比于传统的高斯混合模型(Gaussian mixture model,GMM)和子空间高斯混合模型(Subspace Gaussian mixture model,SGMM),新声学模型在测试集上的平均词错误率(Word error rate,WER)分别相对下降了33.1%和9.2%. 展开更多
关键词 语音识别 声学模型 非线性流形 混合因子分析
在线阅读 下载PDF
基于DNN的声学模型自适应实验 被引量:5
5
作者 张宇 计哲 +3 位作者 万辛 张震 葛凤培 颜永红 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第9期765-770,共6页
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关... 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能. 展开更多
关键词 声学模型自适应 语音识别 深度神经网络
在线阅读 下载PDF
汽车声学模型风洞消声拐角数值计算与试验 被引量:4
6
作者 王毅刚 杨志刚 +1 位作者 倪晓强 李启良 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第2期271-275,共5页
运用流体力学数值计算(CFD)以及实验手段对汽车气动-声学模型风洞消声拐角导流片形状、片数、头尾结构对气动和消声性能的影响进行研究.研究结果表明,综合考虑压力损失、流场流动的均匀度和气动噪声对消声量的影响,可以寻找最佳导流片数... 运用流体力学数值计算(CFD)以及实验手段对汽车气动-声学模型风洞消声拐角导流片形状、片数、头尾结构对气动和消声性能的影响进行研究.研究结果表明,综合考虑压力损失、流场流动的均匀度和气动噪声对消声量的影响,可以寻找最佳导流片数;半椭圆形头部和尖形尾部导流片有较低的压力损失和气动噪声,避免采用半圆形尾部形状;对模型风洞而言,消声拐角主要应以消除中高频噪声为主. 展开更多
关键词 气动声学模型风洞 拐角消声器 压力损失 消声量
在线阅读 下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
7
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 HTK工具 声学模型
在线阅读 下载PDF
基于心理声学模型的音频水印能量与可靠性研究 被引量:3
8
作者 刘海燕 郑雪峰 +1 位作者 程仁峰 王颖 《计算机工程》 CAS CSCD 北大核心 2008年第4期34-36,共3页
对基于心理声学模型的音频水印算法的能量与相关检测可靠性的关系进行了分析研究。给出计算音频水印相关检测的检测阈值的方法,并描述了水印能量、检测阈值以及信噪比与检测误码率的关系。实验结果验证了水印检测错误率随着水印能量的... 对基于心理声学模型的音频水印算法的能量与相关检测可靠性的关系进行了分析研究。给出计算音频水印相关检测的检测阈值的方法,并描述了水印能量、检测阈值以及信噪比与检测误码率的关系。实验结果验证了水印检测错误率随着水印能量的增加而降低,随着信噪比的增大而增加。 展开更多
关键词 音频水印 心理声学模型 能量 相关检测 可靠性
在线阅读 下载PDF
基于小波包和心理声学模型的音频水印算法 被引量:5
9
作者 孙锐 蒋建国 杨兴明 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第10期2248-2251,2255,共5页
提出了一种基于小波包和心理声学模型的数字音频水印算法,该算法对音频信号进行小波包分解,在小波域内计算掩蔽阈值,根据从心理声学模型得到的幅度因子自适应地控制由嵌入水印而引起的听觉偏倚。二值水印图像通过伪随机排序与扩频调制... 提出了一种基于小波包和心理声学模型的数字音频水印算法,该算法对音频信号进行小波包分解,在小波域内计算掩蔽阈值,根据从心理声学模型得到的幅度因子自适应地控制由嵌入水印而引起的听觉偏倚。二值水印图像通过伪随机排序与扩频调制后嵌入到小波包分解后的中频系数中,提取水印信号无需使用原始数字音频信号。仿真试验表明水印是不可察觉的,经过MPEG layer Ⅲ有损压缩、低通滤波、重采样等操作后仍具有很强的稳健性。 展开更多
关键词 数字水印 小波包 心理声学模型 扩频调制
在线阅读 下载PDF
换流站电容器塔的噪声预测声学模型和算法 被引量:4
10
作者 魏浩征 李志远 +2 位作者 黎小林 黄莹 阮学云 《应用科学学报》 EI CAS CSCD 北大核心 2010年第2期152-157,共6页
根据直流换流站滤波电容器塔架噪声的属性对竖直线声源的算法进行对比分析,提出对竖直线声源进行单独改进优化划分.通过对使用不同划分长度的计算结果进行比较,确定恰当的长度值.基于改进算法开发的噪声预测软件与商品软件的比较表明,... 根据直流换流站滤波电容器塔架噪声的属性对竖直线声源的算法进行对比分析,提出对竖直线声源进行单独改进优化划分.通过对使用不同划分长度的计算结果进行比较,确定恰当的长度值.基于改进算法开发的噪声预测软件与商品软件的比较表明,改进后的预测结果更加准确合理,提高了电容器塔架的噪声衰减预测的计算精度. 展开更多
关键词 换流站 电容器塔架 声学模型 噪声
在线阅读 下载PDF
基于小波包和心理声学模型的音频编码算法 被引量:9
11
作者 何冬梅 高文 《计算机研究与发展》 EI CSCD 北大核心 2000年第3期329-335,共7页
文中提出了一种新的适用于实时多媒体应用领域的音频编码算法.该算法首先对音频信号进行小波包分解,然后在小波域中计算掩蔽阈值,最后根据从心理声学模型得到的信号一掩蔽比来对各子带小波系数进行动态比特分配、量化和编码.实验结... 文中提出了一种新的适用于实时多媒体应用领域的音频编码算法.该算法首先对音频信号进行小波包分解,然后在小波域中计算掩蔽阈值,最后根据从心理声学模型得到的信号一掩蔽比来对各子带小波系数进行动态比特分配、量化和编码.实验结果表明该算法将 CD音频信号压缩到 64 Kbps时,恢复信号的分段信噪比为 32.32dB,主观上感觉无失真.该算法计算简单,可在不需任何附加硬件的 Pentium 133 MHz个人计算机上实现实时音频编码. 展开更多
关键词 音频编码 小波包 心理声学模型 多媒体 算法
在线阅读 下载PDF
基于遗传算法的声学模型拓扑结构优化 被引量:6
12
作者 包希日莫 高光来 张璟 《计算机工程与应用》 CSCD 2014年第14期5-8,63,共5页
针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分... 针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分配的特点。连续数字串TIDigits语料上的以贝叶斯信息准则为目标函数的实验表明,与传统方法创建的基线系统相比,模型拓扑优化的系统能够以较低的复杂度获得较高的识别率,这说明该算法是声学模型拓扑结构优化的有效工具。 展开更多
关键词 隐马尔可夫模型 遗传算法 语音识别 声学模型拓扑结构 贝叶斯信息准则
在线阅读 下载PDF
一种基于心理声学模型的小波包域音频数字水印算法 被引量:4
13
作者 梁华庆 赵丽丽 +1 位作者 钮心忻 杨义先 《石油大学学报(自然科学版)》 CSCD 北大核心 2003年第6期112-115,共4页
首先根据心理声学模型 ,计算载体音频信号的掩蔽门限 ,并利用人耳听觉的临界频率与小波包子带间的相似特性 ,将DFT域掩蔽门限映射到小波包域 ;然后将水印信号嵌入到中低频小波包系数中 ,嵌入强度由掩蔽门限自适应控制。由于该方案是基... 首先根据心理声学模型 ,计算载体音频信号的掩蔽门限 ,并利用人耳听觉的临界频率与小波包子带间的相似特性 ,将DFT域掩蔽门限映射到小波包域 ;然后将水印信号嵌入到中低频小波包系数中 ,嵌入强度由掩蔽门限自适应控制。由于该方案是基于人类听觉系统的 ,在最大限度上挖掘了水印嵌入强度 ,使鲁棒性和不可感知性得到了很好的平衡。实验结果表明 ,利用这种水印算法 ,嵌入的水印信号是不可察觉的 ,并且对数据压缩、加噪、去噪、重采样 (D/A、A/D转换 )。 展开更多
关键词 心理声学模型 小波包 鲁棒性 掩蔽门限 数字水印 音频信号
在线阅读 下载PDF
心理声学模型中音调探测算法的改进 被引量:2
14
作者 朱丽 黄思远 +1 位作者 湛金童 杨高明 《声学技术》 CSCD 2003年第4期273-275,共3页
随着数字音频发展,心理声学原理应用到音频压缩技术中,使得低比特传输速率和透明音质成为可能。文章分析了心理声学模型有效的掩蔽特性,主要介绍了心理声学模型的改进音调探测方法,并给出了其实验结果。对音频编码器的实时实现研究具有... 随着数字音频发展,心理声学原理应用到音频压缩技术中,使得低比特传输速率和透明音质成为可能。文章分析了心理声学模型有效的掩蔽特性,主要介绍了心理声学模型的改进音调探测方法,并给出了其实验结果。对音频编码器的实时实现研究具有重要意义。 展开更多
关键词 心理声学模型 音调探测算法 音频压缩技术 音频编码器 谱平面法 安静阈值 临界子带
在线阅读 下载PDF
离心风机宽频蜗舌消声器的声学模型及应用 被引量:3
15
作者 张建润 程序 《东南大学学报(自然科学版)》 EI CAS CSCD 1996年第2期44-48,共5页
建立了离心风机宽频蜗舌消声器的声学模型,提出了参数优化方法.解决了以往蜗舌消声器只局限于后弯风机窄频带消声的缺陷,为前弯型风机的降噪提供了有效途径.同时将此方法应用于NY-2前弯型离心风机降噪,取得了令人满意的效果.
关键词 蜗舌消声器 降噪 鼓风机 离心式 声学模型
在线阅读 下载PDF
鉴别性最大后验概率声学模型自适应 被引量:2
16
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《计算机应用》 CSCD 北大核心 2014年第1期265-269,共5页
为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相... 为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相结合的H-criterion最大后验概率(H-MAP)自适应估计先验分布中心,提出了基于最大互信息最大后验概率先验的最小音素错误最大后验概率(MPE-MMI-MAP)和基于H-criterion最大后验概率先验的最小音素错误最大后验概率(MPE-H-MAP)算法。任务自适应实验结果表明,MPE-MMI-MAP和MPE-H-MAP算法的自适应性能均优于MPE-MAP、MMI-MAP和最大后验概率(MAP)自适应方法,分别比MPE-MAP相对提高3.4%和2.7%。 展开更多
关键词 最大后验概率 鉴别性最大后验概率 最大互信息 最小音素错误 声学模型自适应
在线阅读 下载PDF
基于MPEG心理声学模型II的自适应音频水印算法 被引量:3
17
作者 王泳 李斌 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第2期29-32,共4页
音频水印作为保护音频作品的版权和秘密通信的可行方法,成为近年数字水印研究领域中的一个热点。针对目前音频水印算法研究中自适应性能没有得到重视的问题,提出一种基于心理声学模型II(以下称模型II)的自适应盲检测音频水印算法,令算... 音频水印作为保护音频作品的版权和秘密通信的可行方法,成为近年数字水印研究领域中的一个热点。针对目前音频水印算法研究中自适应性能没有得到重视的问题,提出一种基于心理声学模型II(以下称模型II)的自适应盲检测音频水印算法,令算法具备良好的自适应性和稳健性。 展开更多
关键词 音频水印 自适应 稳健性 MPEG心理声学模型
在线阅读 下载PDF
基于心理声学模型的高性能语音质量评价算法 被引量:1
18
作者 张军 张德运 +1 位作者 高磊 赵东平 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第4期437-440,共4页
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由... 提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之间的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%. 展开更多
关键词 心理声学模型 美尔倒谱 感知扰动 质量评价
在线阅读 下载PDF
基于心理声学模型的多码率零树小波音频压缩方法 被引量:3
19
作者 何冬梅 高文 《计算机学报》 EI CSCD 北大核心 2000年第3期278-284,共7页
MPEG- 4音频编码标准不仅对码率和音质提出了更高的要求 ,而且还要求编码器具有多种功能以满足各种不同应用的需要 .该文利用不同尺度小波系数间的自相似特性和人耳的掩蔽效应 ,提出了一种基于心理声学模型的零树小波音频编码算法 .该... MPEG- 4音频编码标准不仅对码率和音质提出了更高的要求 ,而且还要求编码器具有多种功能以满足各种不同应用的需要 .该文利用不同尺度小波系数间的自相似特性和人耳的掩蔽效应 ,提出了一种基于心理声学模型的零树小波音频编码算法 .该算法不仅可在低码率 (5 6 kb/ s)上得到透明质量的 CD音频信号 ,而且可产生嵌入式码流 ,在最优意义上支持多码率的可分级编码 ,是一种很有前途的适用于多媒体通信等领域的编码方案 . 展开更多
关键词 音频编码 小波变换 心理声学模型 多媒体通信
在线阅读 下载PDF
一种应用心理声学模型的鲁棒音频水印算法 被引量:3
20
作者 王卓 赵千川 《声学技术》 CSCD 北大核心 2006年第3期248-252,共5页
数字水印技术作为一种版权保护的重要手段得到了广泛的研究和应用。文中提出了应用心理声学模型对音频进行逐帧分析、自适应地选择水印嵌入位置的算法框架,并在此基础上应用了一种音频频域子带能量量化的水印算法。这一框架对有效地控... 数字水印技术作为一种版权保护的重要手段得到了广泛的研究和应用。文中提出了应用心理声学模型对音频进行逐帧分析、自适应地选择水印嵌入位置的算法框架,并在此基础上应用了一种音频频域子带能量量化的水印算法。这一框架对有效地控制听觉透明性和MP3鲁棒性有指导意义。实验证明在保证较高的听觉保真度的同时,算法对各种攻击手段具有满意的鲁棒性。 展开更多
关键词 版权保护 数字水印 心理声学模型 能量量化 MP3压缩
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部