期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于联合多样性密度的汉语方言辨识 被引量:6
1
作者 顾明亮 张世形 +1 位作者 张浩 张宁 《计算机工程与应用》 CSCD 北大核心 2016年第10期161-166,共6页
为了解决汉语方言模型设计较为单一的问题,提高方言辨识的效率,提出了一种基于联合多样性密度的汉语方言辨识方法。多样性密度算法是多示例学习中的一种经典算法,联合多样性密度算法是对其的改进应用。该方法首先将方言进行预分类为多... 为了解决汉语方言模型设计较为单一的问题,提高方言辨识的效率,提出了一种基于联合多样性密度的汉语方言辨识方法。多样性密度算法是多示例学习中的一种经典算法,联合多样性密度算法是对其的改进应用。该方法首先将方言进行预分类为多个小类,然后将各小类方言进行多示例包生成,并通过期望最大多样性密度算法进行多示例学习,得到的多个多样性密度点作为方言的多示例模型,最后提出平均最近距离算法进行模式分类。该方法在训练模型时得到的方言模型更为全面、完整,在模式分类时考虑了未知包中每个示例的影响,提高了辨识系统的效率。 展开更多
关键词 汉语方言辨识 多示例学习 多样性密度 K近邻 平均最近距离
在线阅读 下载PDF
基于AdaBoost的汉语方言辨识 被引量:3
2
作者 顾明亮 夏玉果 +1 位作者 张长水 杨亦鸣 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期585-588,共4页
为了在训练样本受限的情况下,提高汉语方言辨识的效果,提出了一种基于AdaBoost的汉语方言辨识新方法.该方法将GMM与语言模型组成的辨识系统看成一组弱分类器,然后对这组弱分类器所得的分类结果进行加权投票,最终决定汉语方言测试语音的... 为了在训练样本受限的情况下,提高汉语方言辨识的效果,提出了一种基于AdaBoost的汉语方言辨识新方法.该方法将GMM与语言模型组成的辨识系统看成一组弱分类器,然后对这组弱分类器所得的分类结果进行加权投票,最终决定汉语方言测试语音的所属类别.实验结果表明:增加GMM或弱分类器的个数,可以有效提高系统的辨识效果;测试语音越长,系统辨识效果越好;当训练样本有限的情况下,采用AdBoost方法比采用ANN方法具有更高的辨识率. 展开更多
关键词 ADABOOST算法 高斯混合模型 方言辨识
在线阅读 下载PDF
基于SOM神经网络和支持向量机的方言辨识 被引量:7
3
作者 朱颖 钱盛友 赵新民 《计算机工程与应用》 CSCD 北大核心 2009年第22期200-201,205,共3页
建立了一个基于SOM神经网络和支持向量机(SVM)的汉语方言辨识系统。该系统以湖南方言作为研究对象,借助SOM神经网络对不同方言的MFCC特征参量进行聚类,并用SVM作为最终的决策辨识器。实验结果表明:该系统与传统系统相比实时性和辨识率较... 建立了一个基于SOM神经网络和支持向量机(SVM)的汉语方言辨识系统。该系统以湖南方言作为研究对象,借助SOM神经网络对不同方言的MFCC特征参量进行聚类,并用SVM作为最终的决策辨识器。实验结果表明:该系统与传统系统相比实时性和辨识率较好,特别适用于信噪比低的情况。 展开更多
关键词 方言辨识 SOM神经网络 支持向量机
在线阅读 下载PDF
基于动态时间规整和神经网络的方言辨识研究 被引量:9
4
作者 钱盛友 许慧燕 《计算机工程与应用》 CSCD 北大核心 2008年第10期211-213,共3页
汉语方言辨识技术的研究不仅有利于提高方言语音识别系统的识别效率,而且对于公安部门的刑事侦查等方面都具有非常重要的应用价值。以湖南方言作为研究对象,对不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语... 汉语方言辨识技术的研究不仅有利于提高方言语音识别系统的识别效率,而且对于公安部门的刑事侦查等方面都具有非常重要的应用价值。以湖南方言作为研究对象,对不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语音信号具有很强的随机性而神经网络的输入结构相对固定等特点,提出了基于动态时间规整和神经网络的方言辨识方法。实验结果表明,选取相同的特征参数时对不同类别或不同声调的方言的辩识率不同。 展开更多
关键词 方言辨识 语音特征 动态时间规整 神经网络
在线阅读 下载PDF
基于高斯混合模型的汉语方言辨识系统 被引量:9
5
作者 顾明亮 马勇 《计算机工程与应用》 CSCD 北大核心 2007年第3期204-206,共3页
建立了一个基于高斯混合模型的汉语方言辨识系统,并给出了模型参数的估计方法,讨论了特征参数和高斯混合数对系统辨识的影响,实验结果表明,系统对同一省内的三种不同方言的辨识率平均可以达到84.17%。
关键词 高斯混合模型 汉语方言辨识 语音识别
在线阅读 下载PDF
基于支撑矢量机的汉语方言辨识 被引量:5
6
作者 顾明亮 夏玉果 张长水 《计算机工程与应用》 CSCD 北大核心 2007年第29期210-213,共4页
统计学习理论证明,支撑矢量机是具有高分类能力和高推广性能的优秀分类器。但由于语音的动态时间属性,它很难直接应用到汉语方言辨识领域。论文利用高斯混合模型和语言模型提取等维的全局语言特征,成功解决了支撑矢量机难于直接处理动... 统计学习理论证明,支撑矢量机是具有高分类能力和高推广性能的优秀分类器。但由于语音的动态时间属性,它很难直接应用到汉语方言辨识领域。论文利用高斯混合模型和语言模型提取等维的全局语言特征,成功解决了支撑矢量机难于直接处理动态时间模式的困难,有效地增强了系统的分类能力。实验结果表明,支撑矢量机方法可以比直接用语言模型进行分类决策提高近20%的正确辨识率,比人工神经网络方法也可提高4%的正确辨识率。 展开更多
关键词 方言辨识 支撑矢量机(SVM) 高斯混合模型(GMM)
在线阅读 下载PDF
半监督矢量量化的汉语方言辨识 被引量:1
7
作者 顾明亮 张彪 《计算机工程与应用》 CSCD 北大核心 2011年第33期109-111,共3页
提出了一种新的方言码本模型辨识系统。该方法利用半监督的思想对方言语音数据进行矢量量化,形成具有监督信息的码本模型。有效解决了在汉语方言辨识中码本精度不高的问题,系统的识别率有了很大提高。实验结果表明带有监督信息的码本量... 提出了一种新的方言码本模型辨识系统。该方法利用半监督的思想对方言语音数据进行矢量量化,形成具有监督信息的码本模型。有效解决了在汉语方言辨识中码本精度不高的问题,系统的识别率有了很大提高。实验结果表明带有监督信息的码本量化方法明显优于传统LBG矢量量化方法,对于汉语三种方言,辨识率可达94.23%,比传统码本辨识系统提高了近13%的正确辨识率。 展开更多
关键词 方言辨识 半监督码本 矢量量化
在线阅读 下载PDF
基于流形学习与特征融合的汉语方言辨识 被引量:5
8
作者 贾晶晶 顾明亮 +1 位作者 朱恂 张世形 《计算机工程与应用》 CSCD 北大核心 2015年第7期233-237,共5页
提出了一种基于流形学习的特征提取方法,将流形学习有效地应用于汉语方言辨识。针对语音语谱特征空间维数较高的问题,利用局部线性嵌入(LLE)方法降维并与MFCC特征进行融合,融合结果作为新特征用于汉语方言辨识。仿真实验表明,LLE算法能... 提出了一种基于流形学习的特征提取方法,将流形学习有效地应用于汉语方言辨识。针对语音语谱特征空间维数较高的问题,利用局部线性嵌入(LLE)方法降维并与MFCC特征进行融合,融合结果作为新特征用于汉语方言辨识。仿真实验表明,LLE算法能够获取汉语方言的本征规律,融合后的特征能够有效地提高汉语方言辨识的正确识别率。 展开更多
关键词 流形学习 局部线性嵌入 特征融合 汉语方言辨识
在线阅读 下载PDF
基于混合特征参数和BP_Adaboost的方言辨识 被引量:5
9
作者 彭湘陵 钱盛友 赵新民 《计算机工程与应用》 CSCD 2013年第3期152-155,共4页
着眼于非特定人孤立词湖南地区的方言辨识,提出一种将BP神经网络和Adaboost算法相结合的辨识模型。为反映方言的动态特性及其声道特性,采用LPCC、MFCC和各自一阶差分系数相组合作为方言特征系数。利用多个BP神经网络作为弱分类器对方言... 着眼于非特定人孤立词湖南地区的方言辨识,提出一种将BP神经网络和Adaboost算法相结合的辨识模型。为反映方言的动态特性及其声道特性,采用LPCC、MFCC和各自一阶差分系数相组合作为方言特征系数。利用多个BP神经网络作为弱分类器对方言进行初步辨识,借助Adaboost迭代算法将这些弱分类器组合起来构成强分类器,得出最终辨识结果。实验证明,该混合模型较单纯的BP神经网络具有更强的噪声鲁棒性和较高的识别率。 展开更多
关键词 方言辨识 混合特征参数 自适应Boosting 反向传播(BP)神经网络
在线阅读 下载PDF
基于基频的朝鲜语方言辨识方法的研究 被引量:5
10
作者 刘双君 金小峰 崔荣一 《中文信息学报》 CSCD 北大核心 2017年第2期55-60,70,共7页
该文提出了一种基于基音频率特征的中国朝鲜族语言、韩国朝鲜语和朝鲜朝鲜语方言的自动辨识方法。首先,选择具有良好区分度的基频移位差分系数作为三个方言的特征参数;其次,设计和采用了分层支持向量机分类器,并进一步引入投票法确定最... 该文提出了一种基于基音频率特征的中国朝鲜族语言、韩国朝鲜语和朝鲜朝鲜语方言的自动辨识方法。首先,选择具有良好区分度的基频移位差分系数作为三个方言的特征参数;其次,设计和采用了分层支持向量机分类器,并进一步引入投票法确定最佳的分类结果。实验结果表明该文提取的特征参数具有良好的区分性和较强的稳定性,该文提出的方言辨识方法比传统的移位差分倒谱系数特征方法识别率高,可以有效解决朝鲜朝鲜语、韩国朝鲜语和中国朝鲜族语言的方言辨识问题。 展开更多
关键词 方言辨识 语种辨识 基频特征 移位差分系数 支持向量机
在线阅读 下载PDF
一种静态特征与动态特征结合的方言辨识方法 被引量:2
11
作者 何艳 于凤芹 《计算机工程与应用》 CSCD 2012年第13期105-108,共4页
针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组... 针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组合送入支持向量机进行辨识,并研究了针对4种方言的SDC的局部最优参数组合。仿真实验结果表明,同时考虑方言的静态与动态特征方法的识别率高达92.5%,但识别率的提高是以延长运算时间为代价的。 展开更多
关键词 方言辨识 MEL频率倒谱系数 滑动差分倒谱特征 支持向量机
在线阅读 下载PDF
基于改进的长短期记忆神经网络方言辨识模型 被引量:6
12
作者 艾虎 李菲 《科学技术与工程》 北大核心 2019年第2期163-169,共7页
在案件侦破中,方言的辨别能提供重要线索。为了对汉语方言进行辨别,基于长短期记忆神经网络(LSTM)的方言辨识模型被提出,语音样本数据,其中包括地区口头禅,均采集于贵州省6个地区,并提取梅尔频率倒谱系数(MFCC),每份语音样本MFCC后面加... 在案件侦破中,方言的辨别能提供重要线索。为了对汉语方言进行辨别,基于长短期记忆神经网络(LSTM)的方言辨识模型被提出,语音样本数据,其中包括地区口头禅,均采集于贵州省6个地区,并提取梅尔频率倒谱系数(MFCC),每份语音样本MFCC后面加上相应的地区口头禅MFCC,然后采用滑窗进行信息重叠分块,对每块分别进行横向与纵向奇异值分解并保留高贡献率的特征向量,把分块合并作为方言辨识模型的输入数据。先对LSTM进行改进,然后构建方言辨识模型。通过交叉实验对该模型进行训练和验证,从而对滑窗的宽度进行优化,同时与循环神经网络(RNN)进行比较。实验结果证明研究构建的LSTM模型对汉语方言辨识是高效的。 展开更多
关键词 汉语方言辨识 梅尔频率倒谱系数 地区口头禅 奇异值分解 长短期记忆神经网络
在线阅读 下载PDF
基于改进的长短期神经网络的贵州方言辨识系统的设计与实现 被引量:3
13
作者 艾虎 李菲 《科学技术与工程》 北大核心 2019年第5期203-210,共8页
汉语方言的辨识能为案件侦破提供重要的线索,为了对贵州方言进行辨识,设计并实现了贵州方言辨识系统;该系统采用Client/Server与Browser/Server相结合的架构,其用户端采用Matlab实现并具有改进的长短期记忆神经网络算法,主要用于方言的... 汉语方言的辨识能为案件侦破提供重要的线索,为了对贵州方言进行辨识,设计并实现了贵州方言辨识系统;该系统采用Client/Server与Browser/Server相结合的架构,其用户端采用Matlab实现并具有改进的长短期记忆神经网络算法,主要用于方言的辨识和方言语音样本的采集。方言样本采集于贵州省6个地区,首先提取语音样本与口头禅的梅尔频率倒谱系数MFCC;然后每份语音样本MFCC后面加上相应地区的口头禅MFCC;最后通过奇异值分解得到该系统的输入数据。该系统的网站主要用于训练数据的储存与修改,采用ASP. NET技术并利用C#、Java Script和T-SQL等编程语言实现。实验结果证明贵州方言辨识系统是高效的,让用户获得极大的方便和客观统一的方言辨识结果。 展开更多
关键词 汉语方言辨识系统 梅尔频率倒谱系数 地区口头禅 奇异值分解 长短期记忆神经网络 ASP.NET C# Matlab
在线阅读 下载PDF
基于语音配列的汉语方言自动辨识 被引量:20
14
作者 顾明亮 沈兆勇 《中文信息学报》 CSCD 北大核心 2006年第5期77-82,共6页
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音... 本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音库,从而降低了汉语方言语音库建设的劳动强度和要求;第二,GMM符号化器计算量远远低于音素辨识器,从而提高了方言辨识速度,便于今后实时处理。第三,具有更高的辨识效果和更好的容错性。汉语普通话和三种方言辨识实验结果表明,系统平均辨识率可以达到83.8%。 展开更多
关键词 计算机应用 中文信息处理 GMM符号化器 N元语言模型 汉语方言辨识
在线阅读 下载PDF
融合多样性测度的汉语方言主动辨识方法 被引量:2
15
作者 夏玉果 戴红霞 顾明亮 《计算机工程与应用》 CSCD 北大核心 2017年第15期149-154,共6页
为了解决方言辨识系统中训练样本冗余的问题,提出了一种融合多样性测度的汉语方言主动辨识方法。利用SVM分类器选取不确定性的样本。根据样本间分布情况的测度算法,选取出兼具多样性的训练样本,经过多次迭代将这些最具区别性的样本组成... 为了解决方言辨识系统中训练样本冗余的问题,提出了一种融合多样性测度的汉语方言主动辨识方法。利用SVM分类器选取不确定性的样本。根据样本间分布情况的测度算法,选取出兼具多样性的训练样本,经过多次迭代将这些最具区别性的样本组成训练集。将此训练集重新输入到SVM进行分类辨识。实验结果表明,该方法能有效克服选取样本的冗余,与传统的主动学习方法相比,在同等识别率的情况下,人工标注样本的数量减少了50%。 展开更多
关键词 汉语方言辨识 主动学习 支持矢量机 多样性测度
在线阅读 下载PDF
全局信息融合的汉语方言自动辨识
16
作者 邱远航 顾明亮 +4 位作者 马勇 金赟 韩军 赵冬梅 赵呈昊 《计算机工程与应用》 CSCD 北大核心 2017年第17期160-165,共6页
提出身份认证矢量(Identity vector,I-vector)结合韵律信息的汉语方言辨识方法。全差异空间替代本征音与本征信道空间,将高维超矢量映射为低维I-vector表示,并进行信道补偿与特征降维处理。汉语是有调语言,各方言在其韵律结构上具有明... 提出身份认证矢量(Identity vector,I-vector)结合韵律信息的汉语方言辨识方法。全差异空间替代本征音与本征信道空间,将高维超矢量映射为低维I-vector表示,并进行信道补偿与特征降维处理。汉语是有调语言,各方言在其韵律结构上具有明显差异,I-vector特征融合全局韵律信息,可有效增补各方言鉴别性。利用融合信息对闽、粤、吴等五种方言以及普通话进行辨识实验,等错率(Equal Error Rate,EER)达到8.01%,比高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)降低56.2%,表明融合全局韵律信息的Ivector方法可有效提高汉语方言辨识正确率。 展开更多
关键词 汉语方言辨识 韵律特征 I-vector 特征融合
在线阅读 下载PDF
基于GMM符号化和置信判别的汉语方言自动辨识研究 被引量:3
17
作者 沈兆勇 顾明亮 杨亦鸣 《计算机科学》 CSCD 北大核心 2006年第11期210-211,236,共3页
近年来汉语方言自动辨识研究有了初步进展,但由于缺乏带有语音标注的方言音库,性能优越的并行音素识别-语言模型(PPRLM)方法尚未得到研究和运用。本文借助高斯混合模型(GMM)符号化器把PPRLM的思想方法引入到汉语方言辨识中,并通过融合... 近年来汉语方言自动辨识研究有了初步进展,但由于缺乏带有语音标注的方言音库,性能优越的并行音素识别-语言模型(PPRLM)方法尚未得到研究和运用。本文借助高斯混合模型(GMM)符号化器把PPRLM的思想方法引入到汉语方言辨识中,并通过融合置信判别使系统能够用于开集辨识。仿真实验表明,本文方法具有很高的稳定性和可靠性,综合性能较为优越。 展开更多
关键词 汉语方言自动辨识 PPRLM方法 GMM符号化 置信判别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部