期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
鲁棒性话者辨识中的一种改进的马尔科夫模型
被引量:
6
1
作者
刘鸣
戴蓓倩
+2 位作者
李辉
陆伟
李霄寒
《电子学报》
EI
CAS
CSCD
北大核心
2002年第1期46-48,共3页
为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ...
为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ,鲁棒性好的特征参数起主导作用 ,而在噪声比较小的环境下 ,精细度高的特征参数起主导作用 .实验证明 ,这种改进的马尔可夫模型明显提高语音识别系统的鲁棒性能 。
展开更多
关键词
连续隐马尔可夫模型
鲁棒性
话者识别
语音识别
在线阅读
下载PDF
职称材料
嵌入式语音识别系统的研究和实现
被引量:
19
2
作者
方敏
浦剑涛
+1 位作者
李成荣
台宪青
《中文信息学报》
CSCD
北大核心
2004年第6期73-78,共6页
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统 ,同传统的基于PC的非特定人语音识别系统相比 ,该系统具备内存消耗小 ,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结...
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统 ,同传统的基于PC的非特定人语音识别系统相比 ,该系统具备内存消耗小 ,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果 ,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求 ,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难 。
展开更多
关键词
计算机应用
中文信息处理
嵌入式平台
非特定人语音识别
语音识别SOIC
在线阅读
下载PDF
职称材料
多用途汉语方言语音数据库的设计
被引量:
8
3
作者
高原
顾明亮
+2 位作者
孙平
王侠
张长水
《计算机工程与应用》
CSCD
2012年第5期118-120,共3页
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计...
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。
展开更多
关键词
汉语方言数据库
说话人信息处理
方言特征词识别
在线阅读
下载PDF
职称材料
邮包校核语音识别系统的实时实现
被引量:
6
4
作者
单翼翔
张昊天
+4 位作者
李虎生
钟林
张进
刘加
刘润生
《电子学报》
EI
CAS
CSCD
北大核心
2002年第4期544-547,共4页
本文研究开发了一套邮包信息校核语音识别系统 .该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核 .系统可以识别普通话或四川话语音 ,可识别的词汇量约为 4 5 0 0条 .系统还采用了拒识技术与说话人自适应技...
本文研究开发了一套邮包信息校核语音识别系统 .该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核 .系统可以识别普通话或四川话语音 ,可识别的词汇量约为 4 5 0 0条 .系统还采用了拒识技术与说话人自适应技术 ,提高了整个系统的稳健性 .实验表明对普通话的首选识别率达到 98.7% ,前三选识别率达到 99.9% .对四川话的首选识别率达到 95 .9% ,前三选识别率达到 98.6 % ,对无关语音的正确拒识率达到 85 % ,对口音较重的说话人经过自适应后识别率可提高 5 -
展开更多
关键词
邮包校核
实时实现
语音识别系统
在线阅读
下载PDF
职称材料
语音识别中的一种说话人聚类算法
被引量:
4
5
作者
肖述才
欧智坚
王作英
《中文信息学报》
CSCD
北大核心
2005年第4期84-88,共5页
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适...
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR距离作为距离测度的时候,该算法对句子的聚类正确率达85·69%;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。
展开更多
关键词
计算机应用
中文信息处理
说话人聚类
说话人自适应
语音识别
在线阅读
下载PDF
职称材料
一种适用于说话人识别的改进Mel滤波器
被引量:
8
6
作者
项要杰
杨俊安
+1 位作者
李晋徽
陆俊
《计算机工程》
CAS
CSCD
2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适...
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。
展开更多
关键词
说话人识别
MEL倒谱系数
个性信息
反Mel倒谱系数
频谱分布
语音信号
在线阅读
下载PDF
职称材料
基于结构化特征语音模型的区别性说话人自适应算法
7
作者
蔡铁
朱杰
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第S1期138-142,共5页
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验...
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能.
展开更多
关键词
语音识别
说话人自适应
特征语音
最大互信息量
在线阅读
下载PDF
职称材料
应用于军事指挥中的鲁棒性语音识别系统
被引量:
5
8
作者
赵军辉
匡镜明
谢湘
《兵工学报》
EI
CAS
CSCD
北大核心
2004年第4期509-512,共4页
恶劣的军事环境为语音识别系统应用于军事指挥带来了巨大的困难 ,本文基于语音识别的基本原理 ,并根据军事指挥这一特殊的应用环境 ,提出了一种高鲁棒性的语音识别方案。经过战场仿真环境测试表明 ,该方案的语音识别率在高噪声环境中能...
恶劣的军事环境为语音识别系统应用于军事指挥带来了巨大的困难 ,本文基于语音识别的基本原理 ,并根据军事指挥这一特殊的应用环境 ,提出了一种高鲁棒性的语音识别方案。经过战场仿真环境测试表明 ,该方案的语音识别率在高噪声环境中能达到 90 %以上 。
展开更多
关键词
军事指挥
鲁棒性
语音识别系统
信息处理技术
感知线性预测
噪声抑制
在线阅读
下载PDF
职称材料
渐进式神经网络多维说话人信息识别技术
被引量:
3
9
作者
陈海霞
徐珑婷
杨震
《南京邮电大学学报(自然科学版)》
北大核心
2019年第1期45-51,共7页
提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于...
提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于渐进式神经网络技术(Progressive Neural Network,ProgNets)的多维说话人信息识别方法。在性别相关的基础上,将辅助语音识别模型知识迁移学习到主语音识别模型中,进而增强语音识别性能。实验结果表明,基线系统识别结果比非同时识别的单维语音识别DBN模型的平均识别率提升了4.73%,而基于ProgNets系统的多维系统识别精度比基线系统高1.8%。
展开更多
关键词
I-vector特征向量
深度置信网络
渐进式神经网络
多维说话人信息识别
在线阅读
下载PDF
职称材料
说话人识别中基于音素分类的数据选择方法
10
作者
吴蔚澜
张卫强
+4 位作者
刘巍巍
田垚
陈振锋
刘加
夏善红
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2014年第5期714-719,共6页
在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于...
在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法.
展开更多
关键词
说话人识别
有效数据
音素解码器
辅音
在线阅读
下载PDF
职称材料
一种快速说话人搜索算法
11
作者
朱磊
江杰
+1 位作者
郑榕
徐波
《中文信息学报》
CSCD
北大核心
2008年第2期60-63,共4页
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。...
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。
展开更多
关键词
计算机应用
中文信息处理
说话人识别
说话人搜索
两遍搜索
在线阅读
下载PDF
职称材料
题名
鲁棒性话者辨识中的一种改进的马尔科夫模型
被引量:
6
1
作者
刘鸣
戴蓓倩
李辉
陆伟
李霄寒
机构
中国科学技术大学电子科学与技术系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2002年第1期46-48,共3页
基金
国家自然科学基金 (No .69872 0 36)
文摘
为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ,鲁棒性好的特征参数起主导作用 ,而在噪声比较小的环境下 ,精细度高的特征参数起主导作用 .实验证明 ,这种改进的马尔可夫模型明显提高语音识别系统的鲁棒性能 。
关键词
连续隐马尔可夫模型
鲁棒性
话者识别
语音识别
Keywords
CHMM
information
fusion
robustness
speaker
recognition
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
嵌入式语音识别系统的研究和实现
被引量:
19
2
作者
方敏
浦剑涛
李成荣
台宪青
机构
中国科学院自动化研究所高技术创新中心
出处
《中文信息学报》
CSCD
北大核心
2004年第6期73-78,共6页
基金
8 6 3计划重点资助项目 (2 0 0 2AA1180 2 0 )
北京市自然科学基金资助项目(4 0 2 2 0 10 )
文摘
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统 ,同传统的基于PC的非特定人语音识别系统相比 ,该系统具备内存消耗小 ,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果 ,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求 ,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难 。
关键词
计算机应用
中文信息处理
嵌入式平台
非特定人语音识别
语音识别SOIC
Keywords
computer application
Chinese
information
processing
embedded platform
speaker
-independent speech
recognition
speech
recognition
SOC
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多用途汉语方言语音数据库的设计
被引量:
8
3
作者
高原
顾明亮
孙平
王侠
张长水
机构
徐州师范大学语言科学学院
徐州师范大学物理与电子工程学院
清华大学自动化系
出处
《计算机工程与应用》
CSCD
2012年第5期118-120,共3页
基金
国家自然科学基金(No.61040053)
徐州师范大学科研创新计划资助课题(No.2010YLB019)
文摘
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。
关键词
汉语方言数据库
说话人信息处理
方言特征词识别
Keywords
Chinese dialect speech database
speaker
information
analysis
character-words
recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
邮包校核语音识别系统的实时实现
被引量:
6
4
作者
单翼翔
张昊天
李虎生
钟林
张进
刘加
刘润生
机构
清华大学电子工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2002年第4期544-547,共4页
基金
国家自然科学基金 (No .699750 0 7)
国家 863项目 (No .863 30 6ZD1 3 0 4 6
+1 种基金
863 51 2 980 5 1 0 )
中科院自动化所模式识别国家重点实验室开放课题
文摘
本文研究开发了一套邮包信息校核语音识别系统 .该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核 .系统可以识别普通话或四川话语音 ,可识别的词汇量约为 4 5 0 0条 .系统还采用了拒识技术与说话人自适应技术 ,提高了整个系统的稳健性 .实验表明对普通话的首选识别率达到 98.7% ,前三选识别率达到 99.9% .对四川话的首选识别率达到 95 .9% ,前三选识别率达到 98.6 % ,对无关语音的正确拒识率达到 85 % ,对口音较重的说话人经过自适应后识别率可提高 5 -
关键词
邮包校核
实时实现
语音识别系统
Keywords
speech
recognition
confidence measure and rejection
speaker
adaptation
information
checking and verification
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
语音识别中的一种说话人聚类算法
被引量:
4
5
作者
肖述才
欧智坚
王作英
机构
清华大学电子系
出处
《中文信息学报》
CSCD
北大核心
2005年第4期84-88,共5页
基金
国家863高科技计划资助项目(2001AA114071).
文摘
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR距离作为距离测度的时候,该算法对句子的聚类正确率达85·69%;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。
关键词
计算机应用
中文信息处理
说话人聚类
说话人自适应
语音识别
Keywords
computer application
Chinese
information
processing
speaker
clustering
speaker
adaptation
speech
recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种适用于说话人识别的改进Mel滤波器
被引量:
8
6
作者
项要杰
杨俊安
李晋徽
陆俊
机构
电子工程学院信息系
安徽省电子制约技术重点实验室
出处
《计算机工程》
CAS
CSCD
2013年第11期214-217,222,共5页
基金
国家自然科学基金资助项目(60872113)
文摘
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。
关键词
说话人识别
MEL倒谱系数
个性信息
反Mel倒谱系数
频谱分布
语音信号
Keywords
speaker
recognition
Mel-frequency Cepstral Coefficient(MFCC)
specific
information
Inverted Mel-frequency CepstralCoefficient(MFCC)
spectrum distribution
speech signal
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于结构化特征语音模型的区别性说话人自适应算法
7
作者
蔡铁
朱杰
机构
上海交通大学电子工程系
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第S1期138-142,共5页
基金
上海市科学技术委员会基础研究项目基金(01JC14033)。
文摘
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能.
关键词
语音识别
说话人自适应
特征语音
最大互信息量
Keywords
speech
recognition
speaker
adaptation
eigenvoice
maximum mutual
information
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
应用于军事指挥中的鲁棒性语音识别系统
被引量:
5
8
作者
赵军辉
匡镜明
谢湘
机构
北京理工大学电子工程系
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2004年第4期509-512,共4页
基金
北京理工大学基础研究基金 (BIT UBF 2 0 0 3 0 1F0 3 )
文摘
恶劣的军事环境为语音识别系统应用于军事指挥带来了巨大的困难 ,本文基于语音识别的基本原理 ,并根据军事指挥这一特殊的应用环境 ,提出了一种高鲁棒性的语音识别方案。经过战场仿真环境测试表明 ,该方案的语音识别率在高噪声环境中能达到 90 %以上 。
关键词
军事指挥
鲁棒性
语音识别系统
信息处理技术
感知线性预测
噪声抑制
Keywords
information
processing technique, speech
recognition
, robustness, perceptually based linear prediction, noise suppression,
speaker
adaptation
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
渐进式神经网络多维说话人信息识别技术
被引量:
3
9
作者
陈海霞
徐珑婷
杨震
机构
南京邮电大学宽带无线通信与传感网技术教育部重点实验室
东华大学信息科学与技术学院
南京邮电大学通信与网络技术国家地方联合工程研究中心
出处
《南京邮电大学学报(自然科学版)》
北大核心
2019年第1期45-51,共7页
基金
国家自然科学基金(61271335)
国家高技术研究发展计划(863计划)(2006AA010102)资助项目
文摘
提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于渐进式神经网络技术(Progressive Neural Network,ProgNets)的多维说话人信息识别方法。在性别相关的基础上,将辅助语音识别模型知识迁移学习到主语音识别模型中,进而增强语音识别性能。实验结果表明,基线系统识别结果比非同时识别的单维语音识别DBN模型的平均识别率提升了4.73%,而基于ProgNets系统的多维系统识别精度比基线系统高1.8%。
关键词
I-vector特征向量
深度置信网络
渐进式神经网络
多维说话人信息识别
Keywords
I-vector feature vector
deep belief networks
progressive neural network
multi-dimensional speaker information recognition
分类号
TN912.34 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
说话人识别中基于音素分类的数据选择方法
10
作者
吴蔚澜
张卫强
刘巍巍
田垚
陈振锋
刘加
夏善红
机构
中国科学院电子学研究所传感技术国家重点实验室
中国科学院大学
清华大学电子工程系清华信息科学与技术国家实验室(筹)
出处
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2014年第5期714-719,共6页
基金
国家自然科学基金(61005019
61273268
+1 种基金
90920302)
北京市自然科学基金(KZ201110005005)资助
文摘
在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法.
关键词
说话人识别
有效数据
音素解码器
辅音
Keywords
speaker
recognition
useful
information
phoneme decoder
consonant
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种快速说话人搜索算法
11
作者
朱磊
江杰
郑榕
徐波
机构
中国科学院自动化研究所数字内容技术研究中心
出处
《中文信息学报》
CSCD
北大核心
2008年第2期60-63,共4页
基金
国家863计划资助项目(2006AA010103)
国家973计划资助项目(2004CB318105)
文摘
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。
关键词
计算机应用
中文信息处理
说话人识别
说话人搜索
两遍搜索
Keywords
computer application
Chinese
information
processing
speaker
recognition
speaker
searching
two-timesearch strategy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
鲁棒性话者辨识中的一种改进的马尔科夫模型
刘鸣
戴蓓倩
李辉
陆伟
李霄寒
《电子学报》
EI
CAS
CSCD
北大核心
2002
6
在线阅读
下载PDF
职称材料
2
嵌入式语音识别系统的研究和实现
方敏
浦剑涛
李成荣
台宪青
《中文信息学报》
CSCD
北大核心
2004
19
在线阅读
下载PDF
职称材料
3
多用途汉语方言语音数据库的设计
高原
顾明亮
孙平
王侠
张长水
《计算机工程与应用》
CSCD
2012
8
在线阅读
下载PDF
职称材料
4
邮包校核语音识别系统的实时实现
单翼翔
张昊天
李虎生
钟林
张进
刘加
刘润生
《电子学报》
EI
CAS
CSCD
北大核心
2002
6
在线阅读
下载PDF
职称材料
5
语音识别中的一种说话人聚类算法
肖述才
欧智坚
王作英
《中文信息学报》
CSCD
北大核心
2005
4
在线阅读
下载PDF
职称材料
6
一种适用于说话人识别的改进Mel滤波器
项要杰
杨俊安
李晋徽
陆俊
《计算机工程》
CAS
CSCD
2013
8
在线阅读
下载PDF
职称材料
7
基于结构化特征语音模型的区别性说话人自适应算法
蔡铁
朱杰
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005
0
在线阅读
下载PDF
职称材料
8
应用于军事指挥中的鲁棒性语音识别系统
赵军辉
匡镜明
谢湘
《兵工学报》
EI
CAS
CSCD
北大核心
2004
5
在线阅读
下载PDF
职称材料
9
渐进式神经网络多维说话人信息识别技术
陈海霞
徐珑婷
杨震
《南京邮电大学学报(自然科学版)》
北大核心
2019
3
在线阅读
下载PDF
职称材料
10
说话人识别中基于音素分类的数据选择方法
吴蔚澜
张卫强
刘巍巍
田垚
陈振锋
刘加
夏善红
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2014
0
在线阅读
下载PDF
职称材料
11
一种快速说话人搜索算法
朱磊
江杰
郑榕
徐波
《中文信息学报》
CSCD
北大核心
2008
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部