期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
A Review of Speech Coding 被引量:3
1
作者 Bao ChangchunAssociate professor of Information Engineering, Beijing Polytechnic University, Ph.D, CIE senior member (Department of Electronic Engineering, Beijing Polytechnic University, Beijing 100022) Fan ChangxinProfessor with Xidian University, C 《通信学报》 EI CSCD 北大核心 1998年第5期45-56,共12页
AReviewofSpechCodingBaoChangchun(DepartmentofElectronicEngineering,BeijingPolytechnicUniversity,Beijing10002... AReviewofSpechCodingBaoChangchun(DepartmentofElectronicEngineering,BeijingPolytechnicUniversity,Beijing100022)FanChangxin?.. 展开更多
关键词 语音编码 线性估计 综合分析 波形编码
在线阅读 下载PDF
人机语言通讯的新进展──Eurospeech’97及其卫星会
2
作者 张家騄 《应用声学》 CSCD 北大核心 1998年第2期44-48,共5页
本文以介绍第五届欧洲言语通讯和技术会议-Eurospeech’97及其卫星会议为主,概述言语科学与技术研究领域的国际学术会议情况以及本领域的最新发展.特别看重介绍语调研讨会、国际言语资料库和语音输入/输出系统评测协调委员会一COCOSD... 本文以介绍第五届欧洲言语通讯和技术会议-Eurospeech’97及其卫星会议为主,概述言语科学与技术研究领域的国际学术会议情况以及本领域的最新发展.特别看重介绍语调研讨会、国际言语资料库和语音输入/输出系统评测协调委员会一COCOSDA以及Eurospeech’97,指出当前围绕口语对话系统而开展的基础研究及实用化方向. 展开更多
关键词 语言识别 语言合成 口语对话 人机语言通讯
在线阅读 下载PDF
基于S型微纳光纤的声带振动传感器及语音智能识别研究 被引量:1
3
作者 王智君 黄嵊釉 +5 位作者 李昆 杨杨 陈复旦 罗彬彬 吴德操 邹雪 《光子学报》 北大核心 2025年第5期21-32,共12页
使用聚二甲基硅氧烷作为传感器衬底嵌入直径为4μm,弯曲半径为1 mm的S型微纳光纤,研制了一种可穿戴的声带语音识别柔性传感器。该传感器通过人体发声时声带产生振动引起传感器的光强度变化将其转变为电信号的变化从而可以实现声带振动... 使用聚二甲基硅氧烷作为传感器衬底嵌入直径为4μm,弯曲半径为1 mm的S型微纳光纤,研制了一种可穿戴的声带语音识别柔性传感器。该传感器通过人体发声时声带产生振动引起传感器的光强度变化将其转变为电信号的变化从而可以实现声带振动信号的识别。利用目标检测算法模型对26个英文字母的识别率为96.8%,对日常词汇的识别率为97.75%,凸显了传感器在语音识别方面的普适性。该传感器具有制作简便,快速振动响应(222 ms)、可重复性且稳定性好等特点,在医疗领域和健康监测中具有潜在的应用价值。 展开更多
关键词 微纳光纤 声带振动 语音识别 目标检测算法 可穿戴传感器
在线阅读 下载PDF
基于带阈值的BPE-dropout多任务学习的端到端语音识别 被引量:2
4
作者 马建 朵琳 +1 位作者 韦贵香 唐剑 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期674-682,共9页
针对语音识别任务中出现的未登录词问题,提出一种带阈值的BPE-dropout多任务学习语音识别方法.该方法采用带随机性的字节对编码算法,在形成子词时引入带字数阈值的策略,将子词作为建模单元,编码器部分采用Conformer结构,与链接时序分类... 针对语音识别任务中出现的未登录词问题,提出一种带阈值的BPE-dropout多任务学习语音识别方法.该方法采用带随机性的字节对编码算法,在形成子词时引入带字数阈值的策略,将子词作为建模单元,编码器部分采用Conformer结构,与链接时序分类和注意力机制相结合.为进一步提升模型性能,引入动态参数对损失函数进行动态调节,并同时进行多任务训练和解码.实验结果表明,该方法采用子词作为建模单元可有效解决未登录词问题,在多任务学习框架下进一步提升了模型的识别性能.在公开数据集THCHS30和ST-CMDS上,该模型实现了超过95%的识别准确率. 展开更多
关键词 语音识别 多任务学习 字节对编码 动态调节参数
在线阅读 下载PDF
基于迁移学习双阶段训练的情感语音克隆技术 被引量:1
5
作者 李囡 郭浩 相洁 《计算机工程与设计》 北大核心 2024年第5期1533-1540,共8页
为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段... 为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段,采用情感语音数据集对其参数进行微调,提取具有情感信息的说话人特征。将此特征作为合成器的输入对梅尔谱的生成过程进行调节,通过声码器将此梅尔谱转换为具有目标说话人信息的情感语音。主客观分析结果表明,该方法所生成的克隆语音的情感相似度更高,音色相似度也有一定改善。 展开更多
关键词 迁移学习 情感语音克隆 情感语音合成 双阶段训练 说话人识别 说话人编码 参数微调
在线阅读 下载PDF
支持向量机在语音激活检测中的应用研究 被引量:15
6
作者 董恩清 赵鹤鸣 +1 位作者 周亚同 张晓娣 《通信学报》 EI CSCD 北大核心 2003年第3期70-77,共8页
提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参... 提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参数作为分类的特征参数。经过基于SVM的VAD方法与G.729B的VAD方法进行比较,表明SVM方法应用于VAD中是有效的。 展开更多
关键词 支持向量机 模式识别 统计学习理论 语音激活检测 语音编码
在线阅读 下载PDF
基于COM技术的语音应用系统的设计和实现 被引量:10
7
作者 朱杰 张申生 《计算机工程》 CAS CSCD 北大核心 2001年第11期143-144,F003,共3页
描述了将COM技术引用到语音应用系统的设计和实现中,提出了利用COM技术定制语音应用系统的想法,并以Microsoft的SpeechSDK 5.0为例,给出开发语音应用系统的主要设计思想、系统结构和实现方法。
关键词 语音识别 语音合成 COM技术 语音应用系统 软件设计
在线阅读 下载PDF
智能机器人语音远程控制系统的设计 被引量:6
8
作者 杨世强 梁丁宏 傅卫平 《计算机工程与应用》 CSCD 北大核心 2009年第25期71-73,88,共4页
为使智能机器人远程控制更加方便、快捷、人性化,设计并实现了一种智能机器人的语音远程控制系统方案。该方案利用微软语音开发包Microsoft SpeechS DK,构建基于听写模式的大词汇量语音识别模块和语音合成模块,利用海量中文智能分词组... 为使智能机器人远程控制更加方便、快捷、人性化,设计并实现了一种智能机器人的语音远程控制系统方案。该方案利用微软语音开发包Microsoft SpeechS DK,构建基于听写模式的大词汇量语音识别模块和语音合成模块,利用海量中文智能分词组件构建关键词检测模块,结合VFW(Video For Windows)技术与无线网络技术构建信息传输模块。实验表明,该系统语音识别准确率高,识别范围广,语音输入灵活。 展开更多
关键词 语音识别 语音合成 远程控制 关键词检测 智能机器人
在线阅读 下载PDF
语音用户界面研究进展 被引量:5
9
作者 韩勇 须德 戴国忠 《计算机科学》 CSCD 北大核心 2004年第6期1-4,39,共5页
语音是人们日常生活中高效、自然的交流方式之一。但是直到目前为止,语音交互方式在计算机技术上的应用还是比较少的。近年来,随着Ubiquitous Computing和便携式计算机的出现,再次对语音用户界面的应用提出了迫切的需求。而且语音识别... 语音是人们日常生活中高效、自然的交流方式之一。但是直到目前为止,语音交互方式在计算机技术上的应用还是比较少的。近年来,随着Ubiquitous Computing和便携式计算机的出现,再次对语音用户界面的应用提出了迫切的需求。而且语音识别、合成技术的发展也为语音交互界面的实现提供了技术基础。本文综合参考了国内外语音界面的一些应用系统实例以及语音这种独特的交流媒体的优点和局限性.总结了语音用户界面的适用环境和设计指导原则,并提出了对语音界面的发展展望。 展开更多
关键词 人机交互 语音界面 语音识别 语音合成 speech-as-data
在线阅读 下载PDF
可穿戴计算机中的语音处理技术 被引量:2
10
作者 韩纪庆 张磊 +1 位作者 吕成国 王承发 《计算机科学》 CSCD 北大核心 2002年第5期107-109,共3页
1 引言 可穿戴计算机(Wearable computer)是一种全新概念的微型个人移动计算系统,它可以穿戴在身上随着使用者一起移动,随时可以接受使用者的命令,并能自动地反馈给使用者重要的信息.可穿戴计算机的概念于1955年被提出,然而直到近年来... 1 引言 可穿戴计算机(Wearable computer)是一种全新概念的微型个人移动计算系统,它可以穿戴在身上随着使用者一起移动,随时可以接受使用者的命令,并能自动地反馈给使用者重要的信息.可穿戴计算机的概念于1955年被提出,然而直到近年来才得到了真正的发展.目前美国、日本、德国、澳大利亚等国都对可穿戴计算机的研究非常重视.我国的一些高校和研究单位,如哈尔滨工业大学、重庆大学、兵器部208所、58所等也于近年来在国内率先开展了这方面的工作. 展开更多
关键词 语音处理 语音识别 模板匹配 语音信号 可穿戴计算机
在线阅读 下载PDF
基于视频三音子的汉语双模态语料库的建立 被引量:6
11
作者 赵晖 林成龙 唐朝京 《中文信息学报》 CSCD 北大核心 2009年第5期98-103,共6页
为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中... 为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中的句子打分,并实现语料的自动选取。与其他双模态语料库相比,该文所建立的语料库在覆盖率、覆盖效率和高频词分布律有了较大改进,能够更加真实反映汉语中的双模态语言现象。 展开更多
关键词 计算机应用 中文信息处理 可视语音合成 双模态语料 视频三音子 评估函数
在线阅读 下载PDF
用LPC及DTW进行语音模式比较的设计与实现 被引量:13
12
作者 范新伟 申瑞民 杜彦蕊 《计算机工程》 CAS CSCD 北大核心 2004年第1期126-128,共3页
阐述了提取LPC特征参数和DTW模式匹配基本原理,并进一步实现了求解LPC的杜 宾算法和有效进行DTW的一个算法。在此基础上,根据英语学习的实际需要,设计并实现了 一个语音模式比较实例。
关键词 线性预测编码 动态时间规整 模式匹配 语音识别
在线阅读 下载PDF
采用 Fisher 分类法实现清浊音判决 被引量:7
13
作者 周志杰 胡光锐 林晓彤 《上海交通大学学报》 EI CAS CSCD 北大核心 1997年第5期30-32,共3页
采用Fisher分类法实现清浊音判决.计算机模拟结果显示,该方法准确率达97.4%,优于传统的清浊音判决算法.
关键词 语音识别 语音编码 清浊音判决 Fisher分类法
在线阅读 下载PDF
言语信息处理的进展 被引量:3
14
作者 蔡莲红 贾珈 郑方 《中文信息学报》 CSCD 北大核心 2011年第6期137-141,共5页
该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人... 该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人、短语音、时变语音等因素存在的情况下提高识别正确率,是说话人识别的研究热点;言语合成主要关注多语言合成、情感言语合成、可视言语合成等;言语知觉计算开展了言语测听、噪声抑制算法、助听器频响补偿方法、语音信号增强算法等研究。将言语处理技术与语言、网络有效结合,促进了更加和谐的人机言语交互。 展开更多
关键词 言语识别 说话人识别 言语合成 言语知觉计算
在线阅读 下载PDF
一种基于支持向量机的含噪语音的清/浊/静音分类的新方法 被引量:12
15
作者 齐峰岩 鲍长春 《电子学报》 EI CAS CSCD 北大核心 2006年第4期605-611,共7页
本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM... 本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法. 展开更多
关键词 支持向量机 统计学习 统计信号处理 模式识别 语音编码
在线阅读 下载PDF
基于稀疏特征迁移的语音情感识别 被引量:3
16
作者 宋鹏 金赟 +1 位作者 查诚 赵力 《数据采集与处理》 CSCD 北大核心 2016年第2期325-330,共6页
为了解决语音情感识别系统中训练数据和测试数据来自不同数据库所引起的识别率降低的问题,提出了一种基于稀疏特征迁移的语音情感识别方法。通过引入稀疏编码获取情感特征在不同数据库条件下的共同稀疏表示;同时引入最大区分差异(Maximu... 为了解决语音情感识别系统中训练数据和测试数据来自不同数据库所引起的识别率降低的问题,提出了一种基于稀疏特征迁移的语音情感识别方法。通过引入稀疏编码获取情感特征在不同数据库条件下的共同稀疏表示;同时引入最大区分差异(Maximum mean discrepancy,MMD)来衡量不同数据库条件下稀疏表示分布之间的距离,并将其作为稀疏编码目标函数的约束条件,从而获得较为鲁棒的稀疏特征。实验结果表明,相比传统语音情感识别方法,基于稀疏特征迁移的语音情感识别方法显著提高了跨库条件下的情感识别率。 展开更多
关键词 语音情感识别 特征迁移 稀疏编码
在线阅读 下载PDF
面向人机对抗赛的语音交互系统设计 被引量:4
17
作者 卢振利 田铠 +4 位作者 徐惠钢 张程 李斌 波罗瓦茨·布朗尼斯拉夫 刘军 《高技术通讯》 北大核心 2017年第5期457-463,共7页
设计了中型组足球机器人的比赛中应用的人机语音交互系统。首先简要介绍了相关软件,对语音识别原理进行了解析;然后分析了语音合成技术及其实现步骤,并根据足球机器人在比赛中的实际需要,设计了一套语音指令;利用Kinect软件进行了实验研... 设计了中型组足球机器人的比赛中应用的人机语音交互系统。首先简要介绍了相关软件,对语音识别原理进行了解析;然后分析了语音合成技术及其实现步骤,并根据足球机器人在比赛中的实际需要,设计了一套语音指令;利用Kinect软件进行了实验研究;最终针对不同的发声对象测试了多组数据,实验结果表明所设计的语音交互系统对语音指令的识别行之有效,识别率较高。无论是裁判机还是队员机,都能快速准确地识别队员的语音指令并进行播报,完全满足人机对抗赛对人机语音交互的需求。 展开更多
关键词 语音识别 语音合成 语音规则 KINECT
在线阅读 下载PDF
深度语音信号与信息处理:研究进展与展望 被引量:33
18
作者 戴礼荣 张仕良 《数据采集与处理》 CSCD 北大核心 2014年第2期171-179,共9页
首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说... 首先对深度学习进行简要的介绍,然后就其在语音信号与信息处理研究领域的主要研究方向,包括语音识别、语音合成、语音增强的研究进展进行了详细的介绍。语音识别方向主要介绍了基于深度神经网络的语音声学建模、大数据下的模型训练和说话人自适应技术;语音合成方向主要介绍了基于深度学习模型的若干语音合成方法;语音增强方向主要介绍了基于深度神经网络的若干典型语音增强方案。最后对深度学习在语音信与信息处理领域的未来可能的研究热点进行展望。 展开更多
关键词 深度学习 深度神经网络 语音识别 语音合成 语音增强
在线阅读 下载PDF
语音交互在三维虚拟船舶仿真平台中的应用 被引量:5
19
作者 符斌 任鸿翔 王德龙 《船海工程》 北大核心 2018年第3期133-136,共4页
为了使三维虚拟船舶仿真平台能更好地适用于航海虚拟培训,从提升用户体验的角度出发设计方便用户使用的语音交互系统。通过制作航海专业领域内的语料库,训练声学模型;使用语言模型训练工具Srilm训练得到3-gram语言模型,将二者有机结合... 为了使三维虚拟船舶仿真平台能更好地适用于航海虚拟培训,从提升用户体验的角度出发设计方便用户使用的语音交互系统。通过制作航海专业领域内的语料库,训练声学模型;使用语言模型训练工具Srilm训练得到3-gram语言模型,将二者有机结合构成解码网络;建立反应航海实际操作的语音交互系统。系统测试表明,实现了设计三维虚拟船舶仿真平台语音交互功能。 展开更多
关键词 船舶仿真平台 语音识别 语音合成 语音交互
在线阅读 下载PDF
基于模糊MLP网络的清浊音判决 被引量:2
20
作者 毛六平 唐艳 王耀南 《湖南师范大学自然科学学报》 EI CAS 北大核心 2003年第4期27-30,共4页
讨论了一种新型的模糊MLP神经网络及其在清浊音判决中的应用.该网络实现了多参量的综合评判,而且有效地处理了语音信号的模糊性,从而获得了较高的判决准确率.
关键词 MLP神经网络 清浊音判决 语音识别 模糊理论
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部