期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
针对口音识别中冗余特征及长尾效应的有效方法
1
作者 杨壮 颜永红 黄志华 《应用声学》 CSCD 北大核心 2024年第3期498-504,共7页
口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。... 口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。通过模型自适应学习通道和空间维度的不同权重,提高了口音识别的性能。在Common Voice英语口音数据集上的实验结果表明,引入CBAM注意力模块是有效的,识别准确率相对提升了12.7%,精确度相对提升了17.9%,F1值相对提升了6.98%。之后,提出了一种树形分类方法来缓解数据集中的长尾效应,识别准确率最多相对提升了5.2%。受域对抗训练的启发,尝试通过对抗学习方法剔除口音特征中的冗余信息,使得准确率最多相对提升了3.4%,召回率最多相对提升了16.9%。 展开更多
关键词 口音识别 注意力机制 树形分类 对抗学习
在线阅读 下载PDF
语音中元音和辅音的听觉感知研究 被引量:7
2
作者 颜永红 李军锋 应冬文 《应用声学》 CSCD 北大核心 2013年第3期231-236,共6页
本文对语音中元音和辅音的听觉感知研究进行综述。80多年前基于无意义音节的权威实验结果表明辅音对人的听感知更为重要,由于实验者在学术上的成就和权威性,这一结论成为了常识,直到近20年前基于自然语句的实验挑战了这个结论并引发了... 本文对语音中元音和辅音的听觉感知研究进行综述。80多年前基于无意义音节的权威实验结果表明辅音对人的听感知更为重要,由于实验者在学术上的成就和权威性,这一结论成为了常识,直到近20年前基于自然语句的实验挑战了这个结论并引发了新一轮的研究。本文主要围绕元音和辅音对语音感知的相对重要性、元音和辅音的稳态信息和边界动态信息对语音感知的影响以及相关研究的潜在应用等进行较为系统的介绍,最后给出了总结与展望。 展开更多
关键词 语言声学 语音产生 语音感知 可懂度 元音 辅音
在线阅读 下载PDF
60 dB动态范围的自动增益控制电路设计 被引量:5
3
作者 颜永红 蒋金枝 +1 位作者 马成炎 莫太山 《电子器件》 CAS 2008年第3期875-878,共4页
设计了一种工作频率在15.42 MHz应用于GPS射频接收芯片中的自动增益控制(AGC)电路,该电路与传统AGC结构相比,不需要峰值检测电路,也不需要环路滤波器,大大简化了设计复杂度,同时也使电路性能受工艺及温度变化的影响大大减小了,因此适用... 设计了一种工作频率在15.42 MHz应用于GPS射频接收芯片中的自动增益控制(AGC)电路,该电路与传统AGC结构相比,不需要峰值检测电路,也不需要环路滤波器,大大简化了设计复杂度,同时也使电路性能受工艺及温度变化的影响大大减小了,因此适用于低功耗、高集成的GPS射频通信系统中。电路设计采用TSMC 0.25 μm CMOS工艺,电源电压2.5 V,经过流片验证,其动态范围可达60 dB,工作频率范围为[3.8 MHz,40 MHz],总功耗5 mW. 展开更多
关键词 嵌入式系统 TINI DS80C400 无线通信 自动增益控制 可变增益放大器 全球定位系统
在线阅读 下载PDF
高速网络TCP/IP减荷的研究 被引量:1
4
作者 颜永红 张帆 严志康 《现代电子技术》 2005年第22期31-33,36,共4页
近十年来,随着网络技术的发展,网络带宽迅速增长,而同期CPU的性能未得到相应的提高。在吉比特网络下,网络终端CPU处理TCP/IP协议的能力已经成为限制网络应用的瓶颈。为了使终端用户能充分利用广阔的带宽资源,需要提高网络终端的协议处... 近十年来,随着网络技术的发展,网络带宽迅速增长,而同期CPU的性能未得到相应的提高。在吉比特网络下,网络终端CPU处理TCP/IP协议的能力已经成为限制网络应用的瓶颈。为了使终端用户能充分利用广阔的带宽资源,需要提高网络终端的协议处理能力。文中基于FPGA的硬件设计,将原来由软件完成的IP层协议功能完全卸载出来,向CPU提供硬件支持。并且通过功能仿真、综合后仿真、布局布线后仿真验证了设计的可行性,由静态时序分析可知,协议处理器的时钟频率可达50 MH z,处理IP数据流的能力可以达到1.6 G b/s的网络线速度。 展开更多
关键词 吉比特网络 终端 卸载 仿真 协议处理器
在线阅读 下载PDF
一维0.18μm CMOS光电二极管量子效率的研究与模拟 被引量:1
5
作者 颜永红 汪立 《电子器件》 CAS 2008年第4期1073-1076,共4页
为了建立更精确的CMOS光电二极管SPICE模型,使之在像素电路模拟中能够更好地反映实际的光电转换物理现象。使用连续性方程和不同的边界条件对CMOS光电二极管建立了一维物理模型,然后代入普通CMOS0.18工艺参数在温度为300K、反偏电压为2... 为了建立更精确的CMOS光电二极管SPICE模型,使之在像素电路模拟中能够更好地反映实际的光电转换物理现象。使用连续性方程和不同的边界条件对CMOS光电二极管建立了一维物理模型,然后代入普通CMOS0.18工艺参数在温度为300K、反偏电压为2.2V时,对N-diff/P-epi,N-well/P-epi两种结构的二极管量子效率进行了模拟。其中考虑了表面复合速率、外延层厚度、P+衬底与P外延同质结等因素对模拟结果的影响。在此基础上,还对CMOS光栅二极管的量子效率进行了计算。模拟结果符合这些器件已知的特性。 展开更多
关键词 CMOS 光电二极管 光栅二极管 量子效率 数值模拟
在线阅读 下载PDF
语言声学与内容理解研究进展 被引量:1
6
作者 颜永红 《应用声学》 CSCD 北大核心 2012年第1期35-41,共7页
本文对语言声学与内容理解研究的最新进展进行综述。首先介绍人类的言语的产生、感知以及声学分析方面的进展,接着分别介绍采用计算机来对语音中的各种信息进行抽取(包括语音、说话人和语种识别)和内容分析与理解(包括文档内容分析和理... 本文对语言声学与内容理解研究的最新进展进行综述。首先介绍人类的言语的产生、感知以及声学分析方面的进展,接着分别介绍采用计算机来对语音中的各种信息进行抽取(包括语音、说话人和语种识别)和内容分析与理解(包括文档内容分析和理解与对话)的最新成果,最后对语言声学与内容理解的研究进行了总结和展望。 展开更多
关键词 语言声学 语音信息提取 口语内容理解
在线阅读 下载PDF
语言声学进展及其应用
7
作者 颜永红 《应用声学》 CSCD 北大核心 2009年第2期81-89,共9页
本文对语言声学研究的最新进展进行综述。首先介绍了人类的言语的产生和感知以及声学分析方面的近期发展,接着重点阐述了计算机处理人类语音(包括语音识别和合成,发音评估以及演唱评价)的最新研究、成果。同时提及了这些研究成果的相关... 本文对语言声学研究的最新进展进行综述。首先介绍了人类的言语的产生和感知以及声学分析方面的近期发展,接着重点阐述了计算机处理人类语音(包括语音识别和合成,发音评估以及演唱评价)的最新研究、成果。同时提及了这些研究成果的相关应用。最后是总结与展望。 展开更多
关键词 语言声学 言语产生 言语感知 语音识别 语音合成 发音评估 演唱评价
在线阅读 下载PDF
微程序实现TCP/IP协议处理器的控制
8
作者 颜永红 李飞宇 +2 位作者 文燕 黎宝峰 田中俊 《电子与封装》 2005年第4期29-31,8,共4页
随着Internet的迅速发展,TCP/IP协议在嵌入式系统中的实现,成为嵌入式Internet发展的瓶颈。用ASIC设计TCP/IP协议器时,根据嵌入式应用的特点,将TCP/IP协议进行简化。从协议处理器简化宏状态转移图出发,根据TCP/IP协议的特点,设计微程序... 随着Internet的迅速发展,TCP/IP协议在嵌入式系统中的实现,成为嵌入式Internet发展的瓶颈。用ASIC设计TCP/IP协议器时,根据嵌入式应用的特点,将TCP/IP协议进行简化。从协议处理器简化宏状态转移图出发,根据TCP/IP协议的特点,设计微程序控制单元,该控制单元根据应用层、数据链路层、定时部分和数据通道中的状态信号和控制标志,完成对数据通道、定时部分的控制及与数据链路层、应用层通信的接口,来实现连接的建立、断开和异常情况的处理。 展开更多
关键词 INTERNET TCP/IP协议 微程序控制
在线阅读 下载PDF
基于递归神经网络的语音识别快速解码算法 被引量:17
9
作者 张舸 张鹏远 +1 位作者 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2017年第4期930-937,共8页
递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用... 递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。 展开更多
关键词 语音识别 递归神经网络 解码器 跳帧计算
在线阅读 下载PDF
一种新的基于正丁胺等离子体聚合膜的免疫传感器抗体(抗原)固定化方法 被引量:6
10
作者 吴朝阳 颜永红 +1 位作者 沈国励 俞汝勤 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 1999年第12期1871-1873,共3页
关键词 等离子体聚合膜 免疫 传感器 固定化 正丁胺
在线阅读 下载PDF
正丁胺的等离子体聚合膜性质及氢离子响应功能研究 被引量:4
11
作者 向建南 张伟强 +3 位作者 王柯敏 颜永红 王彬锋 尹霞 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 1997年第5期711-715,共5页
以正丁胺为单体,采用等离子体聚合法,在盖玻片与玻璃碳及一些金属基片上得到附着性和稳定性均良好的聚合膜.红外光谱、元素分析结果和睦性质研究表明;该聚合膜具有高度支化、交联的结构,具有良好的耐热和耐腐蚀性.以该膜为敏感材... 以正丁胺为单体,采用等离子体聚合法,在盖玻片与玻璃碳及一些金属基片上得到附着性和稳定性均良好的聚合膜.红外光谱、元素分析结果和睦性质研究表明;该聚合膜具有高度支化、交联的结构,具有良好的耐热和耐腐蚀性.以该膜为敏感材料制成的电位型化学传感器在强酸性溶液中对H+离子具有超能斯特响应,且稳定性和重现性较好. 展开更多
关键词 正丁胺 等离子体聚合 化学传感器 氢离子 电位型
在线阅读 下载PDF
基于改进主题分布特征的神经网络语言模型 被引量:10
12
作者 刘畅 张一珂 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2018年第1期219-225,共7页
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后... 在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。 展开更多
关键词 语音识别 语言模型 隐含狄利克雷分布 长短时记忆
在线阅读 下载PDF
双线性插值图像放大算法优化及硬件实现 被引量:6
13
作者 帅金晓 颜永红 +1 位作者 彭琰 罗江平 《核电子学与探测技术》 CAS CSCD 北大核心 2009年第1期55-58,共4页
提出了一种基于双线性插值图像放大的优化算法,在算法中加入轮廓增强处理,保留了图像边缘的高频信息,改善了双线性插值算法引起的边缘模糊问题。改进后的双线性插值放大算法处理速度快,硬件实现简单,且有较好的图像质量。实验表明,该算... 提出了一种基于双线性插值图像放大的优化算法,在算法中加入轮廓增强处理,保留了图像边缘的高频信息,改善了双线性插值算法引起的边缘模糊问题。改进后的双线性插值放大算法处理速度快,硬件实现简单,且有较好的图像质量。实验表明,该算法适合于对图像进行实时放大处理。 展开更多
关键词 图像放大 双线性插值 轮廓增强 实时处理
在线阅读 下载PDF
多特征融合的英语口语考试自动评分系统的研究 被引量:11
14
作者 李艳玲 颜永红 《电子与信息学报》 EI CSCD 北大核心 2012年第9期2097-2102,共6页
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答... 该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。 展开更多
关键词 自动语音识别 自动评分 特征选择 相似度 句法树
在线阅读 下载PDF
基于听觉感知特性的双耳音频处理技术 被引量:6
15
作者 李军锋 徐华兴 +1 位作者 夏日升 颜永红 《应用声学》 CSCD 北大核心 2018年第5期706-716,共11页
自20世纪30年代引入立体声以来,人类对逼真的听觉体验一直进行着孜孜不倦的追求。双耳音频处理技术基于人耳听觉感知特性,利用计算机和数字信号处理等技术在听者双耳鼓膜处模拟出与真实场景相同的声压,以期给人以"身临其境"... 自20世纪30年代引入立体声以来,人类对逼真的听觉体验一直进行着孜孜不倦的追求。双耳音频处理技术基于人耳听觉感知特性,利用计算机和数字信号处理等技术在听者双耳鼓膜处模拟出与真实场景相同的声压,以期给人以"身临其境"的体验,一直是音频信号处理领域的重要研究内容,特别是近两年随着虚拟现实等应用的蓬勃发展,得到更多关注。该文主要围绕双耳音频处理技术中所涉及的关键环节:双耳录音、双耳合成、耳机重放、扬声器重放、头跟踪等领域,以及相关典型应用场景进行较为系统的介绍,最后给出总结与展望。 展开更多
关键词 三维音频 双耳技术 耳机重放 扬声器重放
在线阅读 下载PDF
关键词检测系统中基于音素网格的置信度计算 被引量:3
16
作者 张鹏远 韩疆 颜永红 《电子与信息学报》 EI CSCD 北大核心 2007年第9期2063-2066,共4页
该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法... 该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法综合利用两种置信度,取得了较好的效果。在自然对话的电话数据测试中,与传统的置信度计算方式相比,混和置信度的FOM(Figure Of Merit)值相对提高了17.0%。 展开更多
关键词 语音识别 关键词检测 置信度 后验概率 网格
在线阅读 下载PDF
基于加权有限状态机的动态匹配词图生成算法 被引量:4
17
作者 郭宇弘 黎塔 +2 位作者 肖业鸣 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2014年第1期140-146,共7页
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论... 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。 展开更多
关键词 自动语音识别 加权有限状态机 词图生成 关键词检索
在线阅读 下载PDF
英语篇章朗读质量的自动评分 被引量:3
18
作者 蒋同海 张俊博 +1 位作者 潘复平 颜永红 《应用声学》 CSCD 北大核心 2011年第6期418-426,共9页
本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中... 本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中学生的英语水平自动测试中,用3200名学生的人工评分训练系统,对其余800名学生的机器自动测试取得分差为1.18的良好结果,而专家评分与参考评分的平均分差为1.31。实验表明该项技术已达到实用化水平。 展开更多
关键词 自动评分 发音质量评估 语音识别
在线阅读 下载PDF
一种基于联合源-滤波器模型优化的语音声门源模型估计方法 被引量:3
19
作者 付强 Peter Murphy 颜永红 《电子学报》 EI CAS CSCD 北大核心 2007年第5期982-986,共5页
本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,... 本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,本文采用了一个两阶段(two-pass)的实现策略来解决这一问题.第一阶段初始化声门源和声道模型,并为其后的联合优化过程提供稳健的初始参数.第二阶段的联合估计则最终决定模型估计的精度,由信任域下降优化算法实现.通过分别对合成和真实语音的实验,表明该方法是一种具有一定精度和较好的稳健性的声门源模型估计算法. 展开更多
关键词 语音产生模型 源-滤波器 声门波导数 ARX 声门波估计 联合优化
在线阅读 下载PDF
一种任务域无关的语音关键词检测系统 被引量:2
20
作者 韩疆 刘晓星 +1 位作者 颜永红 张鹏远 《通信学报》 EI CSCD 北大核心 2006年第2期137-141,共5页
提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜... 提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜索空间构造方法,关键词识别准确率平均提高了绝对6.9%;提出了近邻声学上下文准则以及候选关键词在多尺度声学模型上的似然比计算方法并采用FLDA融合,显著提高了声学置信度计算的有效性,系统等错率绝对下降了3.0%。 展开更多
关键词 声学置信度 多尺度声学建模 搜索空间
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部