期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
连续识别Cu^(2+)及PO_(4)^(3-)香豆素类荧光探针合成与应用 被引量:1
1
作者 闫雪雪 喻艳超 +3 位作者 庞树奎 吴绵园 荆军凯 刘其业 《化工进展》 EI CAS CSCD 北大核心 2024年第11期6372-6378,共7页
以4-二乙氨基水杨醛和肼基甲酸甲酯为原料制备一种新型双功能香豆素荧光探针L,并通过NMR、FTIR及HRMS对其结构表征。荧光发射光谱表明,在甲醇溶液中,探针L与Cu^(2+)形成1∶1的络合物L-Cu^(2+),在30s时间内引起荧光淬灭效应,淬灭率近100%... 以4-二乙氨基水杨醛和肼基甲酸甲酯为原料制备一种新型双功能香豆素荧光探针L,并通过NMR、FTIR及HRMS对其结构表征。荧光发射光谱表明,在甲醇溶液中,探针L与Cu^(2+)形成1∶1的络合物L-Cu^(2+),在30s时间内引起荧光淬灭效应,淬灭率近100%,且对Cu^(2+)检测过程中具有良好的特异性,可抵抗Ba^(2+)、Li^(+)、Cu^(+)、Al^(3+)、Zn^(2+)、Cs^(2+)、Mn^(2+)、Ca^(2+)、Hg^(2+)、Cd^(2+)、K^(+)、Mg^(2+)、Na^(+)、Co^(2+)、Ag^(+)、Fe^(^(3+))及Cr^(2+)等金属离子的干扰,检测极限低至1.70×10^(-8)mol/L,具有高度灵敏性。同时,基于配体置换原理,络合物L-Cu^(2+)可作为荧光传感器实现对PO_(3)^(-4)的荧光增强响应识别,且检测过程具有良好的选择性,可抵抗常见阴离子(NO_(2)^(-)、CO_(3)^(2-)、SO_(3)^(2-)、HPO_(4)^(2-)、P_(2)O_(7)^(4)^(-)、Br^(-)、F^(-)、HCO_(3)^(-)、SO_(4)^(2-)、C_(2)O_(4)^(2-)、Cl^(-)、CH_(3)COO^(-))的干扰,检测限低至6.00×10^(-8)mol/L。此外,探针L成功应用于医药化工及化工环境保护领域,得到良好实验效果。 展开更多
关键词 香豆素 荧光探针 二阶铜离子 磷酸根 连续识别
在线阅读 下载PDF
连续识别Zn^(2+)和草甘膦荧光探针的合成与应用 被引量:2
2
作者 喻艳超 陈心仪 +3 位作者 巴新宇 李艳萍 刘洋 曾运波 《精细化工》 EI CAS CSCD 北大核心 2023年第1期56-62,共7页
以2-巯基苯并噻唑为原料,设计合成了一种结构简单的苯并噻唑类荧光探针2-[2-(苯并噻吩-2-基亚甲基)肼基]苯并噻唑(简称NSS),并通过FTIR、HRMS、^(1)HNMR、^(13)CNMR对其结构进行了表征。荧光光谱表明,在二甲基亚砜中,探针NSS实现了Zn^(... 以2-巯基苯并噻唑为原料,设计合成了一种结构简单的苯并噻唑类荧光探针2-[2-(苯并噻吩-2-基亚甲基)肼基]苯并噻唑(简称NSS),并通过FTIR、HRMS、^(1)HNMR、^(13)CNMR对其结构进行了表征。荧光光谱表明,在二甲基亚砜中,探针NSS实现了Zn^(2+)的“关-开”型检测,具有响应时间短(30 s)、特异性强、抗干扰性强等优点。探针NSS荧光强度与Zn^(2+)浓度(0~11μmol/L)呈现良好的线性关系,检出限达19.1 nmol/L,并与Zn^(2+)形成物质的量比为1∶1的络合物。同时,络合物NSS-Zn^(2+)对草甘膦呈现特异性的荧光猝灭响应,猝灭率达99.4%,检出限16.0 nmol/L(2.71 ng/mL),且不受其他有机磷农药的干扰。 展开更多
关键词 苯并噻唑 荧光探针 Zn^(2+) 草甘膦 连续识别 功能材料
在线阅读 下载PDF
基于BODIPY荧光探针对Cu^(2+)和焦磷酸根的连续识别 被引量:2
3
作者 孟宪娇 《精细化工》 EI CAS CSCD 北大核心 2021年第10期2034-2041,2049,共9页
以8-羟基喹啉-5-甲醛和吡啶-2, 6-二甲酸二甲酯为原料,合成了一种氟硼二吡咯(BODIPY)型荧光化学传感器Ⅰ,通过FTIR、^(1)HNMR、^(13)CNMR和ESI-MS对其结构进行了表征,利用紫外/荧光分光光度法研究了传感器Ⅰ的传感性能。结果表明,在V(D... 以8-羟基喹啉-5-甲醛和吡啶-2, 6-二甲酸二甲酯为原料,合成了一种氟硼二吡咯(BODIPY)型荧光化学传感器Ⅰ,通过FTIR、^(1)HNMR、^(13)CNMR和ESI-MS对其结构进行了表征,利用紫外/荧光分光光度法研究了传感器Ⅰ的传感性能。结果表明,在V(DMF)∶V(水)=1∶4介质中,传感器Ⅰ对Cu^(2+)表现出明显的荧光猝灭响应,猝灭率高达97.7%,检测限为5.7×10^(–8)mol/L。此外,配合物Ⅰ-Cu^(2+)对焦磷酸根(PPi)表现出明显的荧光增强响应,检测限为1.9×10^(–8) mol/L,表明传感器Ⅰ对Cu^(2+)和PPi的识别检测具有较高的灵敏度和抗干扰能力。通过络合曲线和核磁滴定数据分析,得出传感器Ⅰ同Cu^(2+)以及配合物Ⅰ-Cu^(2+)对PPi的络合物质的量比均为1∶1。传感器Ⅰ对Cu^(2+)和PPi测试的有效pH范围为5~9,且循环响应测试可稳定进行4次。 展开更多
关键词 氟硼二吡咯 荧光探针 Cu^(2+) 焦磷酸根 连续识别 功能材料
在线阅读 下载PDF
基于图卷积网络和CTC/Attention的连续手语识别
4
作者 边辉 孟畅乾 +2 位作者 李子涵 陈子豪 谢雪雷 《计算机科学》 北大核心 2025年第S1期550-558,共9页
手语是听力障碍患者之间一种重要的交流方式。通过手语识别,可以让患者与正常人进行无障碍的交流。随着深度学习技术的发展,各种手语识别技术也随之发展,但现有的手语识别技术往往无法完成连续识别手语的任务,因此文中提出了一种基于图... 手语是听力障碍患者之间一种重要的交流方式。通过手语识别,可以让患者与正常人进行无障碍的交流。随着深度学习技术的发展,各种手语识别技术也随之发展,但现有的手语识别技术往往无法完成连续识别手语的任务,因此文中提出了一种基于图卷积网络(Graph Convolution Network,GCN)和神经网络的时序类分类(Connectionist Temporal Classification/Attention,CTC/Attention)的连续手语识别方法,分别从空间维度与时间维度提取特征,并将空间注意力机制融入其中,以赋予骨骼点权重,突出有效的空间特征,实现手语的连续识别。该方法可实现连续手语语句翻译的序列对齐和上下文语义建模。首先基于MediaPipe框架采集手语动作骨骼点数据,并基于此搭建中文手语骨骼关键点坐标的数据集,根据骨骼关键点坐标,设计了基于时空图神经网络(Spatio-Temporal Graph Convolutional Networks,ST-GCN)的动态手语词识别方法,然后提出基于GCN和CTC/Attention的编解码器网络,用于实现连续手语语句识别的方法。在数据集有限的情况下,在自建的骨骼点数据集SSLD上对所提出的方法进行评估,实验结果表明,平均连续手语识别字准确率达到94.41%,证明所提模型具有良好的手语识别能力。 展开更多
关键词 连续手语识别 图卷积网络 基于神经网络的时序类分类 MediaPipe框架 骨骼关键点 基于时空图神经网络
在线阅读 下载PDF
多尺度视觉特征提取及跨模态对齐的连续手语识别 被引量:1
5
作者 郭乐铭 薛万利 袁甜甜 《计算机科学与探索》 CSCD 北大核心 2024年第10期2762-2769,共8页
连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方... 连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方法主要包含多尺度视觉特征提取模型和跨模态对齐约束。在多尺度视觉特征提取模型中,并行地融合具备不同扩张因子的瓶颈残差结构,来丰富多尺度时序感受野,用于提取不同时序长度的手语视觉特征,同时采用层级复用设计进一步强化视觉特征表示。在跨模态对齐约束中,采用动态时间规整建模手语视觉特征和文本特征之间的内在联系,其中,文本特征提取由多层感知机和长短期记忆网络协作实现。在具备挑战性的公开数据集RWTH-2014、RWTH-2014T、CSL-Daily上进行实验,结果表明所提方法达到目前具有竞争力的性能。上述实验验证了所提的采用多尺度的方式可以捕捉不同时序长度的手语动作,以及构建跨模态对齐约束的思路是正确且有效的,适用于弱监督条件下的连续手语识别任务。 展开更多
关键词 连续手语识别 多尺度 跨模态对齐约束 视频视觉特征 文本特征
在线阅读 下载PDF
模块化连续手语识别算法及技术综述
6
作者 孟巾凯 彭健钧 +3 位作者 肖智东 郭立 金凯 郑彤 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2428-2441,共14页
手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续... 手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续手语识别仍然面临着冗余帧过多,空间特征提取和时间特征提取网络不平衡,手语语序与文本语序不匹配等诸多问题.因此,研究准确率高、耗时少、场景通用性高的连续手语识别算法成为计算机视觉领域的热点问题之一.本文首先分析单模态和多模态的连续手语识别框架,并重点阐述关键帧提取、特征提取、序列学习3个模块在连续手语识别中的作用,以及模块中所用网络的优势与不足,然后总结连续手语数据集以及识别结果的评价指标,最后阐述连续手语识别算法的难点并展望其未来的发展方向. 展开更多
关键词 关键帧提取 特征提取 序列学习 连续手语识别 综述
在线阅读 下载PDF
基于SRN/HMM的非特定人连续手语识别系统 被引量:9
7
作者 方高林 高文 +2 位作者 陈熙霖 王春立 马继勇 《软件学报》 EI CSCD 北大核心 2002年第11期2169-2175,共7页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精... 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径.实验结果表明,该方法的识别效果比单纯使用HMM要好. 展开更多
关键词 SRN HMM 非特定人连续手语识别系统 神经网络 精简循环网络 隐马可夫规模 连续手语识别 计算机 模式识别
在线阅读 下载PDF
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究 被引量:7
8
作者 王守觉 潘晓霞 +3 位作者 徐春燕 陈旭 安冬 曹文明 《电子学报》 EI CAS CSCD 北大核心 2005年第10期1790-1793,共4页
本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态... 本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态搜索,得到被识别语音到各类高维空间覆盖范围的距离随时间变化曲线,通过距离曲线上的极小值点进行识别. 展开更多
关键词 连续语音识别 高维空间点覆盖 非特定人语音识别
在线阅读 下载PDF
基于CNN和BLSTM的连续手语识别 被引量:7
9
作者 张淑军 王帅 李辉 《重庆理工大学学报(自然科学)》 CAS 北大核心 2022年第4期177-186,共10页
相对孤立词识别,连续手语识别对上下文的时间依赖性更强、语义更加复杂且时序分割困难,目前的研究在识别精度、背景抗干扰性和抗过拟合能力等方面仍存在不足。为此,提出一种基于CNN和BLSTM的连续手语识别方法,通过自适应视频采样,对输... 相对孤立词识别,连续手语识别对上下文的时间依赖性更强、语义更加复杂且时序分割困难,目前的研究在识别精度、背景抗干扰性和抗过拟合能力等方面仍存在不足。为此,提出一种基于CNN和BLSTM的连续手语识别方法,通过自适应视频采样,对输入视频数据进行预处理,去除无关背景的干扰;在CNN空间特征提取的基础上,利用BLSTM双向语义依赖挖掘能力,对连续手语视频进行时序建模,构建CTC损失函数解决时间序列标签对齐问题。该算法在CSL和ConGD数据集上分别取得了98.4%和62.5%的平均识别率。 展开更多
关键词 深度学习 连续手语识别 CNN BLSTM CTC
在线阅读 下载PDF
基于归一化算法的噪音鲁棒性连续语音识别 被引量:5
10
作者 刘妍秀 孙一鸣 杨华民 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第3期519-524,共6页
针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到... 针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到较好的识别结果. 展开更多
关键词 归一化 噪音鲁棒性 连续语音识别
在线阅读 下载PDF
连续语音识别中基于Dropout修正线性深度置信网络的声学模型 被引量:4
11
作者 陈雷 杨俊安 +1 位作者 王龙 李晋徽 《声学技术》 CSCD 北大核心 2016年第2期146-154,共9页
大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函... 大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 深度置信网络 修正线性 过拟合 DROPOUT
在线阅读 下载PDF
基于瓶颈特征的藏语拉萨话连续语音识别研究 被引量:9
12
作者 周楠 赵悦 +3 位作者 李要嫱 徐晓娜 才旺拉姆 吴立成 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征... 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。 展开更多
关键词 藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络
在线阅读 下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
13
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 HTK工具 声学模型
在线阅读 下载PDF
基于3维空间Viterbi算法的汉语连续语音识别方法 被引量:5
14
作者 赵力 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页
本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位... 本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . 展开更多
关键词 汉语连续语音识别 三维空间 VITERBI算法
在线阅读 下载PDF
汉语连续语音识别中上下文相关的识别单元(三音子)的研究 被引量:4
15
作者 赵庆卫 王作英 陆大 《电子学报》 EI CAS CSCD 北大核心 1999年第6期79-82,117,共5页
本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提... 本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提出了基于决策树的聚类方法,它的主要优点是充分利用了语音学知识,聚类后得到的模型可推广性好,尤其适用于集外语料中出现大量的未在训练语料中出现的三音子单元的情况.接着介绍了模型聚类和训练的实验步骤最后,非特定人大词汇量连续语音识别的实验表明,基于决策树的聚类方法所得到的识别单元,当识别集外语料时使系统的误识率降低了7.95%,而基于合并的聚类方法所得到的识别单元只降低了2.63%. 展开更多
关键词 连续语音识别 上下文相关 决策树 聚类算法
在线阅读 下载PDF
基于Facet模型梯度算子一致性的地震数据不连续性识别方法 被引量:1
16
作者 刘海燕 刘财 +1 位作者 王典 刘洋 《吉林大学学报(地球科学版)》 EI CAS CSCD 北大核心 2017年第4期1286-1294,共9页
存在断层、角度不整合面等不连续结构的地质体的自动识别在地震构造解释中具有重要的意义,这些地质特征的地震响应为同相轴不连续。常规的地震数据不连续性识别方法应用范围有限,参数设置依赖于人为经验,易导致识别结果辨识度差。本文... 存在断层、角度不整合面等不连续结构的地质体的自动识别在地震构造解释中具有重要的意义,这些地质特征的地震响应为同相轴不连续。常规的地震数据不连续性识别方法应用范围有限,参数设置依赖于人为经验,易导致识别结果辨识度差。本文将一致性作为新的不连续性识别方法引入到地震数据处理中。首先利用定位精度高、易于扩展的Facet模型梯度算子计算一致性,其次对一致性数据作阈值化处理,最后利用数学形态学中的腐蚀、膨胀及细化算法作进一步处理,实现了对地震数据不连续性信息的自动识别。经过理论和实际资料测试,并与C3相干算法和方差算法对比分析,证实了本文所提方法在地震数据不连续性识别方面具有更高的稳定性和辨识度,可以作为地层不连续性识别的有力工具。 展开更多
关键词 一致性 Facet模型梯度算子 连续识别 地震数据
在线阅读 下载PDF
汉语连续语音识别中经典HMM的实验评测 被引量:6
17
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率... 定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 展开更多
关键词 汉语连续语音识别 经典HMM模型 THEESP系统 语音信号处理
在线阅读 下载PDF
基于改进Transformer的连续手语识别方法 被引量:4
18
作者 王帅 张淑军 +1 位作者 叶康 郭淇 《计算机科学》 CSCD 北大核心 2022年第S02期573-578,共6页
连续手语识别是一项具有挑战性的任务,当前大多数模型忽略了对长序列的整体建模能力,导致对较长手语视频的识别和翻译准确率较低。Transformer模型独特的编解码结构可用于手语识别,但其位置编码方式以及多头自注意力机制仍有待改善。因... 连续手语识别是一项具有挑战性的任务,当前大多数模型忽略了对长序列的整体建模能力,导致对较长手语视频的识别和翻译准确率较低。Transformer模型独特的编解码结构可用于手语识别,但其位置编码方式以及多头自注意力机制仍有待改善。因此,文中提出了一种基于改进Transformer模型的连续手语识别方法,通过多处复用的带参数位置编码对连续手语句子中的每个词向量进行多次循环计算,准确掌握各个词之间的位置信息;在注意力模块中添加可学习的记忆键值对形成持久记忆模块,通过线性高维映射等比例扩大注意力头数与嵌入维度,最大程度地发挥Transformer模型的多头注意力机制对较长手语序列的整体建模能力,深入挖掘视频内部各帧中的关键信息。所提方法在最具权威的连续手语数据集PHOENIX-Weather2014和PHOENIX-Weather2014-T上取得了有竞争力的识别结果。 展开更多
关键词 连续手语识别 TRANSFORMER 多头注意力 位置编码
在线阅读 下载PDF
低资源少样本连续语音识别最新进展 被引量:5
19
作者 屈丹 杨绪魁 +2 位作者 闫红刚 陈雅淇 牛铜 《郑州大学学报(工学版)》 CAS 北大核心 2023年第4期1-9,共9页
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的... 低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的基础上,重点阐述了生成对抗网络、自监督表示学习、深度强化学习和元学习等高级深度学习技术在解决少样本语音识别方面的最新发展,如FGSM、wav2vec、AMS等代表性方法。在此基础上,分析了目前该技术面临的互补有限、数据和任务不均衡与模型轻量化部署问题。最后,对低资源少样本连续语音识别进行了总结,提出未来少样本训练识别的研究方向可以朝着先验信息引入、假设空间约束条件设定等方向进一步研究。 展开更多
关键词 低资源少样本 连续语音识别 生成对抗网络 自监督表示学习 深度强化学习 元学习
在线阅读 下载PDF
大词汇量连续语音识别中搜索空间的表示及相关搜索方法的研究进展 被引量:2
20
作者 杨凤芹 孙吉贵 +1 位作者 张长胜 张长海 《计算机科学》 CSCD 北大核心 2008年第2期191-195,共5页
本文综述了近年来大词汇量连续语音识别中搜索空间的表示及相关搜索方法的研究进展,分析了搜索空间的表示及相关搜索方法对语音识别性能产生的影响,并对本领域的研究中存在的问题和未来的发展动向进行了讨论。
关键词 大词汇量连续语音识别 搜索空间 搜索 声学模型 语言模型
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部