期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
SignBot:一种基于轻量深度神经网络的人形手语机器人
1
作者 李新潮 袁野 刘娜 《小型微型计算机系统》 北大核心 2025年第9期2193-2200,共8页
人形机器人凭借高度逼真的人类外观与灵活稳定的运动能力,能够深度参与到人类社会活动场景;人机交互是人形机器人进入现实世界,成为人们生活、学习和工作中的伴侣的必要能力.然而,现有机器人交互技术主要面向正常人群,缺乏适用于听力或... 人形机器人凭借高度逼真的人类外观与灵活稳定的运动能力,能够深度参与到人类社会活动场景;人机交互是人形机器人进入现实世界,成为人们生活、学习和工作中的伴侣的必要能力.然而,现有机器人交互技术主要面向正常人群,缺乏适用于听力或者语言障碍人士的人机交互方案.为此,设计了一种轻量级的手语识别深度网络(SignNet),该模型能够快速集成到机器人硬件平台,使其具备手语识别能力.此外,本文将手语识别模型与现有表情控制算法、语音合成算法联合,使机器人能够识别手语,并通过表情和语音反馈进行交互.实验结果表明,SignNet在多个手语数据集(WLASL、CSL、SLR500)上识别准确率最高达到98.2%,进一步测试显示,该机器人能精准识别手语并提供适当反馈,为听力或语言障碍人士提供了有效的人机交互途径. 展开更多
关键词 人形机器人 人机交互 轻量级网络 手语识别
在线阅读 下载PDF
基于图卷积网络和CTC/Attention的连续手语识别
2
作者 边辉 孟畅乾 +2 位作者 李子涵 陈子豪 谢雪雷 《计算机科学》 北大核心 2025年第S1期550-558,共9页
手语是听力障碍患者之间一种重要的交流方式。通过手语识别,可以让患者与正常人进行无障碍的交流。随着深度学习技术的发展,各种手语识别技术也随之发展,但现有的手语识别技术往往无法完成连续识别手语的任务,因此文中提出了一种基于图... 手语是听力障碍患者之间一种重要的交流方式。通过手语识别,可以让患者与正常人进行无障碍的交流。随着深度学习技术的发展,各种手语识别技术也随之发展,但现有的手语识别技术往往无法完成连续识别手语的任务,因此文中提出了一种基于图卷积网络(Graph Convolution Network,GCN)和神经网络的时序类分类(Connectionist Temporal Classification/Attention,CTC/Attention)的连续手语识别方法,分别从空间维度与时间维度提取特征,并将空间注意力机制融入其中,以赋予骨骼点权重,突出有效的空间特征,实现手语的连续识别。该方法可实现连续手语语句翻译的序列对齐和上下文语义建模。首先基于MediaPipe框架采集手语动作骨骼点数据,并基于此搭建中文手语骨骼关键点坐标的数据集,根据骨骼关键点坐标,设计了基于时空图神经网络(Spatio-Temporal Graph Convolutional Networks,ST-GCN)的动态手语词识别方法,然后提出基于GCN和CTC/Attention的编解码器网络,用于实现连续手语语句识别的方法。在数据集有限的情况下,在自建的骨骼点数据集SSLD上对所提出的方法进行评估,实验结果表明,平均连续手语识别字准确率达到94.41%,证明所提模型具有良好的手语识别能力。 展开更多
关键词 连续手语识别 图卷积网络 基于神经网络的时序类分类 MediaPipe框架 骨骼关键点 基于时空图神经网络
在线阅读 下载PDF
基于CGR_ATT算法的可穿戴设备手语识别研究
3
作者 武东辉 王金凤 +1 位作者 仇森 刘国志 《传感器与微系统》 北大核心 2025年第2期21-25,30,共6页
近年来,基于传感器手语识别研究受到广泛关注,而传统的手语分析方法很大程度上依赖于专家经验和信号处理技术的先验知识。为此,本文提出一种CGR_ATT模型自动提取手语特征。首先,构建卷积神经网络(CNN)作为特征提取器通过多层卷积堆叠和... 近年来,基于传感器手语识别研究受到广泛关注,而传统的手语分析方法很大程度上依赖于专家经验和信号处理技术的先验知识。为此,本文提出一种CGR_ATT模型自动提取手语特征。首先,构建卷积神经网络(CNN)作为特征提取器通过多层卷积堆叠和池化操作,从传感器数据中提取空间特征,无需先验知识即可从数据中识别并提取关键的空间信息;其次,通过门控循环单元(GRU)构建时序建模器,捕捉和处理空间信息在时间维度上的变化,利用门控机制处理传感器数据中的时序关系;最后,通过ATT模块给序列中的每个元素分配不同权重,进一步处理GRU输出的时序特征。所提模型较CLA_net、CLT_net、长短期记忆(LSTM)、GRU模型具有较高的预测精度,预测精度达到96.98%。 展开更多
关键词 手语识别系统 CGR_ATT模型 深度学习 可穿戴设备
在线阅读 下载PDF
基于EWBiLSTM-ATT的数据手套手语识别
4
作者 武东辉 王金凤 +1 位作者 仇森 刘国志 《计算机工程》 北大核心 2025年第8期107-119,共13页
手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长和计算成本高的问题。为此,基于穿戴式数据手套提出一种融合注意力机制的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法——E... 手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长和计算成本高的问题。为此,基于穿戴式数据手套提出一种融合注意力机制的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法——EWBiLSTM-ATT模型。首先通过加宽首层卷积层来减少模型参数量,提升计算速度,通过扩展WDCNN卷积层深度来提高模型自动提取手语特征的能力;其次引入BiLSTM作为时间建模器捕捉手语序列数据的时间动态信息,有效处理传感器数据中的时序关系;最后利用注意力机制通过映射加权和学习参数矩阵赋予BiLSTM隐含状态不同权重,通过计算每个时间段的注意力权重,模型自动选择与手势动作相关的关键时间段。以STM32F103为主控模块,以MPU6050与Flex Sensor 4.5传感器为核心搭建数据手套手语采集平台。选取16种动态手语动作用于构建GR-Dataset数据训练模型。同一实验条件下,EWBiLSTM-ATT准确率为99.40%,相对于CLT-net、CNN-GRU、CLA-net、CNN-GRU-ATT模型分别提升10.36、8.41、3.87、3.05百分点,训练总时间分别缩减至这4种对比模型的57%、61%、55%、56%。 展开更多
关键词 扩展深度卷积神经网络 双向长短期记忆网络 注意力模块 手语识别 数据手套 深度学习
在线阅读 下载PDF
改进YOLOv7-tiny的手语识别算法研究 被引量:3
5
作者 韩晓冰 胡其胜 +1 位作者 赵小飞 秋强 《现代电子技术》 北大核心 2024年第1期55-61,共7页
在与听障人士进行交流时,常常会面临交流不便的困难,文中提出一种手语识别的改进模型来解决这个困难。该模型基于YOLOv7-tiny网络模型,并对其进行了多项改进,旨在提高模型的精度和速度。首先,通过对CBAM注意力机制的通道域进行改进,解... 在与听障人士进行交流时,常常会面临交流不便的困难,文中提出一种手语识别的改进模型来解决这个困难。该模型基于YOLOv7-tiny网络模型,并对其进行了多项改进,旨在提高模型的精度和速度。首先,通过对CBAM注意力机制的通道域进行改进,解决了因降维而造成的通道信息缺失问题,并将改进后的CBAM加入到YOLOv7-tiny的Neck层中,从而使模型更加精准地定位和识别到关键的目标;其次,将传统的CIoU边界框损失函数替换为SIoU边界框损失函数,以加速边界框回归的同时提高定位准确度;此外,为了减少计算量并加快检测速度,还将颈部层中的普通卷积模块替换为Ghost卷积模块。经过实验测试,改进后网络模型的平均精度均值(mAP)、精准率和召回率分别提升了5.31%、6.53%、2.73%,有效地提高了手语识别网络的检测精确度。 展开更多
关键词 手语识别 YOLOv7-tiny Ghost卷积 注意力机制 SIoU 边界框
在线阅读 下载PDF
多尺度视觉特征提取及跨模态对齐的连续手语识别 被引量:1
6
作者 郭乐铭 薛万利 袁甜甜 《计算机科学与探索》 CSCD 北大核心 2024年第10期2762-2769,共8页
连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方... 连续手语识别研究中,视觉特征的有效表示是提升识别效果的关键。然而,手语动作时序长度的差异性及手语弱标注现象,使得有效的视觉特征提取更加困难。针对上述问题,提出了多尺度视觉特征提取及跨模态对齐的连续手语识别方法(MECA)。该方法主要包含多尺度视觉特征提取模型和跨模态对齐约束。在多尺度视觉特征提取模型中,并行地融合具备不同扩张因子的瓶颈残差结构,来丰富多尺度时序感受野,用于提取不同时序长度的手语视觉特征,同时采用层级复用设计进一步强化视觉特征表示。在跨模态对齐约束中,采用动态时间规整建模手语视觉特征和文本特征之间的内在联系,其中,文本特征提取由多层感知机和长短期记忆网络协作实现。在具备挑战性的公开数据集RWTH-2014、RWTH-2014T、CSL-Daily上进行实验,结果表明所提方法达到目前具有竞争力的性能。上述实验验证了所提的采用多尺度的方式可以捕捉不同时序长度的手语动作,以及构建跨模态对齐约束的思路是正确且有效的,适用于弱监督条件下的连续手语识别任务。 展开更多
关键词 连续手语识别 多尺度 跨模态对齐约束 视频视觉特征 文本特征
在线阅读 下载PDF
模块化连续手语识别算法及技术综述
7
作者 孟巾凯 彭健钧 +3 位作者 肖智东 郭立 金凯 郑彤 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2428-2441,共14页
手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续... 手语是听障人士和其他人之间重要的沟通方式,但许多普通人看不懂手语,导致听障人士和普通人交流障碍.随着深度学习网络在连续手语识别方向的应用,算法大模型为复杂难懂的连续手语动作翻译成通俗易懂的文本语句提供了技术基础.但是连续手语识别仍然面临着冗余帧过多,空间特征提取和时间特征提取网络不平衡,手语语序与文本语序不匹配等诸多问题.因此,研究准确率高、耗时少、场景通用性高的连续手语识别算法成为计算机视觉领域的热点问题之一.本文首先分析单模态和多模态的连续手语识别框架,并重点阐述关键帧提取、特征提取、序列学习3个模块在连续手语识别中的作用,以及模块中所用网络的优势与不足,然后总结连续手语数据集以及识别结果的评价指标,最后阐述连续手语识别算法的难点并展望其未来的发展方向. 展开更多
关键词 关键帧提取 特征提取 序列学习 连续手语识别 综述
在线阅读 下载PDF
非特定人手语数据生成及其有效性检测 被引量:6
8
作者 倪训博 赵德斌 +2 位作者 高文 姜峰 姚鸿勋 《软件学报》 EI CSCD 北大核心 2010年第5期1153-1170,共18页
根据手势手语的特点,提出了手语语言学和人体运动学相结合的非特定人手语数据的生成和检测方法.首先,Mean-Shift算法有控制生成强度的优点,将改进的Mean-Shift算法应用于手形数据通道的生成,以保持手势手语的语言学特性,并应用关键手形... 根据手势手语的特点,提出了手语语言学和人体运动学相结合的非特定人手语数据的生成和检测方法.首先,Mean-Shift算法有控制生成强度的优点,将改进的Mean-Shift算法应用于手形数据通道的生成,以保持手势手语的语言学特性,并应用关键手形的音韵标记进行数据有效性的检测;其次,为了丰富手语手势动作的运动特性,将改进的遗传算法应用于与运动相关的数据通道进行数据生成,并应用拉班舞谱对其进行数据有效性检测;最后,提出了基于原始样本的检测实验框架,使得所提出的检测方法适用于语言类的多类别数据检测问题.实验结果表明,所提出的非特定人手语数据的生成和检测方法是有效的. 展开更多
关键词 手语识别 音韵标记 拉班舞谱 手语语言学 人体运动学 MEAN-SHIFT算法 遗传算法
在线阅读 下载PDF
基于SRN/HMM的非特定人连续手语识别系统 被引量:9
9
作者 方高林 高文 +2 位作者 陈熙霖 王春立 马继勇 《软件学报》 EI CSCD 北大核心 2002年第11期2169-2175,共7页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精... 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音.目前最新发展水平的手语识别系统在实际应用中应解决非特定人连续手语问题.提出一种将连续手语识别分解成各孤立词识别的分治方法,用于非特定人连续手语识别.把精简循环网(simple recurrent network,简称SRN)作为连续手语的段边界检测器,把SRN分段结果作为隐马可夫模型(hidden Markov models,简称HMM)框架中的状态输入,在HMM框架里使用网格Viterbi算法搜索出一条最佳手语词路径.实验结果表明,该方法的识别效果比单纯使用HMM要好. 展开更多
关键词 SRN HMM 非特定人连续手语识别系统 神经网络 精简循环网络 隐马可夫规模 连续手语识别 计算机 模式识别
在线阅读 下载PDF
手语识别、翻译与生成综述 被引量:12
10
作者 郭丹 唐申庚 +1 位作者 洪日昌 汪萌 《计算机科学》 CSCD 北大核心 2021年第3期60-70,共11页
手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语... 手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语或文本语句合成手语视频。换言之,手语识别翻译与手语生成可视为互逆过程。文中综述了手语研究的最新进展,介绍了研究的背景现状和面临的挑战;回顾了手语识别、翻译和生成任务的典型方法和前沿研究;并结合当前方法中存在的问题,对手语研究的未来发展方向进行了展望。 展开更多
关键词 视频理解 机器翻译 离散手语识别 连续手语翻译 手语视频生成
在线阅读 下载PDF
基于词根的中国手语识别方法 被引量:5
11
作者 王春立 高文 +1 位作者 马继勇 高秀娟 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期150-156,共7页
迄今为止 ,手语识别面临的最大问题是如何解决词汇集易扩充的连续识别 提出一种大词汇量连续中国手语识别方法 ,将词根作为识别基元 ,由于基元的数目是有限的 ,因此基于HMM的手语信号的训练和识别变得比较容易处理 ,可以实现更大词汇... 迄今为止 ,手语识别面临的最大问题是如何解决词汇集易扩充的连续识别 提出一种大词汇量连续中国手语识别方法 ,将词根作为识别基元 ,由于基元的数目是有限的 ,因此基于HMM的手语信号的训练和识别变得比较容易处理 ,可以实现更大词汇量的识别 除此之外 ,所提方法还有利于实现手势语和手指语的混合识别 从中国手语中共整理出2 4 0 0多个词根 ,为每个词根建一个并行的HMM模型 ,对各数据流的HMM模型进行聚类 ,确定出手语识别的基元 根据这些基元对手势词编码 ,并建立了树状搜索网格 ,使用状态结点上高斯密度函数聚类、语言模型和N Best方法提高系统的速度和精度 对 5 119个手语词做了实验 ,连续语句的识别率可在 90 展开更多
关键词 词根 中国手语识别方法 HMM模型 图像处理 快速匹配算法 计算机 手语自动翻译系统
在线阅读 下载PDF
面向中等词汇量的中国手语视觉识别系统 被引量:11
12
作者 张良国 高文 +2 位作者 陈熙霖 陈益强 王春立 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期476-482,共7页
手语识别的研究和实现具有重要的学术价值和广泛的应用前景.提出了基于混合元捆绑的隐马尔可夫模型(TMHMM)用于视觉手语识别.TMHMM的模型刻画精度接近于连续隐马尔可夫模型,因此能保证最终的识别率不会明显降低,同时通过混合元捆绑降低... 手语识别的研究和实现具有重要的学术价值和广泛的应用前景.提出了基于混合元捆绑的隐马尔可夫模型(TMHMM)用于视觉手语识别.TMHMM的模型刻画精度接近于连续隐马尔可夫模型,因此能保证最终的识别率不会明显降低,同时通过混合元捆绑降低计算成本,有效地提高识别速度.在特征提取方面,提出的层次型特征描述方案更加适合于中等或更大词汇量的手语识别.在此基础上,通过集成鲁棒的双手检测、背景去除和瞳孔检测等技术,实现了一个面向中等词汇量的中国手语视觉识别系统.实验结果表明,提出的方法能较好地实现常规背景中的中等词汇量的手语识别. 展开更多
关键词 手语识别 隐马尔可夫模型 人机交互 计算机视觉
在线阅读 下载PDF
大规模连续中国手语数据集的创建与分析 被引量:9
13
作者 袁甜甜 赵伟 +1 位作者 杨学 胡彬 《计算机工程与应用》 CSCD 北大核心 2019年第11期110-116,共7页
绝大多数健听人不懂手语导致听障人在找工作、就医、法律咨询等各生活、工作领域中遇到了极大的沟通障碍,而手语翻译员需要提前预约,成本也非常高,所以很多科研工作者都开始利用机器学习来开发手语自动翻译器,但其中的大部分研究都因为... 绝大多数健听人不懂手语导致听障人在找工作、就医、法律咨询等各生活、工作领域中遇到了极大的沟通障碍,而手语翻译员需要提前预约,成本也非常高,所以很多科研工作者都开始利用机器学习来开发手语自动翻译器,但其中的大部分研究都因为受到了数据集规模和质量的影响而效果不佳。为解决上述矛盾和问题,创建了目前全球最大的中国连续手语数据集,并使用了考虑身体关节的位置、面部表情及手指关节的端到端的深度学习模型进行有效训练。结论突显了现代深度学习技术在识别复杂手语方面的巨大优势,针对较小子集的BLEU-4已达到30.8。 展开更多
关键词 手语识别 深度学习 数据集 特征提取 端到端
在线阅读 下载PDF
基于ANN/HMM的中国手语识别系统 被引量:11
14
作者 吴江琴 高文 +1 位作者 陈熙霖 刘伟 《计算机工程与应用》 CSCD 北大核心 1999年第9期1-4,35,共5页
手语是聋哑人使用的语言。它是由手形动作辅之以表倩姿势为符号构成的比较稳定的表达系统,是一种靠动作/视觉交际的特殊的语言。一方面,手语识别可以作为健全人与聋哑人之间的翻译,为聋哑人提供更好的服务;另一方面,作为人体语言... 手语是聋哑人使用的语言。它是由手形动作辅之以表倩姿势为符号构成的比较稳定的表达系统,是一种靠动作/视觉交际的特殊的语言。一方面,手语识别可以作为健全人与聋哑人之间的翻译,为聋哑人提供更好的服务;另一方面,作为人体语言理解的一部分,手语识别可作为人机交互的一种手段。该文实现了基于ANN/HMM的手语识别系统,采用ANN方法建立了关于手形、位置、方向的特征映射器,并在建立手形特征映射器的过程中,给出了多特征多分类器融合算法。实验证明,基于ANN/HMM的手语识别系统是可行及实用的。 展开更多
关键词 手语识别 特征映射器 ANN/HMM 语言信息处理
在线阅读 下载PDF
非特定人手语识别问题中的合成数据驱动方法 被引量:5
15
作者 姜峰 高文 +2 位作者 姚鸿勋 赵德斌 陈熙霖 《计算机研究与发展》 EI CSCD 北大核心 2007年第5期873-881,共9页
针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可... 针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可能包含非特定人的信息及其有效性,对数据所实现的变形不会被识别系统的初始化过程逆转.合成数据驱动的效果受模型的容量、合成的强度与方向影响.在多种实验环境下对驱动效果进行评估,识别率有所提高,在某些例子中提高明显. 展开更多
关键词 合成数据 手语识别 训练 mean—shift算法 非特定人 识别率
在线阅读 下载PDF
基于SOFM/HMM模型的非特定人手语识别系统 被引量:4
16
作者 方高林 高文 +1 位作者 王春立 陈益强 《计算机学报》 EI CSCD 北大核心 2002年第1期16-21,共6页
手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数... 手语识别是通过计算机提供一种有效而准确的机制将手语翻译成文本或语音 .目前最新发展水平的手语识别系统在实际应用中应该解决非特定人手语识别问题 .该文在分析非特定人手语识别特点——数据多且差异大、模型训练难收敛、对不同人数据的特征提取需求更迫切——的基础上 ,提出了 SOFM/ HMM模型 ,将自组织特征映射 (SOFM)很强的特征提取功能和隐马可夫模型 (HMM)良好的处理时间序列属性结合在一个新颖的框架下 ,并把该模型应用到非特定人中国手语识别中 .实验结果表明 ,SOFM/ HMM模型手语识别率比传统的 HMM模型提高近 5 % . 展开更多
关键词 自组织特征映射 隐马可夫模型 EM算法 非特定人手语识别系统 SOFM模型 HMM模型 计算机
在线阅读 下载PDF
手语词识别的影响因素探讨——手语词的两个网络系统及其交互作用 被引量:5
17
作者 陈穗清 张积家 +1 位作者 李艳霞 张惠霞 《心理学报》 CSSCI CSCD 北大核心 2015年第7期878-889,共12页
采用真假词判断任务考察影响手语词识别的因素,探讨词汇网络系统和语义网络系统的变量在手语词识别中的作用及其交互作用。结果表明,在手语词识别中,既存在着熟悉性效应、复杂度效应、象似性效应和具体性效应,又存在着熟悉性与象似性、... 采用真假词判断任务考察影响手语词识别的因素,探讨词汇网络系统和语义网络系统的变量在手语词识别中的作用及其交互作用。结果表明,在手语词识别中,既存在着熟悉性效应、复杂度效应、象似性效应和具体性效应,又存在着熟悉性与象似性、具体性的交互作用。这表明,手语词识别既涉及词汇网络系统的变量,又涉及语义网络系统的变量,既包含着由"形"至义的数据驱动加工,又包含着由义至"形"的概念驱动加工。手语词识别与书面语词识别具有共性。研究还表明,形象性影响聋人对手语词的识别。 展开更多
关键词 手语 词汇识别 词汇网络 语义网络
在线阅读 下载PDF
一种基于DTW/ISODATA算法的多层分类器手语识别方法 被引量:7
18
作者 姚桂林 姚鸿勋 姜峰 《计算机工程与应用》 CSCD 北大核心 2005年第8期45-47,200,共4页
为提高大词汇量手语识别速度,论文提出了一种将动态时间规整(DTW)和隐马尔可夫模型(HMM)相结合的多层次的大词汇量手语识别方法。该方法思想是先进行全局粗略搜索,将要识别的手势词归入某一组范围较小的词表中,然后通过更加精确的HMM局... 为提高大词汇量手语识别速度,论文提出了一种将动态时间规整(DTW)和隐马尔可夫模型(HMM)相结合的多层次的大词汇量手语识别方法。该方法思想是先进行全局粗略搜索,将要识别的手势词归入某一组范围较小的词表中,然后通过更加精确的HMM局部搜索将词识别出来。各个词汇表用DTW/ISODATA算法来产生。对4942个孤立手语词作了实验,结果表明,相对于仅用HMM单层识别而言,识别速度从原来每个词的2.364秒提高到0.137秒,提高了94.2%,识别准确率也提高了4.66%。 展开更多
关键词 手语识别 DTW/ISODATA 多层结构
在线阅读 下载PDF
HMM方法在手语识别中的应用 被引量:5
19
作者 吴江琴 高文 宋益波 《计算机工程与科学》 CSCD 1999年第3期40-44,共5页
HMM在语音识别中已得到广泛应用。近年来,HMM方法在手语识别领域越来越受到关注。本文综述了HMM方法在该领域应用的情况,并结合中国手语及其具体特点,对HMM方法在手语识别领域中的应用前景进行了展望。
关键词 隐马尔柯夫模型 手语识别 HMM 语音识别
在线阅读 下载PDF
基于CNN和BLSTM的连续手语识别 被引量:7
20
作者 张淑军 王帅 李辉 《重庆理工大学学报(自然科学)》 CAS 北大核心 2022年第4期177-186,共10页
相对孤立词识别,连续手语识别对上下文的时间依赖性更强、语义更加复杂且时序分割困难,目前的研究在识别精度、背景抗干扰性和抗过拟合能力等方面仍存在不足。为此,提出一种基于CNN和BLSTM的连续手语识别方法,通过自适应视频采样,对输... 相对孤立词识别,连续手语识别对上下文的时间依赖性更强、语义更加复杂且时序分割困难,目前的研究在识别精度、背景抗干扰性和抗过拟合能力等方面仍存在不足。为此,提出一种基于CNN和BLSTM的连续手语识别方法,通过自适应视频采样,对输入视频数据进行预处理,去除无关背景的干扰;在CNN空间特征提取的基础上,利用BLSTM双向语义依赖挖掘能力,对连续手语视频进行时序建模,构建CTC损失函数解决时间序列标签对齐问题。该算法在CSL和ConGD数据集上分别取得了98.4%和62.5%的平均识别率。 展开更多
关键词 深度学习 连续手语识别 CNN BLSTM CTC
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部