期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
采用非对称唇形轮廓模型提高汉语唇形识别效果 被引量:5
1
作者 李刚 王蒙军 林凌 《光学精密工程》 EI CAS CSCD 北大核心 2006年第3期473-477,共5页
通过分析人脸正面和侧面图像的特点,建立起一种新的唇形轮廓描述模型,能够提取出嘴唇的突出度信息,同时通过计算部分参数对时间的导数,来获得唇形轮廓的动态信息。通过对小词库试验,对比单纯采用正面图像轮廓的描述方法,该方法能够将识... 通过分析人脸正面和侧面图像的特点,建立起一种新的唇形轮廓描述模型,能够提取出嘴唇的突出度信息,同时通过计算部分参数对时间的导数,来获得唇形轮廓的动态信息。通过对小词库试验,对比单纯采用正面图像轮廓的描述方法,该方法能够将识别效果平均提高25%以上,克服了以往对唇形轮廓提取时,通常都采用人脸的正面图像,不能反映出嘴唇的突出度信息的局限。 展开更多
关键词 唇形轮廓 对称模型 非对称模型 差分特征
在线阅读 下载PDF
视觉驱动的语音合成系统中唇形轮廓的正交变换描述 被引量:3
2
作者 李刚 王蒙军 +1 位作者 林凌 曾锐利 《光学精密工程》 EI CAS CSCD 北大核心 2007年第7期1117-1123,共7页
为了能够自动而且快速地获取唇读系统中所必需的唇形轮廓特征,提出了将正交压缩变换的方法用于唇形轮廓的特征提取,并对得到的唇形轮廓曲线进行了分析研究。通过离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里... 为了能够自动而且快速地获取唇读系统中所必需的唇形轮廓特征,提出了将正交压缩变换的方法用于唇形轮廓的特征提取,并对得到的唇形轮廓曲线进行了分析研究。通过离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里叶描述子和离散余弦变换描述子,然后将两类描述子作为唇形轮廓的特征向量,采用隐马尔可夫模型(HMM)进行学习和识别。基于独立汉字发音的实验表明:在达到40%的识别率时,刻画唇形轮廓特征所需的离散余弦变换描述子数目为15个,傅里叶描述子数目为20个。在相同的识别效果时,刻画唇形轮廓特征所需的离散余弦变换描述子数目少于傅里叶描述子,可减少数据运算量和运算所需时间。 展开更多
关键词 非对称模型 唇形轮廓 边缘特征 傅里叶描述子 离散余弦变换描述子 隐马尔可夫模型(HMM)
在线阅读 下载PDF
面向残疾人的汉语可视语音数据库 被引量:3
3
作者 李刚 王蒙军 林凌 《中国生物医学工程学报》 CAS CSCD 北大核心 2007年第3期355-360,388,共7页
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特... 将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。 展开更多
关键词 唇读技术 康复工程 可视语音数据库 非对称唇形轮廓模型 隐马尔可夫模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部