期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
视觉驱动的语音合成系统中唇形轮廓的傅里叶描述
被引量:
1
1
作者
李刚
王蒙军
林凌
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2007年第8期1464-1468,共5页
为了能够自动、快速地表示唇读系统中所必须的唇形轮廓特征,将傅里叶描述子用于唇形轮廓的描述和识别过程中,采用边界傅里叶变换的方法,得到非对称唇形模型中唇形轮廓的傅里叶描述子,用来刻画唇动过程中唇形轮廓的形状信息,并将傅里叶...
为了能够自动、快速地表示唇读系统中所必须的唇形轮廓特征,将傅里叶描述子用于唇形轮廓的描述和识别过程中,采用边界傅里叶变换的方法,得到非对称唇形模型中唇形轮廓的傅里叶描述子,用来刻画唇动过程中唇形轮廓的形状信息,并将傅里叶描述子φ作为唇形轮廓的特征向量,应用于基于隐马尔可夫模型(HMM)的视觉驱动语音合成系统。基于独立汉字发音的实验表明,单纯采用前15或20个傅里叶描述子就能够有效地刻画唇形轮廓描述,达到唇形识别的目的。
展开更多
关键词
非对称唇形轮廓模型
运动检测
数学形态学
傅里叶描述子
隐马尔可夫
模型
在线阅读
下载PDF
职称材料
面向残疾人的汉语可视语音数据库
被引量:
3
2
作者
李刚
王蒙军
林凌
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007年第3期355-360,388,共7页
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特...
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。
展开更多
关键词
唇读技术
康复工程
可视语音数据库
非对称唇形轮廓模型
隐马尔可夫
模型
在线阅读
下载PDF
职称材料
题名
视觉驱动的语音合成系统中唇形轮廓的傅里叶描述
被引量:
1
1
作者
李刚
王蒙军
林凌
机构
天津大学精密仪器与光电子工程学院
出处
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2007年第8期1464-1468,共5页
文摘
为了能够自动、快速地表示唇读系统中所必须的唇形轮廓特征,将傅里叶描述子用于唇形轮廓的描述和识别过程中,采用边界傅里叶变换的方法,得到非对称唇形模型中唇形轮廓的傅里叶描述子,用来刻画唇动过程中唇形轮廓的形状信息,并将傅里叶描述子φ作为唇形轮廓的特征向量,应用于基于隐马尔可夫模型(HMM)的视觉驱动语音合成系统。基于独立汉字发音的实验表明,单纯采用前15或20个傅里叶描述子就能够有效地刻画唇形轮廓描述,达到唇形识别的目的。
关键词
非对称唇形轮廓模型
运动检测
数学形态学
傅里叶描述子
隐马尔可夫
模型
Keywords
unsymmetrical lip contour model
movement detection
morphological processing
Fourier descriptor
hidden Markov model (HMM)
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向残疾人的汉语可视语音数据库
被引量:
3
2
作者
李刚
王蒙军
林凌
机构
天津大学精密测试技术及仪器国家重点实验
出处
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007年第3期355-360,388,共7页
文摘
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。
关键词
唇读技术
康复工程
可视语音数据库
非对称唇形轮廓模型
隐马尔可夫
模型
Keywords
lip-reading
rehabilitation
visual-speech database
unsymmetrical lip contour model
Hidden Markov Model
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
视觉驱动的语音合成系统中唇形轮廓的傅里叶描述
李刚
王蒙军
林凌
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2007
1
在线阅读
下载PDF
职称材料
2
面向残疾人的汉语可视语音数据库
李刚
王蒙军
林凌
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部