期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
采用非对称唇形轮廓模型提高汉语唇形识别效果
被引量:
5
1
作者
李刚
王蒙军
林凌
《光学精密工程》
EI
CAS
CSCD
北大核心
2006年第3期473-477,共5页
通过分析人脸正面和侧面图像的特点,建立起一种新的唇形轮廓描述模型,能够提取出嘴唇的突出度信息,同时通过计算部分参数对时间的导数,来获得唇形轮廓的动态信息。通过对小词库试验,对比单纯采用正面图像轮廓的描述方法,该方法能够将识...
通过分析人脸正面和侧面图像的特点,建立起一种新的唇形轮廓描述模型,能够提取出嘴唇的突出度信息,同时通过计算部分参数对时间的导数,来获得唇形轮廓的动态信息。通过对小词库试验,对比单纯采用正面图像轮廓的描述方法,该方法能够将识别效果平均提高25%以上,克服了以往对唇形轮廓提取时,通常都采用人脸的正面图像,不能反映出嘴唇的突出度信息的局限。
展开更多
关键词
唇形轮廓
对称模型
非对称模型
差分特征
在线阅读
下载PDF
职称材料
视觉驱动的语音合成系统中唇形轮廓的正交变换描述
被引量:
3
2
作者
李刚
王蒙军
+1 位作者
林凌
曾锐利
《光学精密工程》
EI
CAS
CSCD
北大核心
2007年第7期1117-1123,共7页
为了能够自动而且快速地获取唇读系统中所必需的唇形轮廓特征,提出了将正交压缩变换的方法用于唇形轮廓的特征提取,并对得到的唇形轮廓曲线进行了分析研究。通过离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里...
为了能够自动而且快速地获取唇读系统中所必需的唇形轮廓特征,提出了将正交压缩变换的方法用于唇形轮廓的特征提取,并对得到的唇形轮廓曲线进行了分析研究。通过离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里叶描述子和离散余弦变换描述子,然后将两类描述子作为唇形轮廓的特征向量,采用隐马尔可夫模型(HMM)进行学习和识别。基于独立汉字发音的实验表明:在达到40%的识别率时,刻画唇形轮廓特征所需的离散余弦变换描述子数目为15个,傅里叶描述子数目为20个。在相同的识别效果时,刻画唇形轮廓特征所需的离散余弦变换描述子数目少于傅里叶描述子,可减少数据运算量和运算所需时间。
展开更多
关键词
非对称模型
唇形轮廓
边缘特征
傅里叶描述子
离散余弦变换描述子
隐马尔可夫模型(HMM)
在线阅读
下载PDF
职称材料
面向残疾人的汉语可视语音数据库
被引量:
3
3
作者
李刚
王蒙军
林凌
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007年第3期355-360,388,共7页
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特...
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。
展开更多
关键词
唇读技术
康复工程
可视语音数据库
非对称
唇形轮廓
模型
隐马尔可夫模型
在线阅读
下载PDF
职称材料
题名
采用非对称唇形轮廓模型提高汉语唇形识别效果
被引量:
5
1
作者
李刚
王蒙军
林凌
机构
天津大学精密仪器与光电子工程学院
出处
《光学精密工程》
EI
CAS
CSCD
北大核心
2006年第3期473-477,共5页
文摘
通过分析人脸正面和侧面图像的特点,建立起一种新的唇形轮廓描述模型,能够提取出嘴唇的突出度信息,同时通过计算部分参数对时间的导数,来获得唇形轮廓的动态信息。通过对小词库试验,对比单纯采用正面图像轮廓的描述方法,该方法能够将识别效果平均提高25%以上,克服了以往对唇形轮廓提取时,通常都采用人脸的正面图像,不能反映出嘴唇的突出度信息的局限。
关键词
唇形轮廓
对称模型
非对称模型
差分特征
Keywords
lip contour
symmetrical model
unsymmetrical model
difference parameters
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
视觉驱动的语音合成系统中唇形轮廓的正交变换描述
被引量:
3
2
作者
李刚
王蒙军
林凌
曾锐利
机构
天津大学精密仪器与光电子工程学院
出处
《光学精密工程》
EI
CAS
CSCD
北大核心
2007年第7期1117-1123,共7页
基金
天津大学985工程资助项目
国家自然科学基金项目(No.60674111)
文摘
为了能够自动而且快速地获取唇读系统中所必需的唇形轮廓特征,提出了将正交压缩变换的方法用于唇形轮廓的特征提取,并对得到的唇形轮廓曲线进行了分析研究。通过离散傅里叶变换(DFT)和离散余弦变换(DCT)分别得到描述唇形轮廓特征的傅里叶描述子和离散余弦变换描述子,然后将两类描述子作为唇形轮廓的特征向量,采用隐马尔可夫模型(HMM)进行学习和识别。基于独立汉字发音的实验表明:在达到40%的识别率时,刻画唇形轮廓特征所需的离散余弦变换描述子数目为15个,傅里叶描述子数目为20个。在相同的识别效果时,刻画唇形轮廓特征所需的离散余弦变换描述子数目少于傅里叶描述子,可减少数据运算量和运算所需时间。
关键词
非对称模型
唇形轮廓
边缘特征
傅里叶描述子
离散余弦变换描述子
隐马尔可夫模型(HMM)
Keywords
Discrete cosine transforms
Discrete Fourier transforms
Eigenvalues and eigenfunctions
Feature extraction
Hidden Markov models
Human engineering
Mathematical models
Speech synthesis
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
面向残疾人的汉语可视语音数据库
被引量:
3
3
作者
李刚
王蒙军
林凌
机构
天津大学精密测试技术及仪器国家重点实验
出处
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007年第3期355-360,388,共7页
文摘
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。
关键词
唇读技术
康复工程
可视语音数据库
非对称
唇形轮廓
模型
隐马尔可夫模型
Keywords
lip-reading
rehabilitation
visual-speech database
unsymmetrical lip contour model
Hidden Markov Model
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
采用非对称唇形轮廓模型提高汉语唇形识别效果
李刚
王蒙军
林凌
《光学精密工程》
EI
CAS
CSCD
北大核心
2006
5
在线阅读
下载PDF
职称材料
2
视觉驱动的语音合成系统中唇形轮廓的正交变换描述
李刚
王蒙军
林凌
曾锐利
《光学精密工程》
EI
CAS
CSCD
北大核心
2007
3
在线阅读
下载PDF
职称材料
3
面向残疾人的汉语可视语音数据库
李刚
王蒙军
林凌
《中国生物医学工程学报》
CAS
CSCD
北大核心
2007
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部