期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于发音特征的音视频融合语音识别模型 被引量:2
1
作者 吴鹏 蒋冬梅 +2 位作者 王风娜 Hichem SAHLI Werner VERHELST 《计算机工程》 CAS CSCD 北大核心 2011年第22期268-269,272,共3页
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得... 构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性。 展开更多
关键词 动态贝叶斯网络 发音特征 音视频融合 语音识别 异步
在线阅读 下载PDF
基于卡尔曼滤波的弱小目标实时检测与跟踪 被引量:10
2
作者 高建伟 李磊 +2 位作者 姚睿 孙瑾秋 张艳宁 《计算机工程》 CAS CSCD 2012年第2期4-7,共4页
提出一种基于卡尔曼滤波的弱小目标实时检测与跟踪方法。计算每帧图像上所有星点到参考星点的距离,利用目标与背景恒星运动特性上的差异检测出运动目标。针对漏检问题,采用卡尔曼滤波算法估计目标在漏检帧上的位置,通过对图像的重分割... 提出一种基于卡尔曼滤波的弱小目标实时检测与跟踪方法。计算每帧图像上所有星点到参考星点的距离,利用目标与背景恒星运动特性上的差异检测出运动目标。针对漏检问题,采用卡尔曼滤波算法估计目标在漏检帧上的位置,通过对图像的重分割寻找丢失目标,利用目标的运动信息建立连续的目标链。实验结果表明,该方法能实现高检测率和低虚警率的实时检测。 展开更多
关键词 空间图像 弱小目标 星点距 卡尔曼滤波 实时检测 目标匹配
在线阅读 下载PDF
基于变分水平集方法的体素模型修复 被引量:1
3
作者 周跃 郑江滨 李秀秀 《计算机应用研究》 CSCD 北大核心 2012年第5期1967-1969,1973,共4页
针对体素着色方法所重建出的模型存在大量空洞与缺损的问题,提出了一种模型修复方法。首先采用改进的变分水平集方法恢复出封闭完整的体素模型曲面;再利用原始体素模型的颜色信息,对新生成的模型曲面进行重着色并滤除杂色,最终完成体素... 针对体素着色方法所重建出的模型存在大量空洞与缺损的问题,提出了一种模型修复方法。首先采用改进的变分水平集方法恢复出封闭完整的体素模型曲面;再利用原始体素模型的颜色信息,对新生成的模型曲面进行重着色并滤除杂色,最终完成体素模型的修复。其中,改进的变分水平集方法在水平集能量函数中引入了符号距离函数自动规整项,避免了重初始化操作;添加了新的进化加速项,防止了隐式曲面穿透模型而造成模型侵蚀。实验表明,修复好的体素模型较原模型相比具有完整的外型和平滑的色彩,且曲面恢复效率更高。 展开更多
关键词 变分水平集方法 曲面恢复 空洞填充 体素着色 重初始化
在线阅读 下载PDF
基于三流DBN模型的听视觉情感识别 被引量:1
4
作者 吕兰兰 蒋冬梅 +2 位作者 王风娜 Hichem Sahli Werner Verhelst 《计算机工程》 CAS CSCD 2012年第5期161-162,166,共3页
为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,在状态层同步。将面部几何特征和面部动作参数特征作为视觉... 为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,在状态层同步。将面部几何特征和面部动作参数特征作为视觉输入流,与听觉输入流在状态层异步。实验结果表明,该模型优于有状态异步约束的听视觉双流DBN模型,6种情感的平均识别率从52.14%提高到63.71%。 展开更多
关键词 动态贝叶斯网络 听视觉融合 情感识别 异步约束 权重
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部