期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于视听分层模型的实时爆炸场景识别 被引量:2
1
作者 庄越挺 傅正钢 +1 位作者 叶朝阳 吴飞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第1期90-97,共8页
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸... 提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。 展开更多
关键词 听觉 视觉 压缩域 粗分支持向量机 爆炸场景识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部