期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于视听分层模型的实时爆炸场景识别
被引量:
2
1
作者
庄越挺
傅正钢
+1 位作者
叶朝阳
吴飞
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004年第1期90-97,共8页
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸...
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。
展开更多
关键词
听觉
视觉
压缩域
粗分支持向量机
爆炸场景识别
在线阅读
下载PDF
职称材料
题名
基于视听分层模型的实时爆炸场景识别
被引量:
2
1
作者
庄越挺
傅正钢
叶朝阳
吴飞
机构
浙江大学人工智能研究所
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004年第1期90-97,共8页
基金
国家自然科学基金(60272031)
教育部博士点基金(20010335049)
+1 种基金
国家"十五"重大科技攻关项目(2001BA101A0703)
浙江省科技计划项目重点科研项目(2003C21010)资助
文摘
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法 首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来 ,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开 ,由此得到音频爆炸备选场景 由于大多数爆炸场景均伴随剧烈的视觉突变 ,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化 。
关键词
听觉
视觉
压缩域
粗分支持向量机
爆炸场景识别
Keywords
compressed features
hierarchical SVM
audio-visual event
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于视听分层模型的实时爆炸场景识别
庄越挺
傅正钢
叶朝阳
吴飞
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部