-
题名多版本音乐识别技术研究综述
被引量:3
- 1
-
-
作者
肖川
李伟
殷玥
薛敏
朱碧磊
冯瑞
-
机构
复旦大学计算机科学技术学院媒体计算研究所
-
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第8期1841-1846,共6页
-
基金
国家自然科学基金项目(60873255)资助
上海市科委科技创新行动计划项目(10511500703)资助
-
文摘
音乐作品通常具有多个不同版本.重新演奏、演绎使得各版本音乐在音质、速度、节奏、结构、基调、和声、歌词等多个方面都可能产生不同,这使得多版本音乐识别成为一个具有挑战性的研究领域.近年来多版本音乐识别技术发展迅速,本文对其包含的五个关键技术模块进行描述,分别是特征提取模块、基调不变性模块、速度不变性模块、结构不变性模块、相似性计算模块;其次概要介绍该领域的典型算法;最后总结当前存在的问题,并讨论进一步的研究方向.
-
关键词
多版本音乐
节拍跟踪
中层特征
相似性量度
基调、速度、结构不变性
-
Keywords
cover song
beat tracking
middle-level feature
similarity measure
key/tempo/structure invariance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GPU的多点触控图像处理技术
被引量:4
- 2
-
-
作者
裘皓萍
冯瑞
万时华
-
机构
复旦大学计算机科学技术学院媒体计算研究所
中广电广播电影电视设计院数字技术研究中心
-
出处
《计算机工程》
CAS
CSCD
2012年第1期208-210,共3页
-
基金
国家"863"计划基金资助项目(2008AA01A317)
上海市科委基金资助项目(08dz1500109)
教育部博士点基金资助项目(20070246132)
-
文摘
现有的图像校正技术仅对触点坐标进行校正,存在损失大量操控面信息,限制复杂交互方式的缺点。为此,利用图形处理器(GPU)的可编程性和图形图像计算方面的优势,由GPU完成图像校正和处理过程,以此提高图像处理速度。为使系统支持更复杂的操控与交互,改进图像校正和处理流程,实现图像的整体校正,在保留操控面全部信息的同时减少CPU占用资源。理论分析与实验结果验证了该方法的有效性。
-
关键词
图形处理器
多点触控
图像校正
人机交互
-
Keywords
Graphics Processing Unit(GPU)
multi-touch
image calibration
human-computer interaction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名面向海量热成像数据的实时飞机跟踪技术
- 3
-
-
作者
顾嘉
张睿
何慧钧
张文强
-
机构
复旦大学计算机科学技术学院智能媒体计算研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S2期249-256,共8页
-
文摘
视频跟踪是近年来新兴的一个研究方向,通过计算机视觉实现对目标的检测与跟踪,在智能监控、视频压缩、人机交互等方面都有着广泛的应用场景.视频检测跟踪的目的是根据物体运动的规律及其线索找到视频中有价值的信息,其在视觉系统研究中占有非常重要的地位.通过对生物眼动和视觉运动感知的阐述,提出一种实时视频随动跟踪方法来处理大量的视频热成像数据,并将其应用于机场飞机起降的跟踪中.依据生物眼仿生与随动跟踪系统结构的类比,我们以提高跟踪效果、完善随动方法为本文目标,论述内容包括系统的简化模型,对云台的反馈控制,数值计算以及利用杂点图像分析不同视频跟踪算法的可行性等.最后,将文中提出的方法整合为一个系统,并进行实际的应用以验证方法的可行性及可靠性,并提出改进方案.
-
关键词
大规模视频热成像数据
随动跟踪
生物眼仿生
运动感知
视频分析
-
Keywords
large-scale video thermal data
follow tracking
bio bionic eye
motion perception
video analysis
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Android平台的多屏互动系统设计
被引量:17
- 4
-
-
作者
吴轶群
朱亚东
王明敏
-
机构
复旦大学计算机科学技术学院媒体计算研究所
东方有线网络股份有限公司
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第10期234-238,共5页
-
基金
国家高技术研究发展计划项目(2011AA01A100)
-
文摘
设计的基于Android平台的多屏互动系统定义了支持智能手机对智能电视远程遥控和文件共享的通信协议。协议安全、稳定、扩展性强,适用于多个平台;实现了运行在智能电视端的服务器应用,并通过分析Android系统特有的进程模型。以系统广播机制和应用生命周期理论为依据,解决了该应用向系统前台应用发送按键事件受到限制的难题,提出了一种安全高效的多应用遥控方案。
-
关键词
ANDROID
智能手机
智能电视
多屏互动
通信协议服务器应用
多应用遥控
-
Keywords
Android Smartphone Smart TV Multi-screen interaction Communication protocol Server application Muhi-application control
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于粒子滤波的多特征融合视频行人跟踪算法
被引量:10
- 5
-
-
作者
李锴
冯瑞
-
机构
复旦大学计算机科学技术学院媒体计算研究所
-
出处
《计算机工程》
CAS
CSCD
2012年第24期141-145,共5页
-
基金
国家"863"计划基金资助项目(2011AA100701)
上海市教育委员会科研创新基金资助项目(11CXY01)
宝山区科委产学研合作基金资助项目(CXY-2010-35)
-
文摘
针对车载视频行人跟踪问题,提出一种基于粒子滤波框架下的多特征融合跟踪算法。为克服车载视频中行人运动与摄像机运动产生的非线性和非高斯性,采用基于蒙特卡罗抽样的粒子滤波跟踪算法,使用一阶自回归动态模型预测目标状态,观测模型自适应加权融合的4种互补性特征。实验结果表明,与没有粒子滤波和多特征融合的跟踪算法相比,在相同精确率水平上,该算法的召回率提高20%以上。
-
关键词
粒子滤波
特征融合
局部二元模式
运动平滑
扩散距离
-
Keywords
particle filter
feature fusion
Local Binary Pattern(LBP)
motion smoothness
diffusion distance
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种低图像质量车辆牌照的字符分割方法
被引量:8
- 6
-
-
作者
王琰滨
蒋龙泉
冯瑞
-
机构
复旦大学计算机科学技术学院媒体计算研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第3期108-110,117,共4页
-
基金
上海市科委科技创新行动计划项目(10511500703)
上海市教委科研创新项目(产学研类)(11CXY01)
宝山区科委产学研合作项目(CXY-2010-35)
-
文摘
提出一种应用于车牌识别系统中车牌字符分割的方法,能够对由光照不均匀,车牌表面污损等原因造成的低图像质量的车牌进行有效字符分割。首先通过连通区域分析和车牌校正对车牌进行预处理,然后利用车牌固有的先验知识与间隙分析方法,实现整个车牌字符的精确分割,克服污损、边框和倾斜等干扰因素。通过在两组数据集上进行的实验结果表明,该算法具有很强的实用性与鲁棒性。
-
关键词
低质量车牌
字符分割
连通区域分析
字符识别
-
Keywords
Degraded license plate Character segmentation Connected component analysis OCR
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多传感器融合的自动导引车系统设计与控制策略
被引量:2
- 7
-
-
作者
王一强
王视鎏
冯瑞
-
机构
复旦大学计算机科学技术学院媒体计算研究所
-
出处
《计算机应用与软件》
CSCD
2011年第7期49-52,111,共5页
-
基金
国家高技术研究发展计划(2009AA01A346
2008AA01A317)
上海宝山区科委产学研项目(CXY-2009-03)
-
文摘
自动导引车在柔性制造业、物流业和自动仓储中具有广泛的应用前景和价值。提出并设计了一种基于CCD摄像头、RFID传感器、编码器、陀螺仪、声纳等多种传感器的自动导引车系统。通过对多种传感器数据进行信息融合达到控制目的,在实验室中搭建了模拟环境,开发了原型系统并进行测试,实验结果证明该方法提高了自动导引车系统的实时性和导航精度。
-
关键词
自动导引车系统
视觉导引
RFID传感器
控制策略
-
Keywords
Automated guided vehicle system(AGVS) Vision navigation RFID sensor Control strategy
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名基于条件随机场的低图像质量车牌字符分割
被引量:4
- 8
-
-
作者
傅建强
冯瑞
-
机构
复旦大学计算机科学技术学院媒体计算研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2014年第10期157-160,共4页
-
基金
国家高技术研究发展计划项目(2011AA010604)
上海市科委科技创新行动计划项目(12511501602)
上海市宝山区科委产学研合作项目(CXY-2011-11)
-
文摘
提出一种基于条件随机场的车牌字符分割算法,能够对光照不均、相机拍摄角度造成的低图像质量的车牌图像,特别是日益增多的车牌边框与字符相连接车牌图像进行有效的字符分割。算法首先进行车牌图像校正,然后利用标注车牌数据进行模型学习,对车牌图像像素列进行分类识别,最后组合成车牌字符分割结果。理论分析与实验结果验证了算法的有效性。
-
关键词
车牌识别
字符分割
条件随机场
-
Keywords
License plate recognition
Character segmentation
Conditional random fields
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名视觉引导AGV中的数字图像处理方法
被引量:1
- 9
-
-
作者
王视鎏
王一强
冯瑞
万时华
-
机构
复旦大学计算机科学技术学院媒体计算研究所
中广电设计院数字技术研究中心
-
出处
《计算机应用与软件》
CSCD
2011年第6期84-88,127,共6页
-
基金
国家高技术研究发展计划项目(2009AA01A346
2008AA01A317)
上海宝山区科委产学研项目(CXY-2009-03)
-
文摘
利用计算机视觉技术引导自动运输车AGV(Automatic Guided Vehicle)是一种重要的AGV导航手段。该方法通过摄像头获取道路图像信息并进行处理,获得道路参数,以此来指引AGV导航。现有的视觉导航算法大多复杂度较大,难以满足实际应用的实时性需求。提出一种基于道路参数识别的视觉引导方法,将道路中的道路识别为曲线参数,结合预测进行修正,在保证精度的前提下,大幅提高算法效率。理论分析和实验结果表明,该方法具有识别精度高,执行速度快,能达到实用化的要求。
-
关键词
自动引导运输车
视觉导航
霍夫变换
-
Keywords
Automatic guided vehicle(AGV) Visual navigation Hough transformation
-
分类号
TP242.62
[自动化与计算机技术—检测技术与自动化装置]
-