期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
视频转换编码及其实现技术的研究 被引量:12
1
作者 褚晶辉 俞斯乐 鲁照华 《电子学报》 EI CAS CSCD 北大核心 2004年第10期1678-1683,共6页
转换编码技术是近年来出现的新课题 ,广泛应用于数字视频通信和多媒体网络中 .它是指对已经压缩编码的码流进行再处理 ,使经过处理后的数据符合传输和接收的要求 .本文对转换编码技术的分类和当前的研究进展进行了系统研讨 ,并进一步指... 转换编码技术是近年来出现的新课题 ,广泛应用于数字视频通信和多媒体网络中 .它是指对已经压缩编码的码流进行再处理 ,使经过处理后的数据符合传输和接收的要求 .本文对转换编码技术的分类和当前的研究进展进行了系统研讨 ,并进一步指出了它的发展前景 . 展开更多
关键词 视频转换编码 码率转换 分辨率转换 转换编码代理 误码修复 视频编码流
在线阅读 下载PDF
基于小波变换的文字检测与提取方法
2
作者 褚晶辉 董越 吕卫 《电视技术》 北大核心 2014年第3期182-185,共4页
视频中包含的文字信息与视频的语义内容有很强的相关性,将视频中的文字信息提取出来进行分析处理可以有效地理解电视视频语义,从而实现对视频内容的安全监控。针对文字检测提出一种基于小波变换、角点特征图像和统计特征的有效方法,并... 视频中包含的文字信息与视频的语义内容有很强的相关性,将视频中的文字信息提取出来进行分析处理可以有效地理解电视视频语义,从而实现对视频内容的安全监控。针对文字检测提出一种基于小波变换、角点特征图像和统计特征的有效方法,并运用基于彩色空间的文字提取方法获取二值图像,更有利于后面OCR的文字识别。 展开更多
关键词 文字检测 文字提取 小波变换 角点特征
在线阅读 下载PDF
基于Android平台的智能家居监控系统 被引量:31
3
作者 汪宇 吕卫 +1 位作者 杨博菲 褚晶辉 《电视技术》 北大核心 2012年第2期36-38,共3页
目前,远程视频监控系统已成为智能家居的重要组成部分。智能监控系统基于Android操作系统平台,以平板式计算机作为客户端,通过HTTP协议从IP摄像机下载监控图片,并利用多种算法对家中各房间或不同角度的情况进行智能监控。
关键词 ANDROID 客户端 服务器 智能监控 智能家居
在线阅读 下载PDF
彩色眼底图像糖网渗出物的自动检测 被引量:6
4
作者 吕卫 翟庆伟 +1 位作者 褚晶辉 李喆 《光电工程》 CAS CSCD 北大核心 2016年第12期183-192,199,共11页
糖尿病视网膜病变(简称"糖网")渗出物的自动检测对于糖网的早期诊断具有重要意义。针对以往利用数学形态学检测糖网渗出物方法中存在的图像增强效果不佳造成的渗出物细节易漏检以及干扰区域去除不完全造成的正常区域易误检的... 糖尿病视网膜病变(简称"糖网")渗出物的自动检测对于糖网的早期诊断具有重要意义。针对以往利用数学形态学检测糖网渗出物方法中存在的图像增强效果不佳造成的渗出物细节易漏检以及干扰区域去除不完全造成的正常区域易误检的问题,提出了一种改进的基于数学形态学的糖网渗出物的自动检测方法,主要对眼底图像的预处理和视盘等干扰区域的检测进行了优化。首先预处理阶段在HSV颜色空间对图像进行亮度校正后引入了多尺度顶帽变换方法进行图像增强,接着采用了一种综合图像边缘信息和亮度信息的新方法定位视盘中心并利用Chan-Vese水平集模型分割出视盘,又依次提取出干扰渗出物检测的边界和光学器件的反射亮斑,最后用背景估计结合形态学重建的方法检测出渗出物的精确轮廓。经最新公开的e-ophtha EX数据库测试,得到病灶水平灵敏度91.7%,阳性预测值94.6%;图像水平灵敏度100%,特异性88.6%,准确率95.1%。 展开更多
关键词 糖网渗出物 预处理 干扰区域 数学形态学
在线阅读 下载PDF
一种预测质量可控的快速运动估计搜索算法 被引量:2
5
作者 鲁照华 李华 +1 位作者 褚晶辉 俞斯乐 《电子学报》 EI CAS CSCD 北大核心 2004年第6期980-982,共3页
本文提出了一种预测质量可控的快速运动估计搜索算法 .该算法利用运动矢量的空间、时间相关性 ,通过预测初始搜索中心位置、判定是否为静止宏块、调整搜索窗口、预测质量可控的渐进式块匹配准则搜索等步骤进行运动估计 ,并引入调节函数... 本文提出了一种预测质量可控的快速运动估计搜索算法 .该算法利用运动矢量的空间、时间相关性 ,通过预测初始搜索中心位置、判定是否为静止宏块、调整搜索窗口、预测质量可控的渐进式块匹配准则搜索等步骤进行运动估计 ,并引入调节函数在预测质量和搜索速度之间增加了可控性 .实验结果表明本算法大大减少了计算量 ,明显提高了运算速度 ,且具有很好的重建视频质量 。 展开更多
关键词 预测质量可控 渐进式块匹配准则 运动估计 视频编码
在线阅读 下载PDF
基于可转移字典对的跨视角动作识别
6
作者 吕卫 赵亚洲 褚晶辉 《信息技术》 2017年第7期159-163,共5页
为人体动作寻找具有分辨力的视觉特征是机器视觉研究领域的重要课题,但当视角发生改变时其效果往往不够理想。文中提出了一种视角无关的动作识别方法,利用转移字典对完成视角间信息的转移。转移字典对包含两个字典,分别对应于源视角和... 为人体动作寻找具有分辨力的视觉特征是机器视觉研究领域的重要课题,但当视角发生改变时其效果往往不够理想。文中提出了一种视角无关的动作识别方法,利用转移字典对完成视角间信息的转移。转移字典对包含两个字典,分别对应于源视角和目标视角。字典对的学习过程是自发的,其准则是尽量使两个视角中的同一动作具有相同的稀疏表示。提出了有监督和无监督条件下的算法,用于转移字典对的学习。利用转移字典对将两个视角中的视频进行稀疏表示之后,在源视角下训练得到的分类器即可直接用于目标视角。方法的有效性在多视角、多模态的数据库3M上进行验证,取得了良好的效果。 展开更多
关键词 跨视角动作识别 转移字典对 HOG3D描述子 k-NN算法
在线阅读 下载PDF
一种3D视频中立体字幕叠加技术 被引量:4
7
作者 梁丽 褚晶辉 +1 位作者 张小佩 李英敏 《电视技术》 北大核心 2011年第20期32-34,40,共4页
运用3D字幕视差与背景景深的对应关系,基于立体视觉的双目视差原理叠加3D字幕,实现了基于三维图像内容的景深叠加3D字幕的系统。该立体字幕叠加方法具有简单、稳健等特点,缓解了观看时的视觉疲劳问题,使观众更舒适地观看立体图像和字幕。
关键词 立体视觉 立体字幕 双目视差 OPENGL
在线阅读 下载PDF
可与数字电视进行信息交互的Android应用程序设计 被引量:3
8
作者 陈彩莲 褚晶辉 +1 位作者 吕卫 杨博菲 《电视技术》 北大核心 2011年第12期78-79,86,共3页
随着三网融合浪潮的推进,手机、电视、网络的功能相互融合产生的创新是日后的发展趋势。提出的应用程序将突破传统的电视使用模式,目的是实现智能手机与电视的信息互动,给用户带来新的体验。最后,通过实验验证了程序功能的正确。
关键词 ANDROID IP机顶盒 信息交互
在线阅读 下载PDF
网络视频监控系统动态目标跟踪与识别的实现 被引量:1
9
作者 郭静 褚晶辉 +1 位作者 邱润东 吕卫 《电视技术》 北大核心 2011年第21期110-111,116,共3页
设计了一种基于DirectShow技术的网络视频监控系统。该系统能实现对多路远程IP摄像头的实时监控,还能够对监控视频中出现的异常情况进行重点跟踪与识别、镜头切换跟踪,使监控功能更加强大。
关键词 智能监控 DIRECTSHOW 跟踪与识别
在线阅读 下载PDF
基于Leap Motion的手工雕塑网页应用设计 被引量:2
10
作者 孟祥宇 吕卫 褚晶辉 《信息技术》 2016年第10期145-147,共3页
文中设计了一种基于Leap Motion的手工雕塑网页应用。该应用使用Leap Motion采集用户手部运动,然后将运动信息交给3D动画处理部分进行模型处理加工,最后雕塑结果按照WebGL标准通过HTML5的Canvas元素呈现在Web浏览器中。该应用可在不同... 文中设计了一种基于Leap Motion的手工雕塑网页应用。该应用使用Leap Motion采集用户手部运动,然后将运动信息交给3D动画处理部分进行模型处理加工,最后雕塑结果按照WebGL标准通过HTML5的Canvas元素呈现在Web浏览器中。该应用可在不同的操作系统上运行,大大降低了体验手工雕塑的成本,有望得到推广。 展开更多
关键词 手工雕塑 Leap MOTION CANVAS WEBGL
在线阅读 下载PDF
DTV多节目传送流实时多画面播放软件设计
11
作者 闵行 褚晶辉 +1 位作者 刘子玉 俞滢 《电视技术》 北大核心 2014年第21期36-38,共3页
设计了一种实时播放数字电视(DTV)传送流的软件,支持多达16路节目的解码和多画面显示。该设计利用商用的数字电视传送流采集卡将码流输入到计算机内存中,然后利用FFmpeg开源库实现对传送流的解复用和多路视频解码,最后利用SDL开源库将... 设计了一种实时播放数字电视(DTV)传送流的软件,支持多达16路节目的解码和多画面显示。该设计利用商用的数字电视传送流采集卡将码流输入到计算机内存中,然后利用FFmpeg开源库实现对传送流的解复用和多路视频解码,最后利用SDL开源库将解码后的图像以多画面的形式显示在屏幕上。该设计提供了一种低成本的数字电视播出质量监测手段,软件也具有较高的可移植性。 展开更多
关键词 多节目传送流 多画面显示
在线阅读 下载PDF
支持多种文字的视频字幕叠加工具设计
12
作者 王亚 褚晶辉 +1 位作者 刘子玉 吕卫 《信息技术》 2015年第9期118-120,共3页
文中设计了一种基于开源库OpenCV、FreeType和VLC的多种文字视频字幕叠加工具。该工具首先读取字幕文件中的时间信息和文本信息,然后按时间信息解码对应的视频帧,最后将字幕的文本内容绘制到视频帧中。克服了OpenCV只支持西文字符绘制... 文中设计了一种基于开源库OpenCV、FreeType和VLC的多种文字视频字幕叠加工具。该工具首先读取字幕文件中的时间信息和文本信息,然后按时间信息解码对应的视频帧,最后将字幕的文本内容绘制到视频帧中。克服了OpenCV只支持西文字符绘制、不支持中文字符的缺点,并支持多种字体的绘制。该工具可在视频截图上批量叠加不同字体的字幕,能够很便捷地生成大量字幕素材,用于视频字幕检测算法的设计或评估。 展开更多
关键词 字幕检测 OPENCV FREETYPE VLC
在线阅读 下载PDF
组合降采样极限学习机
13
作者 闵行 褚晶辉 吕卫 《信息技术》 2015年第11期159-162,共4页
设计了一种针对不平衡数据集的学习机,即组合降采样极限学习机(EUS ELMs)。当训练数据集不平衡时,普通分类器对少数样本的分类敏感性较低,而给予多数样本过度关注。针对这种问题,将组合降采样结构与极限学习机(ELM)结合起来,形成一种新... 设计了一种针对不平衡数据集的学习机,即组合降采样极限学习机(EUS ELMs)。当训练数据集不平衡时,普通分类器对少数样本的分类敏感性较低,而给予多数样本过度关注。针对这种问题,将组合降采样结构与极限学习机(ELM)结合起来,形成一种新的组合学习机。该学习机继承了组合降采样结构对样本选择的依赖性小的优点,和极限学习机分类效率高、耗时短的优势,而且可以通过不同的参数设置控制对少数样本的关注度,根据使用者需求获得不同分类效果。 展开更多
关键词 不平衡数据集 分类器 组合降采样 极限学习机
在线阅读 下载PDF
适用于目标检测的上下文感知知识蒸馏网络 被引量:3
14
作者 褚晶辉 史李栋 +1 位作者 井佩光 吕卫 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第3期503-509,共7页
针对现有应用于目标检测的知识蒸馏方法难以利用目标周围上下文区域的特征信息,提出适用于目标检测的上下文感知知识蒸馏网络(CAKD Net)方法.该方法能充分利用被检测目标的上下文信息,同时沿空间域和通道域进行信息感知,消除教师网络和... 针对现有应用于目标检测的知识蒸馏方法难以利用目标周围上下文区域的特征信息,提出适用于目标检测的上下文感知知识蒸馏网络(CAKD Net)方法.该方法能充分利用被检测目标的上下文信息,同时沿空间域和通道域进行信息感知,消除教师网络和学生网络的差异.该方法包括基于上下文感知的区域提纯模块(CARM)和自适应通道注意力模块(ACAM). CARM利用上下文信息,自适应生成显著性区域的细粒度掩膜,准确消除教师网络和学生网络各自特征响应在该区域的差异;ACAM引入空间-通道注意力机制,进一步优化目标函数,提高学生网络的性能.实验结果表明,所提方法对模型检测精确率提升超过2.9%. 展开更多
关键词 知识蒸馏 通道注意力 模型轻量化 目标检测 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部