期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
基于双Transformer结构的多模态视频段落描述生成研究
1
作者 赵宏 张立军 《计算机工程与应用》 北大核心 2025年第21期182-191,共10页
针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度... 针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度特征提取,由混合注意力结合全局视觉特征选择最具代表性的细粒度局部视觉特征,对视频中主要事件信息进行补充与增强,提高视频内容描述的准确性;提出在Transformer结构中增加存储模块与混合注意力模块,并设计了双Transformer结构,内部Transformer对事件内一致性进行建模,外部Transformer由混合注意力计算与当前事件最相关的状态建模事件间的一致性,结合内外部Transformer的输出对事件内容进行预测,提高生成描述语句的连贯性。在ActivityNet Captions数据集和YouCookII数据集上的实验结果表明,所提模型在BLEU-4、METEOR、ROUGE-L和CIDEr指标上相较于现有主流视频段落描述模型有明显提升,验证了模型的有效性。 展开更多
关键词 视频段落描述 编码器-解码器结构 细粒度局部视觉特征 双Transformer结构
在线阅读 下载PDF
基于多模态记忆知识的密集视频描述方法
2
作者 方豪杰 李永刚 +1 位作者 曹宗瑞 叶利华 《电信科学》 北大核心 2025年第9期133-151,共19页
密集视频描述旨在从未修剪的视频中定位事件,并为每个有意义的事件生成相应的描述。现有方法主要利用源视频输入来生成描述,无法捕捉到视频中的隐含知识,即视频中隐含的视觉、音频、文本等多模态记忆知识,其中多模态记忆知识可以理解为... 密集视频描述旨在从未修剪的视频中定位事件,并为每个有意义的事件生成相应的描述。现有方法主要利用源视频输入来生成描述,无法捕捉到视频中的隐含知识,即视频中隐含的视觉、音频、文本等多模态记忆知识,其中多模态记忆知识可以理解为视频内对象、动作和属性对应的有意义词集合。为解决该问题,提出了基于多模态记忆知识的密集视频描述方法,不仅利用了视频本身的多模态信息,还拓展了与视频相关的多模态记忆知识,极大地提高了密集视频描述生成的准确性。首先,该方法构建了多模态记忆知识库,设计了基于模态共享编码器的事件定位模块,实现源视频多模态特征之间的深层次融合并生成高质量事件提案。然后,模型从多模态记忆知识库中检索与候选事件提案密切相关的视觉、音频和文本记忆知识作为描述生成的先验信息。最后,该方法通过记忆增强解码器,有效地整合了多模态记忆知识和视频多模态信息,生成详细的密集视频描述。在ActivityNetCaptions和YouCook2数据集上进行了对比实验和消融实验,结果验证了该方法的有效性。 展开更多
关键词 密集视频描述 多模态记忆知识 记忆增强解码器 交叉注意力
在线阅读 下载PDF
远程视频监控系统中的解码技术及显示控制策略 被引量:20
3
作者 彭强 杨天武 陈维荣 《电力系统自动化》 EI CSCD 北大核心 2002年第9期66-70,共5页
讨论和比较了 MPEG— 1 ,Motion— JPEG,H.2 63视频压缩标准的特征 ,及其在分布式远程视频监控系统中的选用原则 ,研究了视频实时回显技术。针对不同视频标准的图像帧回放时间控制策略给出了上屏控制的具体算法 ,提高了抗干扰能力和算... 讨论和比较了 MPEG— 1 ,Motion— JPEG,H.2 63视频压缩标准的特征 ,及其在分布式远程视频监控系统中的选用原则 ,研究了视频实时回显技术。针对不同视频标准的图像帧回放时间控制策略给出了上屏控制的具体算法 ,提高了抗干扰能力和算法的鲁棒性 ,最后对各种视频压缩和回显进行了对比试验 。 展开更多
关键词 远程视频监控系统 解码技术 显示控制策略 变电站 综合自动化 系统
在线阅读 下载PDF
用于HDTV视频解码器的高性能SDRAM控制器 被引量:11
4
作者 赵强 罗嵘 +1 位作者 汪蕙 杨华中 《电子与信息学报》 EI CSCD 北大核心 2007年第6期1332-1337,共6页
该文提出了一种适用于HDTV视频解码器的高性能SDRAM控制器。通过为SDRAM控制器设置多个端口并集成仲裁功能,该SDRAM控制器可以取代传统的总线+DMA结构,为解码器中的功能单元有效地分配存储器的带宽资源。该文提出的SDRAM控制器内建流水... 该文提出了一种适用于HDTV视频解码器的高性能SDRAM控制器。通过为SDRAM控制器设置多个端口并集成仲裁功能,该SDRAM控制器可以取代传统的总线+DMA结构,为解码器中的功能单元有效地分配存储器的带宽资源。该文提出的SDRAM控制器内建流水线式的地址和数据路径,配合SDRAM本身流水处理指令的特性,能够无延时地处理各个端口上的存储器访问请求,从而降低了对片上缓存的需求。仿真综合结果表明,该文设计的SDRAM控制器满足HDTV解码的性能要求,且与总线+DMA结构相比,片上缓存容量减少了约70%。 展开更多
关键词 HDTV SDRAM控制器 视频 解码
在线阅读 下载PDF
远程数字视频监控系统的设计与实现 被引量:39
5
作者 宋玉锋 周泓 《计算机工程》 CAS CSCD 北大核心 2002年第8期238-239,273,共3页
介绍了远程数字视频监控系统的设计与实现和硬件设备的选择,详细描述了各模块的功能与实现,并着重介绍了该软件的实时性、可靠性和实用性等特点,为智能化楼宇提供一个实时的、通用的、组态化的视频监控系统。
关键词 远程数字视频监控系统 设计 视频压缩 视频流 视频解码
在线阅读 下载PDF
用于视频多播传输的压缩传感实现方法研究 被引量:6
6
作者 赵慧民 郭一缜 +1 位作者 丁晓艳 朱立 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第1期45-49,共5页
在较高的包丢失率和噪声信道环境下,提高视频传输的图像质量是通信技术应用的关键。基于压缩传感理论,提出一种实现多播传输的视频图像解码方法。通过研究测量矩阵与稀疏基的最佳配置关系以及视频帧间相关性,实现了一种视频帧内重加权l... 在较高的包丢失率和噪声信道环境下,提高视频传输的图像质量是通信技术应用的关键。基于压缩传感理论,提出一种实现多播传输的视频图像解码方法。通过研究测量矩阵与稀疏基的最佳配置关系以及视频帧间相关性,实现了一种视频帧内重加权l1范数解码和基于运动矢量的帧间解码。在噪声和包丢失信道模型下,通过与软投影解码实验比较,说明了实现方法的有效性。 展开更多
关键词 视频多播 压缩传感 矩阵 解码
在线阅读 下载PDF
地震应急通讯保障系统的设计与思考 被引量:12
7
作者 章熙海 胡秀敏 +1 位作者 卢永 付荣国 《防灾减灾工程学报》 CSCD 2011年第1期111-114,共4页
以华东地震应急联动协作区地震应急演练为例,探讨了演练现场与指挥中心之间异地会商、现场音视频实况转播和测震波形实时显示的主要通讯实现方法;通过比较试验,确定采用WiMAX无线通讯方式传输现场本地数据、采用编解码器传输音视频信号... 以华东地震应急联动协作区地震应急演练为例,探讨了演练现场与指挥中心之间异地会商、现场音视频实况转播和测震波形实时显示的主要通讯实现方法;通过比较试验,确定采用WiMAX无线通讯方式传输现场本地数据、采用编解码器传输音视频信号时,双向视频传输需使用2对编解码器,但1对编解码器上就能完全实现异地音频的互通,AV-1600e型编解码器在地震系统目前的卫星应急通讯信道下采用600 kpbs的视频编码率,能提供相对稳定的画面。实践表明,WiMAX无线通讯能较好地扩大野外本地网络通讯半径,编解码器能实现异地音视频互通,但对信道要求较高,效果较难保证。 展开更多
关键词 地震应急演练 音视频通讯 编解码器 异地会商
在线阅读 下载PDF
高清晰度电视芯片中视频和音频同步的异步实现 被引量:5
8
作者 王维东 姚庆栋 虞露 《红外与激光工程》 EI CSCD 北大核心 2002年第1期72-76,共5页
高清晰度电视的传输流采用了MPEG 2系统层标准ISO/IEC 13818 1。阐述了高清晰度电视 (HDTV)传送流中时间信息码在视频和音频同步中的作用 ,分析了信源解码器中视频和音频同步的原理。就实际芯片中系统时钟的恢复、视频和音频的跳帧等机... 高清晰度电视的传输流采用了MPEG 2系统层标准ISO/IEC 13818 1。阐述了高清晰度电视 (HDTV)传送流中时间信息码在视频和音频同步中的作用 ,分析了信源解码器中视频和音频同步的原理。就实际芯片中系统时钟的恢复、视频和音频的跳帧等机制进行了讨论 ,并提出了一种非锁相异步全数字视音频同步实现方案。该方案采用了直接置数法恢复系统时钟 ,滞后跳帧法实现视频与系统时钟的同步 ,数字锁相法控制音频与系统时钟同步。最后 。 展开更多
关键词 异步 高清晰度电视 信源解码 视频同步 音频同步
在线阅读 下载PDF
基于DSP和CPLD的视频图像采集处理的设计与实现 被引量:5
9
作者 周长林 常青美 简礼宏 《数据采集与处理》 CSCD 北大核心 2008年第B09期168-172,共5页
提出了基于DSP和CPLD的视频图像采集、处理系统的设计与实现方法,系统硬件平台主要由专用视频解码芯片、可编程逻辑器件以及数字信号处理器等组成。讨论了视频图像信号处理的基本构成、原理,采用TVP5150视频解码芯片采集视频信号、输出... 提出了基于DSP和CPLD的视频图像采集、处理系统的设计与实现方法,系统硬件平台主要由专用视频解码芯片、可编程逻辑器件以及数字信号处理器等组成。讨论了视频图像信号处理的基本构成、原理,采用TVP5150视频解码芯片采集视频信号、输出图像数据码流,配置XC95144 CPLD芯片进行系统逻辑控制,利用TMS320VC5416处理器和处理算法软件进行数字图像信号处理,实现了视频图像采集、存储、传输、检测和锐化。系统设计是有效和可行的。 展开更多
关键词 视频信号采集 图像处理 TMS320VC5416处理器 可编程逻辑器件 视频解码芯片TVP5150
在线阅读 下载PDF
基于DM642的视频采集与处理系统设计及实现 被引量:9
10
作者 龙映雪 张春熹 +1 位作者 伊小素 王明 《电子测量技术》 2012年第9期52-55,共4页
DSP作为一种具有强大数据处理能力和高运算速度的微处理器,以其为核心的嵌入式实时图像采集处理系统越来越受到广泛的关注和应用。基于TMS320DM642处理器设计构建硬件平台,采用JPEG图像压缩编码技术,实现了实时视频采集和处理。重点研... DSP作为一种具有强大数据处理能力和高运算速度的微处理器,以其为核心的嵌入式实时图像采集处理系统越来越受到广泛的关注和应用。基于TMS320DM642处理器设计构建硬件平台,采用JPEG图像压缩编码技术,实现了实时视频采集和处理。重点研究了在TMS320DM642处理器平台上实现对ITU-R BT.656YUV 4∶2∶2视频格式进行JPEG压缩编码的具体方法。并在此基础上,对实验数据进行了分析。 展开更多
关键词 TMS320DM642 视频采集 JPEG编码 熵编码
在线阅读 下载PDF
彩色AMOLED驱动控制系统设计 被引量:4
11
作者 李文明 荆海 马凯 《液晶与显示》 CAS CSCD 北大核心 2007年第5期617-622,共6页
驱动控制电路是展示显示屏优良特性的重要部分,可编程逻辑器件FPGA具有功能灵活性,适合于高性能的视频和图像应用。文章利用液晶驱动芯片,模拟视频解码芯片和Altera公司的低成本CycloneFPGA器件,设计了一种新的针对13.2cm(5.2in)(320... 驱动控制电路是展示显示屏优良特性的重要部分,可编程逻辑器件FPGA具有功能灵活性,适合于高性能的视频和图像应用。文章利用液晶驱动芯片,模拟视频解码芯片和Altera公司的低成本CycloneFPGA器件,设计了一种新的针对13.2cm(5.2in)(320×3×240)彩色有源OLED屏的视频显示驱动控制系统,可以实现各子像素64级灰度显示。详细介绍了系统组成和FPGA各逻辑模块工作原理,并在QuartusⅡ软件开发环境下对各模块进行设计和仿真,仿真结果表明该系统可以实现彩色AMOLED屏的驱动控制。由于FPGA的可编程特性,可方便地设计用于更高分辨率显示屏的驱动控制电路。该系统可作为一种测试OLED显示屏特性的平台。 展开更多
关键词 有源OLED 视频解码 现场可编程门阵列 驱动控制
在线阅读 下载PDF
AVS帧内预测算法及其解码器的硬件实现 被引量:15
12
作者 王争 刘佩林 《计算机工程与应用》 CSCD 北大核心 2006年第19期80-83,共4页
文章介绍了AVS帧内预测解码模块的硬件实现,概述了AVS视频编解码标准的帧内预测技术,重点讨论了AVS帧内预测各模式的算法,并将AVS的帧内预测技术与H.264的帧内预测技术进行了性能比较,分析了AVS帧内预测的算法复杂度,在此基础上设计了AV... 文章介绍了AVS帧内预测解码模块的硬件实现,概述了AVS视频编解码标准的帧内预测技术,重点讨论了AVS帧内预测各模式的算法,并将AVS的帧内预测技术与H.264的帧内预测技术进行了性能比较,分析了AVS帧内预测的算法复杂度,在此基础上设计了AVS帧内预测解码模块的硬件实现,并提出了一种可重构的帧内预测计算单元的实现方法。 展开更多
关键词 AVS视频标准 帧内预测 解码 VERILOG HDL
在线阅读 下载PDF
一种有效的视频数据提取方法 被引量:2
13
作者 齐本胜 付富壮 +1 位作者 杨书生 杨霞 《工矿自动化》 北大核心 2007年第6期27-29,共3页
一般的基于FPGA的视频采集系统中,FPGA与视频解码芯片的连接需要用到较多的FPGA I/O资源。文章介绍了一种新的通过检测SAV信号对视频信号进行定位和采集的方法。该方法只需用到视频数据和像素时钟同步信号即可实现有效的视频提取功能,... 一般的基于FPGA的视频采集系统中,FPGA与视频解码芯片的连接需要用到较多的FPGA I/O资源。文章介绍了一种新的通过检测SAV信号对视频信号进行定位和采集的方法。该方法只需用到视频数据和像素时钟同步信号即可实现有效的视频提取功能,节省了有限的FPGA I/O资源,进一步提高了系统的集成度。仿真结果表明,该方法达到了实时提取视频信号的目的。 展开更多
关键词 视频数据采集 视频解码 FPGA
在线阅读 下载PDF
TFT液晶电视控制电路的设计 被引量:6
14
作者 唐志勇 杨虹 《液晶与显示》 CAS CSCD 2002年第4期286-291,共6页
根据TFTLCD的显示特性 ,利用KS0 1 2 7视频译码器和AL2 5 1视频扫描同步倍频器及单片机 ,设计了转换和控制电路 ,用LCD取代传统的CTR ,实现数字色调驱动系统和电视的显示功能 ,并设计出 2 6 4cm( 1 0 .4in)VGATFT液晶电视的控制卡。叙... 根据TFTLCD的显示特性 ,利用KS0 1 2 7视频译码器和AL2 5 1视频扫描同步倍频器及单片机 ,设计了转换和控制电路 ,用LCD取代传统的CTR ,实现数字色调驱动系统和电视的显示功能 ,并设计出 2 6 4cm( 1 0 .4in)VGATFT液晶电视的控制卡。叙述了硬件电路设计和软件控制方法以及利用单片机实现I2 展开更多
关键词 TFT液晶电视 控制电路 设计 视频译码器 倍频器
在线阅读 下载PDF
基于DSP的MPEG-4视频解码回放 被引量:6
15
作者 董志国 李式巨 《计算机工程与设计》 CSCD 北大核心 2005年第8期1982-1985,共4页
阐述以TMS320C64x为核心的DSP开发板IEKC64为开发工具,实现MPEG-4视频解码回放的方案。探讨了整个解码回放器的软件开发过程和步骤,论述了解码回放主程序的编程思路和说明了应用到的主要接口函数,以及解释解码回放程序的关键代码。对方... 阐述以TMS320C64x为核心的DSP开发板IEKC64为开发工具,实现MPEG-4视频解码回放的方案。探讨了整个解码回放器的软件开发过程和步骤,论述了解码回放主程序的编程思路和说明了应用到的主要接口函数,以及解释解码回放程序的关键代码。对方案的进一步改进和完善提出了建议。 展开更多
关键词 视频解码 MPEG-4 DSP IEKC64
在线阅读 下载PDF
新一代通用视频编码标准H.266/VVC:现状与发展 被引量:6
16
作者 万帅 霍俊彦 +1 位作者 马彦卓 杨付正 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第4期1-17,共17页
相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双... 相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双层码流体系和混合编码框架,针对帧内预测、帧间预测、变换、量化、环路滤波等所有主要编码模块进行了技术革新,并为屏幕内容视频等应用提供了高效的专用编码工具。H.266/VVC标准目前已处于实用化阶段,官方参考软件VTM和开源编解码器VVenC/VVdeC是目前最具代表性的软件编解码实现。对H.266/VVC的性能分析可以看出:H.266/VVC针对高分辨率视频取得的编码增益更为突出;主要编码工具对性能的贡献通常以复杂度为代价,但也有部分编码工具在提升编码性能的同时可降低整体编码复杂度。H.266/VVC的硬件实现面临诸多挑战,发展明显滞后于软件实现,现有研究主要集中在对具体编码模块的硬件加速方面。H.266/VVC标准发布之后,下一代视频编码标准的发展目前仍围绕混合编码框架进行探索,聚焦在两大方向:超越VVC的增强压缩关注更为先进的、非神经网络的编码工具,基于神经网络的视频编码则探索采用神经网络的编码工具。除此之外,部分或完全跳出现有混合编码框架的端到端视频编码也在飞速发展,未来视频编码标准与神经网络结合成为趋势,但面临着计算资源依赖和稳定结构两方面的考验。 展开更多
关键词 H.266/VVC标准 视频编码标准 编码模块 编解码器 神经网络
在线阅读 下载PDF
基于BREW手机的移动监控客户端设计 被引量:3
17
作者 王超 郑培元 +1 位作者 卜佳俊 杨智 《计算机工程与设计》 CSCD 北大核心 2010年第7期1401-1404,1428,共5页
为了在CDMA1X移动网络和BREW手机上设计和实现用于移动平台的监控客户端,在利用现有的流媒体和视频编解码等监控技术的基础上,综合考虑了移动网络带宽不足和移动设备性能较低等因素,讨论了在移动平台上实现视频监控的相关关键技术,提出... 为了在CDMA1X移动网络和BREW手机上设计和实现用于移动平台的监控客户端,在利用现有的流媒体和视频编解码等监控技术的基础上,综合考虑了移动网络带宽不足和移动设备性能较低等因素,讨论了在移动平台上实现视频监控的相关关键技术,提出了在网络不稳定的情况下对视频包丢失的处理流程,以及H.264解码器针对BREW平台的优化方法。测试结果表明,实现的移动监控客户端可以稳定播放比较清晰的监控视频,并且具有较高的实时性。 展开更多
关键词 移动监控 移动网络 无线二进制运行环境 流媒体 实时传输协议 H.264视频解码器
在线阅读 下载PDF
Android中的多媒体技术应用开发与研究 被引量:4
18
作者 关晶鑫 李永全 《桂林理工大学学报》 CAS 北大核心 2013年第3期542-546,共5页
叙述了Android的架构、基本组件及其多媒体系统。通过简易视频播放器应用程序的例子对Android多媒体技术的应用进行了演示,介绍了Android多媒体技术应用开发的基本方法。
关键词 ANDROID 多媒体 视频播放器
在线阅读 下载PDF
MPEG-2 解码中的音视频同步及其实时实现 被引量:2
19
作者 虞正华 余松煜 楚明 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第9期100-102,共3页
音视频同步是MPEG-2实时解码实现的难点.讨论了MPEG-2的音视频同步模型,提出了一种适于实时解码的MPEG-2音视频同步算法,给出了同步的判断准则和实际的处理过程.对于不同的失步类型,采取跳帧或重复一帧的纠正措... 音视频同步是MPEG-2实时解码实现的难点.讨论了MPEG-2的音视频同步模型,提出了一种适于实时解码的MPEG-2音视频同步算法,给出了同步的判断准则和实际的处理过程.对于不同的失步类型,采取跳帧或重复一帧的纠正措施.采用中断方式实现解码芯片与主控芯片的通信,主控芯片建立PTS表并判断是否同步,在失步时控制解码芯片采取纠正措施.这种音视频同步算法已经成功地应用于作者研制的高清晰度电视(HDTV)信源解码功能样机中.实验表明,它能够准确、可靠地实现音视频同步. 展开更多
关键词 图象解码 音视频同步 高清晰度电视 MPEG-2 解码
在线阅读 下载PDF
一种便携型彩色液晶电视的设计与制作 被引量:5
20
作者 李强华 朱韶伟 黄昌华 《液晶与显示》 CAS CSCD 北大核心 2006年第3期270-273,共4页
在分析研究液晶电视的调谐器、中频放大电路、音视频解码电路、液晶行列驱动电路、液晶屏和电源等部分的基础上,对其核心部分液晶显示器升压电路、调谐电压电路设计方案进行优化,将视频解码电路进行合理布局和调试,提出了驱动电压转换以... 在分析研究液晶电视的调谐器、中频放大电路、音视频解码电路、液晶行列驱动电路、液晶屏和电源等部分的基础上,对其核心部分液晶显示器升压电路、调谐电压电路设计方案进行优化,将视频解码电路进行合理布局和调试,提出了驱动电压转换以及NTSC制改为PAL制的改制方法。用TFT液晶屏作显示器,同时为了与液晶显示器重量轻、耗电少的优势相配合,在电源的选择上,抛弃传统的变压器降压方式,采用开关电源供电,降低了功耗,体积和重量大大地减小,研制出一台具有较高收视性能的彩色液晶电视。 展开更多
关键词 液晶电视 TFT液晶屏 背光源 视频解码 驱动电路
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部