期刊文献+
共找到1,168篇文章
< 1 2 59 >
每页显示 20 50 100
AVariablebitrateVideoCodingSchemeBasedonMorphologicalOperationsforATMNetworks
1
作者 ChenHuifang DaiWenqi 《通信学报》 EI CSCD 北大核心 1998年第5期84-89,共6页
AVariablebitrateVideoCodingSchemeBasedonMorphologicalOperationsforATMNetworksChenHuifangDaiWenqiQiuPeiliang(... AVariablebitrateVideoCodingSchemeBasedonMorphologicalOperationsforATMNetworksChenHuifangDaiWenqiQiuPeiliang(InstituteofInfo... 展开更多
关键词 视频编码 ATM网络 异步传输网 多位率 数学形态操作
在线阅读 下载PDF
基于独立循环神经网络的分层视频摘要算法 被引量:1
2
作者 任喜伟 刘艳 +3 位作者 肖曼 贾事端 王瑞 何立风 《液晶与显示》 北大核心 2025年第8期1233-1241,共9页
针对现有视频摘要算法忽略镜头信息导致活动完整性受损以及传统RNN和LSTM在处理长视频时难以有效捕捉长距离依赖的问题,本文利用视频序列底层层次结构提出了一种基于IndRNN的分层视频摘要算法(HIRVS)。HIRVS可以分为3部分:(1)利用IndRN... 针对现有视频摘要算法忽略镜头信息导致活动完整性受损以及传统RNN和LSTM在处理长视频时难以有效捕捉长距离依赖的问题,本文利用视频序列底层层次结构提出了一种基于IndRNN的分层视频摘要算法(HIRVS)。HIRVS可以分为3部分:(1)利用IndRNN网络生成每个镜头的视觉特征,输出的最后隐藏状态是镜头内所有帧特征的时序加权聚合;(2)利用双向IndRNN镜头级特征序列进行时序关系建模,捕捉镜头间的长程依赖关系;(3)引入自注意力视频编码器提取视频中的全局依赖关系。最后,预测视频镜头的重要性分数,以此选取关键镜头生成视频摘要。实验在两个公共数据集SumMe和TvSum上进行,在SumMe数据集上F分数达到51.0%,较VOGNet提升了1.2%;在TVSum数据集上F分数达到61.3%,较当前最优方法 VJMHT提升了0.3%。实验结果验证了HIRVS在视频摘要任务中的有效性,提高了摘要生成效率。 展开更多
关键词 视频摘要 独立循环神经网络 分层结构 自注意力网络
在线阅读 下载PDF
短视频过度使用及注意力不集中与初中生拒学行为的关系 被引量:2
3
作者 李幼东 王建强 +4 位作者 王紫妍 刘久楹 吕晶 葛怡然 杜玉茹 《中国心理卫生杂志》 北大核心 2025年第1期49-56,共8页
目的:探讨初中生短视频过度使用、注意力不集中与拒学行为的显要表现及内在关联。方法:选取1 106名在校初中生进行调查,采用短视频APP过度使用量表、注意力缺陷多动障碍评定量表的注意力不集中维度、拒绝上学行为问卷评估短视频过度使... 目的:探讨初中生短视频过度使用、注意力不集中与拒学行为的显要表现及内在关联。方法:选取1 106名在校初中生进行调查,采用短视频APP过度使用量表、注意力缺陷多动障碍评定量表的注意力不集中维度、拒绝上学行为问卷评估短视频过度使用程度、注意力不集中、拒学行为。采用R语言网络分析工具包评估单个网络的核心节点和共存网络的桥梁节点,比较不同性别和年级的网络结构差异。结果:短视频过度使用、注意力不集中、拒学行为网络的核心节点分别为“使用短视频会增强与他人的联系”(预期影响值=1.03)、“容易分心”(预期影响值=1.99)、“学校疏离”(预期影响值=0.83)。共存网络的桥梁节点为“违抗行为”(桥预期影响值=0.69)、“难以从事持续性的脑力活动”(桥预期影响值=0.47)。网络结构差异分析发现,初一、初二、初三学生共存网络的核心节点分别为“因使用短视频而停止做其他事”“违抗行为”“学习能力”。结论:初中生短视频过度使用、注意力不集中、拒学行为的显要表现分别为使用短视频会增强与他人的联系、容易分心、学校疏离;三者共存时最重要的影响因素为违抗行为、难以从事持续性的脑力活动。 展开更多
关键词 短视频过度使用 注意力不集中 拒绝上学行为 初中生 网络分析
在线阅读 下载PDF
基于MR-VOD的神农架林区野生动物视频检测 被引量:1
4
作者 眭海刚 魏天怡 +2 位作者 胡烈云 杨敬元 马国飞 《野生动物学报》 北大核心 2025年第1期1-13,共13页
红外相机视频是野生动物调查的主流研究方法之一,但在林区受设备角度、复杂环境与野生动物活动的随机性影响,极易出现检测中光流捕捉错误或简单语义难以识别的情况。针对此类问题,提出一种基于多帧关系网络特征增强的视频目标检测方法(m... 红外相机视频是野生动物调查的主流研究方法之一,但在林区受设备角度、复杂环境与野生动物活动的随机性影响,极易出现检测中光流捕捉错误或简单语义难以识别的情况。针对此类问题,提出一种基于多帧关系网络特征增强的视频目标检测方法(multi-relation video object detection,MR-VOD)。该算法在图像关系网络的基础上,综合考虑上下帧目标之间的关系,通过多阶段推理,实现对野生动物目标的准确检测。同时,以神农架林区野生动物红外相机视频为基础,构建相关野生动物视频目标检测数据样本集作为实验区。试验证明,改进后的算法检测性能有所提升,平均准确率达81.96%,比Faster R-CNN提高9.32个百分点,在川金丝猴(Rhinopithecus roxellana)的检测上提升30.79个百分点,并在多种复杂场景下测试表现良好,有效减少了错检漏检的情况。该算法的实现将为神农架野生动物智能监测云平台提供检测基础,同时为后续开展的野生动物保护、种群评估提供必要的技术支撑。 展开更多
关键词 关系网络 视频目标检测 野生动物 复杂环境 特征增强
在线阅读 下载PDF
面向VVC的QP自适应环路滤波器
5
作者 刘鹏宇 金鹏程 《北京工业大学学报》 北大核心 2025年第10期1171-1178,共8页
现有的基于卷积神经网络(convolutional neural network,CNN)的环路滤波器倾向于将多个网络应用于不同的量化参数(quantization parameter,QP),消耗训练模型中的大量资源,并增加内存负担。针对这一问题,提出一种基于CNN的QP自适应环路... 现有的基于卷积神经网络(convolutional neural network,CNN)的环路滤波器倾向于将多个网络应用于不同的量化参数(quantization parameter,QP),消耗训练模型中的大量资源,并增加内存负担。针对这一问题,提出一种基于CNN的QP自适应环路滤波器。首先,设计一个轻量级分类网络,按照滤波难易程度将编码树单元(coding tree unit,CTU)划分为难、中、易3类;然后,构建3个融合了特征信息增强融合模块的基于CNN的滤波网络,以满足不同QP下的3类CTU滤波需求。将所提出的环路滤波器集成到多功能视频编码(versatile video coding,VVC)标准H.266/VVC的测试软件VTM 6.0中,替换原有的去块效应滤波器(deblocking filter,DBF)、样本自适应偏移(sample adaptive offset,SAO)滤波器和自适应环路滤波器。实验结果表明,该方法平均降低了3.14%的比特率差值(Bjøntegaard delta bit rate,BD-BR),与其他基于CNN的环路滤波器相比,显著提高了压缩效率,并减少了压缩伪影。 展开更多
关键词 视频编码 多功能视频编码(versatile video coding VVC)标准 环路滤波 卷积神经网络(convolutional neural network CNN) 深度学习 图像去噪
在线阅读 下载PDF
一种3D可变形卷积结合Transformer的视频压缩感知方法
6
作者 杜秀丽 朱金耀 +2 位作者 高星 吕亚娜 邱少明 《计算机科学》 北大核心 2025年第11期150-156,共7页
面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有... 面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有待进一步提高。随着深度学习技术的引入,基于深度学习的分布式视频压缩感知给视频压缩感知重构提供了新思路。因此,结合3D可变形卷积与Transformer构建CS3Dformer网络,利用3D可变形卷积捕获视频的局部特征和时空特征的有效性,学习视频帧间的时空特征;同时,利用Transformer捕获长距离依赖特征的优点,一定程度上弥补了卷积神经网络方法在捕获图像的非局部相似性方面的缺陷,能更好地实现对视频的建模。所提方法是一种端到端的视频压缩感知方法,在多个数据集上的实验结果验证了该方法的有效性。 展开更多
关键词 压缩感知 视频重构 可变形卷积 TRANSFORMER 卷积神经网络
在线阅读 下载PDF
融合关键区域信息的双流网络视频表情识别
7
作者 孔英会 崔文婷 +1 位作者 张珂 车辚辚 《智能系统学报》 北大核心 2025年第3期658-669,共12页
人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息... 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间-时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间-时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE'05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 展开更多
关键词 视频表情识别 双流网络 注意力机制 光流 卷积神经网络 掩模 特征融合 面部表情识别
在线阅读 下载PDF
鸽子MVL核团对视频迁移实物目标识别的神经表征
8
作者 李晓媛 任立庆 +2 位作者 刘登辉 李贺 程涵 《郑州大学学报(工学版)》 北大核心 2025年第4期1-7,共7页
为探究鸽子基于视频学习迁移实物目标识别的神经机制,设计了目标导向式训练系统。首先,通过行为学对比发现,经视频训练的鸽子在实物迁移测试中正确率显著高于对照组,验证了鸽子具有视觉认知迁移能力。其次,利用微电极记录鸽子MVL核团的... 为探究鸽子基于视频学习迁移实物目标识别的神经机制,设计了目标导向式训练系统。首先,通过行为学对比发现,经视频训练的鸽子在实物迁移测试中正确率显著高于对照组,验证了鸽子具有视觉认知迁移能力。其次,利用微电极记录鸽子MVL核团的神经信号,基于Welch功率谱分析得到视觉识别任务的特征响应频带,并通过锁相值构建脑功能网络。结果表明:在视频和实物识别中,目标与干扰状态下的脑网络平均节点度、聚类系数和全局效率均存在显著差异;但视频目标与实物目标,视频干扰与实物干扰的网络特征无差异,这表明MVL核团通过提取视频与实物的共有特征实现跨模式迁移,揭示了MVL脑区在视觉认知迁移学习中的关键作用。 展开更多
关键词 视频学习 视觉认知迁移学习 MVL核团 锁相值 脑功能网络
在线阅读 下载PDF
自监督短期兴趣特征增强的短视频推荐方法研究
9
作者 刘芳 王晓晖 +3 位作者 田枫 赵玲 黄美晨 孙嘉伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第6期91-99,共9页
现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term in... 现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term interest feature enhancement,SSER)。该模型采用自监督的对比学习方法对用户长短期兴趣进行解纠缠,针对短期兴趣表示提取不完全的问题,提出采用扩展循环神经网络(dilated RNN)从非线性的用户交互序列中有效捕捉用户短期兴趣表示;针对短期兴趣代理提取不完全的问题,提出一种多头自注意力机制的短期兴趣代理增强方式,该方式首先使用自注意力机制对短期交互序列嵌入数据进行噪声消除,随后融合从用户序列中提取的短期兴趣普遍特征和突出特征形成融合向量,采用多头自注意力机制从融合向量中提取短期兴趣代理,从而有效增强短期兴趣代理的提取。在KuaiRec短视频数据集上进行了多项实验,结果表明该模型在多个评价指标上优于其他主流方法。 展开更多
关键词 自监督对比学习 短期兴趣特征增强 短视频推荐 扩展循环神经网络 多头自注意力机制
在线阅读 下载PDF
面向运动前景区域的视频异常检测
10
作者 潘理虎 彭守信 +2 位作者 张睿 薛之洋 毛旭珍 《计算机应用》 北大核心 2025年第4期1300-1309,共10页
静态背景信息和运动前景对象的数据分布不平衡通常会引起发生异常的前景区域信息学习不充分问题,进而影响视频异常检测(VAD)的精度。为了解决上述问题,提出一种用于VAD的嵌套U型帧预测生成对抗网络(NUFP-GAN)方法。所提方法使用具有突... 静态背景信息和运动前景对象的数据分布不平衡通常会引起发生异常的前景区域信息学习不充分问题,进而影响视频异常检测(VAD)的精度。为了解决上述问题,提出一种用于VAD的嵌套U型帧预测生成对抗网络(NUFP-GAN)方法。所提方法使用具有突出视频帧中显著目标能力的嵌套U型帧预测网络架构作为帧预测模块,并在判别阶段设计一个自注意力补丁判别器,应用不同大小的感受野提取视频帧中更重要的外观和运动特征,以提升异常检测的准确性。此外,为保证预测帧和真实帧在高级语义信息上的多尺度特征一致性,引入多尺度一致性损失,以进一步提升方法的异常检测效果。实验结果表明,所提方法在CUHK Avenue、UCSD Ped1、UCSD Ped2和ShanghaiTech数据集上的曲线下面积(AUC)值分别达到了87.6%、85.2%、96.0%和73.3%;与MAMC(Memoryenhanced Appearance-Motion Consistency)方法相比,所提方法在ShanghaiTech数据集上的AUC值提升了1.8个百分点。可见,所提方法能够有效应对VAD中数据分布不平衡带来的挑战。 展开更多
关键词 深度学习 视频异常检测 生成对抗网络 未来帧预测 无监督学习
在线阅读 下载PDF
参数高效化微调的双分支视频动作识别方法
11
作者 王小伟 沈燕飞 邢庆君 《河南理工大学学报(自然科学版)》 北大核心 2025年第4期21-28,共8页
目的面向视频的AI智慧体育对于个性化训练、定制化运动分析具有重要的现实价值。现有的视频动作分析框架依赖于“预训练-微调”的范式将图像预训练模型迁移到视频时序建模中,然而,随着模型尺寸和预训练规模的不断扩大,一方面直接微调需... 目的面向视频的AI智慧体育对于个性化训练、定制化运动分析具有重要的现实价值。现有的视频动作分析框架依赖于“预训练-微调”的范式将图像预训练模型迁移到视频时序建模中,然而,随着模型尺寸和预训练规模的不断扩大,一方面直接微调需更新全部参数导致计算成本高昂,另一方面难以基于图像大模型实现视频时空特征的建模。方法为此,提出一种基于大规模图像预训练模型的双分支视频动作识别框架TBN(two branch network),其包含时空解耦的双分支架构,分别处理静态背景特征和时序动态动作特征。在迁移中,预训练权重保持冻结,仅通过对额外增加的Prompt和Adaptor中的少量参数进行训练,实现从图像预训练模型到视频时序建模的参数高效化迁移。此外,针对现有基准数据集在高速运动场景的不足,构建一个大规模体育运动数据集Kinetics-Sports,包含42个运动类别(含篮球、滑冰、跨栏等),提供更严格的测试基准。结果在Kinetics-Sports,UCF101和HDBM51数据集上的实验结果表明,提出的方法在3个数据集上的识别准确率分别达到97.8%,78.0%,74.2%,优于目前几个数据集上最先进的方法,且参数量仅有12 MB,计算复杂度低于现有主流算法。结论提出的模型在精度-效率方面取得了更好的平衡,提升了体育运动动作检测的准确率和推理效率,为视觉大模型视频迁移提供了高效解决方案。 展开更多
关键词 视频动作识别 预训练模型 参数高效化微调 双分支网络 时空建模
在线阅读 下载PDF
融合U-net网络的纯卷积视频预测模型 被引量:1
12
作者 谢玉枚 蔡远利 +2 位作者 高海燕 关翔锋 唐伟强 《西安交通大学学报》 北大核心 2025年第6期112-121,共10页
为了解决基于深度学习视频预测中存在的时空特征提取不充分以及图像细节保留不足的问题,运用简单视频预测网络模型SimVP给出的Inception单元,提出了一种融合U-net网络的纯卷积视频预测模型(CUnet)。CUnet模型由3个核心模块组成:首先,Cel... 为了解决基于深度学习视频预测中存在的时空特征提取不充分以及图像细节保留不足的问题,运用简单视频预测网络模型SimVP给出的Inception单元,提出了一种融合U-net网络的纯卷积视频预测模型(CUnet)。CUnet模型由3个核心模块组成:首先,Cell模块采用2D卷积层来提取空间特征,并将这些特征输入至多个Inception单元捕获时空特性;其次,DeCell模块通过Inception单元捕获时空特征,并借助2D反卷积层进行上采样操作,恢复图像原始尺寸;最后,引入U-net作为主干网络,将Cell模块和DeCell模块有机整合,有效保留了图像的细节信息,实现了高质量的图像重建。实验结果表明:在TaxiBJ数据集上,与当前表现最佳的时间注意力单元网络模型TAU相比,CUnet模型的预测精度提高了5.23%;在Human3.6M数据集上,与当前表现最佳的快速傅里叶Inception网络模型FFINet相比,CUnet模型的预测精度提高了12.88%。CUnet模型具有优秀的预测能力,可为纯卷积神经网络模型在视频预测领域的应用提供有益探索。 展开更多
关键词 深度学习 视频预测 时空特征 U-net网络 纯卷积神经网络
在线阅读 下载PDF
基于边缘计算的工业视频网络智能感知:挑战与进展 被引量:1
13
作者 涂静正 温晓婧 +1 位作者 陈彩莲 关新平 《自动化学报》 北大核心 2025年第8期1715-1738,共24页
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络,是实现工业网络系统泛在感知的重要基石.通过支持边缘计算层和现场设备层之间的交互和物联,工业视频网络将独立的视觉传感器单元无线连接、边缘处理,以实现空间分散下的协... 工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络,是实现工业网络系统泛在感知的重要基石.通过支持边缘计算层和现场设备层之间的交互和物联,工业视频网络将独立的视觉传感器单元无线连接、边缘处理,以实现空间分散下的协作监控和精确感知.它具有感知维度高,网络动态性强,感知与传输、计算、存储紧密耦合等突出特性.如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析,是这类系统研究的新挑战.本文首先简述工业视频网络的定义和主要特征;其次分析工业视频网络智能感知面临的挑战和关键问题;然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展;最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望. 展开更多
关键词 工业网络系统 工业视频网络 智能感知 边缘计算 多目标跟踪
在线阅读 下载PDF
电视胸腔镜手术患者术前药物相关问题评价及影响因素分析 被引量:1
14
作者 刘英坤 庞宁 +5 位作者 马超群 樊榕榕 刘一 刘彦国 黄琳 张晓红 《医药导报》 北大核心 2025年第5期764-770,共7页
目的对胸外科接受电视胸腔镜手术(VATS)的患者术前药物相关问题(DRPs)进行评价并分析影响因素。方法纳入2023年3月1日—5月31日接受VATS且至少存在1种合并症的患者,临床药师采用欧洲医药保健网(PCNE)分类系统(V 9.1)对DRPs进行评价,并... 目的对胸外科接受电视胸腔镜手术(VATS)的患者术前药物相关问题(DRPs)进行评价并分析影响因素。方法纳入2023年3月1日—5月31日接受VATS且至少存在1种合并症的患者,临床药师采用欧洲医药保健网(PCNE)分类系统(V 9.1)对DRPs进行评价,并分析发生(或潜在)DRPs的影响因素。结果共纳入患者300例,其中174例共涉及DRPs 200次。最常见的DRPs是治疗安全性问题(47.50%),其次是治疗有效性问题(46.00%)和其他问题(6.50%)。产生问题原因最多的是药物选择原因(33.83%),其次是其他原因(33.33%)和患者相关原因(19.90%)。针对DRPs进行了367次干预,干预手段最多的是药物层面(55.86%),其次是医生层面(39.24%)和患者层面(3.54%)。最终96.00%的干预方案被接受,86.50%的问题得到全部解决。合并症、用药品种数、身体质量指数(BMI)、住院时间在发生DRPs组与未发生DRPs组间差异有统计学意义(P<0.05)。多因素分析结果显示:合并症、用药品种数、BMI是胸外科VATS患者术前发生(或潜在)DRPs的独立危险因素(OR>1,P<0.05)。结论临床药师使用PCNE分类系统可有效评价胸外科VATS患者术前DRPs,合并症、用药品种数、BMI是术前DRPs发生的影响因素。临床实践中应重点关注这些影响因素,以优化治疗策略,减少DRPs发生。 展开更多
关键词 药物相关问题 电视胸腔镜手术 欧洲医药保健网分类系统
在线阅读 下载PDF
基于注意力机制的多用户全景视频视口预测 被引量:1
15
作者 张汉琦 黄聪宇 +2 位作者 王晶 李知禹 杨立东 《信号处理》 北大核心 2025年第2期302-311,共10页
近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当... 近年来,随着虚拟现实等沉浸式技术的发展,全景视频技术的应用前景也在逐步扩展。全景视频提供了逼真的沉浸式体验,但同时也给网络带宽带来了极大的传输压力。因此,如何降低其传输带宽成为了研究的焦点,视口预测则是该领域的研究热点。当前,主流的视口预测方案多是利用观看者的视点轨迹和画面内容,结合神经网络输出结果,并进行评估。现有的方法大多不能在长时间预测取得较好的效果,且没有充分利用多用户场景下的数据。为此,本文借鉴了目前流行的Transformer网络中的注意力机制,提出了一种在多用户场景下预测未来较长时间视口的方案。由于不同用户在观看同一视频的视点轨迹具有相似性,本文首先提出了一种多用户视口轨迹相似性比较方案,该方案利用目标用户的视口轨迹数据和历史用户的视口轨迹数据预测目标用户未来视口轨迹数据。其次,由于全景视频视口轨迹存在着不连续性,本文对不连续视口轨迹进行映射处理来解决单次预测轨迹数据不连续的问题,在实验中使用此方法处理数据集的效果较好。最后,本文通过实验对比了两个近年提出的具有相似输出的模型,结果显示本文提出的全景视频预测算法在平均绝对误差、曼哈顿距离以及本文提出的角度距离误差指标下有所减少,部分指标减少超过10%。这说明本文提出的方案能在较长时间视口预测取得更高的精度,引入注意力机制和多用户相似性比较有助于提升模型性能和泛化能力。 展开更多
关键词 全景视频 虚拟现实 视口预测 显著图 注意力机制 神经网络
在线阅读 下载PDF
短视频对老年人生活质量的影响——基于社会网络视角 被引量:3
16
作者 张驰 向晶 《西安交通大学学报(社会科学版)》 北大核心 2025年第1期186-196,共11页
基于社会网络视角,利用2020年中国家庭追踪调查数据考察短视频对老年人生活质量的影响,并探讨其内在机制。研究发现:(1)使用短视频能够显著提升老年人的生活质量,即使用短视频的老年人拥有更高的自评健康水平和主观幸福感以及更低的抑... 基于社会网络视角,利用2020年中国家庭追踪调查数据考察短视频对老年人生活质量的影响,并探讨其内在机制。研究发现:(1)使用短视频能够显著提升老年人的生活质量,即使用短视频的老年人拥有更高的自评健康水平和主观幸福感以及更低的抑郁程度;(2)短视频通过维系代际间的情感关系、增进老年人社会参与抑制老年人社会网络的衰退,从而起到改善老年人生活质量的作用;(3)社区层面的老年人服务、活动设施能为老年人参与社区活动提供便利与支撑,促进社会网络机制发挥更大作用;(4)短视频的使用效果存在显著的城乡异质性,这种异质性有利于缓解城乡老年人精神状态的差距,但有进一步加剧城乡老年人身体健康差距的风险。在弥合“数字鸿沟”、促使更多老年人享受“数字红利”的同时,应积极推动线上与线下养老的互补融合,合理配置城乡间的医疗、养老等公共资源。 展开更多
关键词 短视频 老年人 积极老龄化 数字生活 公共服务 生活质量 社会网络
在线阅读 下载PDF
基于动态嵌入特征的鲁棒半监督视频目标分割 被引量:1
17
作者 陈亚当 赵翊冰 吴恩华 《北京航空航天大学学报》 北大核心 2025年第7期2253-2261,共9页
针对半监督视频目标分割(VOS)方法存在推理时内存占用不断增加及仅依赖低级像素特征训练困难的问题,提出一种基于动态嵌入特征和辅助损失函数的半监督视频目标分割方法。使用动态嵌入特征建立恒定大小的记忆库;通过时空聚合方法,利用历... 针对半监督视频目标分割(VOS)方法存在推理时内存占用不断增加及仅依赖低级像素特征训练困难的问题,提出一种基于动态嵌入特征和辅助损失函数的半监督视频目标分割方法。使用动态嵌入特征建立恒定大小的记忆库;通过时空聚合方法,利用历史信息生成和更新动态嵌入特征;使用内存更新感应器来自适应控制记忆库的更新间隔,适应不同视频的运动模式;使用辅助损失函数,在高级语义特征层面上给网络提供辅助指导,并通过在多重特征层面多方面指导,提高模型精度和训练效率;针对视频前背景中相似目标误匹配的问题,设计一种时空约束模块,以利用视频的时间连续性特性更好地捕获前一帧掩码信息与当前帧之间的关联。实验结果表明:所提方法在DAVIS 2017验证集上达到84.5%J&F的精度,在YouTube-VOS 2019验证集达到82.4%J&F的精度。 展开更多
关键词 视频目标分割 时空记忆网络 时空约束 内存更新感应 动态嵌入特征
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
18
作者 贾克斌 吴岳珩 《北京工业大学学报》 北大核心 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
基于图神经网络的多模态长尾微视频推荐算法
19
作者 罗晨 游进国 +1 位作者 万小容 李晓武 《计算机应用研究》 北大核心 2025年第11期3363-3369,共7页
现有的多模态图神经网络微视频推荐算法,对于交互度数高的项目节点,其中多模态特征包含的信息会随着图卷积的过程而被增强;但对于交互度数低的项目节点,其信息则会被削弱,这便带来了长尾问题。针对此问题,提出了基于图神经网络的多模态... 现有的多模态图神经网络微视频推荐算法,对于交互度数高的项目节点,其中多模态特征包含的信息会随着图卷积的过程而被增强;但对于交互度数低的项目节点,其信息则会被削弱,这便带来了长尾问题。针对此问题,提出了基于图神经网络的多模态长尾微视频推荐算法(MLT-GNN)。该算法提出了一种偏好信息共享概念,对用户历史交互中的头项目节点和尾项目节点之间的关联进行建模,来发现在不同模态下不同项目中蕴涵的相同信息;为缓解用户-项目图中尾项目节点信息丢失问题,该算法从交互丰富的头项目节点中发现尾项目节点所需信息,结合注意力机制对其进行信息弥补,减小头尾项目节点的差距。在MovieLens和Tiktok两个公开微视频数据集上的实验表明,MLT-GNN算法在precision、recall和NDCG指标上分别实现了至少3.18%、5.27%和6.29%的提升,验证了该算法在改善长尾项目节点对用户偏好预测贡献度方面的有效性。 展开更多
关键词 多模态推荐系统 长尾问题 图神经网络 微视频 注意力机制
在线阅读 下载PDF
基于时空双分支注意力的视频语义分割
20
作者 黄丹丹 王一雯 +3 位作者 陈广秋 胡奇 于斯宇 崔志瑜 《计算机辅助设计与图形学学报》 北大核心 2025年第1期129-138,共10页
视频语义分割广泛应用在自动驾驶、交通管理、无人机驾驶等方面.针对视频语义分割中由于分割结果不精确和分割时间过长导致不能达到实时性等问题,提出基于时空双分支注意力机制的记忆网络分割算法.该算法由记忆存储模块、特征整合模块... 视频语义分割广泛应用在自动驾驶、交通管理、无人机驾驶等方面.针对视频语义分割中由于分割结果不精确和分割时间过长导致不能达到实时性等问题,提出基于时空双分支注意力机制的记忆网络分割算法.该算法由记忆存储模块、特征整合模块和时空双分支注意力模块3部分构成.其中,记忆存储模块存储历史帧特征信息和序列时间信息;特征整合模块引用大核分解卷积,在不增加计算量的基础上扩大卷积感受野,很好地捕获长距离依赖信息和上下文信息,达到信道压缩和特征缩减的作用;时空双分支注意力模块捕捉相邻帧中同一物体的特征信息并进行特征融合,利用视频帧时序性提高分割精度.在公开数据集Cityscapes和CamVid上的实验结果表明,所提算法的平均交并比分别达到76.92%和73.68%,计算速度达到38帧/s;与其他视频语义分割算法相比,该算法的分割精度和计算效率达到最优状态. 展开更多
关键词 视频语义分割 记忆网络 注意力机制 特征融合
在线阅读 下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部