期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于S-YOLO V5和Vision Transformer的视频内容描述算法
被引量:
1
1
作者
徐鹏
李铁柱
职保平
《印刷与数字媒体技术研究》
CAS
北大核心
2023年第4期212-222,共11页
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于...
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。
展开更多
关键词
视频内容描述
S-YOLO
V5
Vision
Transformer
多头注意力
在线阅读
下载PDF
职称材料
模拟IC设计中性能参数的几何规划法建模
2
作者
徐鹏
李铁柱
职保平
《核电子学与探测技术》
CAS
北大核心
2023年第3期444-451,共8页
探讨了基于几何规划法的模拟集成电路优化设计中性能参数的建模方法。该方法利用间接拟合法计算电路性能的一组样本,对采样得到的性能数据拟合为一个二阶多项式模板模型并进行近似处理,使其成为正项式模型;然后利用直接拟合法,采用一种...
探讨了基于几何规划法的模拟集成电路优化设计中性能参数的建模方法。该方法利用间接拟合法计算电路性能的一组样本,对采样得到的性能数据拟合为一个二阶多项式模板模型并进行近似处理,使其成为正项式模型;然后利用直接拟合法,采用一种约束最小化算法将正项式拟合问题构建为一个单目标凸优化问题来拟合所需的正项式模型;实验结果表明,该建模方法不仅在模型生成时间、系数个数和稀疏性方面具有较好的性能,而且在生成模型质量方面也优于常用的多项式建模技术。
展开更多
关键词
核电子技术
模拟集成电路
性能建模
几何规划法
拟合
正项式
模型生成
偏差
在线阅读
下载PDF
职称材料
题名
基于S-YOLO V5和Vision Transformer的视频内容描述算法
被引量:
1
1
作者
徐鹏
李铁柱
职保平
机构
黄河水利职业
技术
学院信息
工程
学院
河南大学计算机与信息
工程
学院
开封市虚拟现实应用工程技术研究中心
出处
《印刷与数字媒体技术研究》
CAS
北大核心
2023年第4期212-222,共11页
基金
国家自然科学基金青年项目——基于原型观测的水电机组-厂房结构振动传递路径识别研究(No.51709125)
河南省科技攻关项目——概率-区间混合不确定的渡槽抗震可靠性研究——以沙河为例(No.212102310479)。
文摘
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。
关键词
视频内容描述
S-YOLO
V5
Vision
Transformer
多头注意力
Keywords
Video content description
S-YOLO V5
Vision Transformer
Multi-head attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
模拟IC设计中性能参数的几何规划法建模
2
作者
徐鹏
李铁柱
职保平
机构
黄河水利职业
技术
学院
开封市虚拟现实应用工程技术研究中心
河南大学计算机与信息
工程
学院
出处
《核电子学与探测技术》
CAS
北大核心
2023年第3期444-451,共8页
基金
国家自然科学基金青年基金(51709125)
河南省科技攻关项目(212102310479)资助。
文摘
探讨了基于几何规划法的模拟集成电路优化设计中性能参数的建模方法。该方法利用间接拟合法计算电路性能的一组样本,对采样得到的性能数据拟合为一个二阶多项式模板模型并进行近似处理,使其成为正项式模型;然后利用直接拟合法,采用一种约束最小化算法将正项式拟合问题构建为一个单目标凸优化问题来拟合所需的正项式模型;实验结果表明,该建模方法不仅在模型生成时间、系数个数和稀疏性方面具有较好的性能,而且在生成模型质量方面也优于常用的多项式建模技术。
关键词
核电子技术
模拟集成电路
性能建模
几何规划法
拟合
正项式
模型生成
偏差
Keywords
nuclear electronic technology
analog integrated circuit
performance modeling
geometric programming technology
fitting
posynomial
model generation
deviation
分类号
TN402 [电子电信—微电子学与固体电子学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于S-YOLO V5和Vision Transformer的视频内容描述算法
徐鹏
李铁柱
职保平
《印刷与数字媒体技术研究》
CAS
北大核心
2023
1
在线阅读
下载PDF
职称材料
2
模拟IC设计中性能参数的几何规划法建模
徐鹏
李铁柱
职保平
《核电子学与探测技术》
CAS
北大核心
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部