1
|
基于交叉注意力与语义感知的视频内容描述 |
张晶
周凯
吴文涛
|
《印刷与数字媒体技术研究》
北大核心
|
2025 |
0 |
|
2
|
基于S-YOLO V5和Vision Transformer的视频内容描述算法 |
徐鹏
李铁柱
职保平
|
《印刷与数字媒体技术研究》
CAS
北大核心
|
2023 |
1
|
|
3
|
基于ViT与语义引导的视频内容描述生成 |
赵宏
陈志文
郭岚
安冬
|
《计算机工程》
CAS
CSCD
北大核心
|
2023 |
2
|
|
4
|
iMakeup:特定领域的大规模长视频数据集——用于细粒度视频语义内容描述 |
林霄竹
金琴
陈师哲
|
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
|
2019 |
1
|
|
5
|
基于MPEG-7标准的视频描述 |
汤义
李国辉
倪泞
|
《计算机工程与科学》
CSCD
|
2003 |
1
|
|
6
|
基于多模态融合与多层注意力的视频内容文本表述研究 |
赵宏
郭岚
陈志文
郑厚泽
|
《计算机工程》
CAS
CSCD
北大核心
|
2022 |
10
|
|
7
|
基于Vision Transformer和语义学习的视频描述模型 |
王翀
查易艺
顾颖程
宋玉
程环宇
林杉
|
《印刷与数字媒体技术研究》
CAS
北大核心
|
2023 |
1
|
|