期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
人工智能驱动的跨模态语义通信系统
1
作者 廖俊淇 魏昕 周亮 《中兴通讯技术》 北大核心 2024年第S01期33-39,共7页
概述了跨模态语义通信的相关研究背景,具体包括语义通信面临的两大挑战、跨模态通信的核心思想,以及跨模态语义通信具有的优势与存在的研究空白。针对跨模态语义通信尚存在的研究空白,在人工智能技术的驱动下,提出跨模态语义通信系统架... 概述了跨模态语义通信的相关研究背景,具体包括语义通信面临的两大挑战、跨模态通信的核心思想,以及跨模态语义通信具有的优势与存在的研究空白。针对跨模态语义通信尚存在的研究空白,在人工智能技术的驱动下,提出跨模态语义通信系统架构,详细介绍了跨模态语义通信的核心思想、关键技术,以及实践落地中需要考虑的重要因素,探讨了跨模态语义通信系统的应用场景以及存在的挑战。 展开更多
关键词 跨模态语义通信 人工智能 语义关联 语义知识库
在线阅读 下载PDF
基于改进的有效区域基因选择与跨模态语义挖掘的图像属性标注 被引量:3
2
作者 张红斌 蒋子良 +4 位作者 熊其鹏 武晋鹏 邬任重 袁天 姬东鸿 《电子学报》 EI CAS CSCD 北大核心 2020年第4期790-799,共10页
图像属性标注是一种更细化的图像标注,它能缩小认知与特征间“语义鸿沟”.现有研究多基于单特征且未挖掘属性蕴含的深层语义,故无法准确刻画图像内容.改进有效区域基因选择算法融合图像特征,并设计迁移学习策略,实现材质属性标注;基于... 图像属性标注是一种更细化的图像标注,它能缩小认知与特征间“语义鸿沟”.现有研究多基于单特征且未挖掘属性蕴含的深层语义,故无法准确刻画图像内容.改进有效区域基因选择算法融合图像特征,并设计迁移学习策略,实现材质属性标注;基于判别相关分析挖掘特征间跨模态语义,以改进相对属性模型,标注材质属性蕴含的深层语义-实用属性.实验表明:材质属性标注精准度达63.11%,较最强基线提升1.97%;实用属性标注精准度达59.15%,较最强基线提升2.85%;层次化的标注结果能全面刻画图像内容. 展开更多
关键词 图像标注 有效区域基因选择 相对属性 迁移学习 跨模态语义 判别相关分析
在线阅读 下载PDF
C^(2)Transformer U-Net:面向跨模态和上下文语义的医学图像分割模型 被引量:2
3
作者 周涛 侯森宝 +2 位作者 陆惠玲 刘赟璨 党培 《电子与信息学报》 EI CSCD 北大核心 2023年第5期1807-1816,共10页
跨模态的医学图像可以在同一病灶处提供更多的语义信息,针对U-Net网络主要使用单模态图像用于分割,未充分考虑跨模态、上下文语义相关性的问题,该文提出面向跨模态和上下文语义的医学图像分割C^(2)Transformer U-Net模型。该模型的主要... 跨模态的医学图像可以在同一病灶处提供更多的语义信息,针对U-Net网络主要使用单模态图像用于分割,未充分考虑跨模态、上下文语义相关性的问题,该文提出面向跨模态和上下文语义的医学图像分割C^(2)Transformer U-Net模型。该模型的主要思想是:首先,在编码器部分提出主干、辅助U-Net网络结构,来提取不同模态的语义信息;然后,设计了多模态上下文语义感知处理器(MCAP),有效地提取同一病灶跨模态的语义信息,跳跃连接中使用主网络的两种模态图像相加后传入Transformer解码器,增强模型对病灶的表达能力;其次,在编-解码器中采用预激活残差单元和Transformer架构,一方面提取病灶的上下文特征信息,另一方面使网络在充分利用低层和高层特征时更加关注病灶的位置信息;最后,使用临床多模态肺部医学图像数据集验证算法的有效性,对比实验结果表明所提模型对于肺部病灶分割的Acc,Pre,Recall,Dice,Voe与Rvd分别为:97.95%,94.94%,94.31%,96.98%,92.57%与93.35%。对于形状复杂肺部病灶的分割,具有较高的精度和相对较低的冗余度,总体上优于现有的先进方法。 展开更多
关键词 医学图像分割 跨模态语义 上下文语义 TRANSFORMER U-Net
在线阅读 下载PDF
基于语义理解的短视频一键成片系统设计与实现
4
作者 洪松虹 张荣波 朱甲雄 《电视技术》 2024年第9期68-72,共5页
介绍一个基于语义理解的一键成片系统,为市场营销和媒体短视频制作提供高效的短视频生成解决方案。对于市场营销类场景,系统能够快速生成风格统一、信息准确且视觉效果突出的产品宣传视频,以满足大规模的营销需求。在媒体类应用中,系统... 介绍一个基于语义理解的一键成片系统,为市场营销和媒体短视频制作提供高效的短视频生成解决方案。对于市场营销类场景,系统能够快速生成风格统一、信息准确且视觉效果突出的产品宣传视频,以满足大规模的营销需求。在媒体类应用中,系统侧重于视频质量,通过语义理解生成脚本,并结合口播驱动的方式匹配相关视频素材,进而生成高质量的混剪短视频。该系统利用人工智能(Artificial Intelligence,AI)有效提高短视频的生产效率,降低了人力成本,激发视频制作的创意潜能。 展开更多
关键词 大语言模型(LLM) 跨模态语义理解 一键成片 视频混剪
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部