期刊文献+
共找到259篇文章
< 1 2 13 >
每页显示 20 50 100
基于多头自注意力机制与MLP-Interactor的多模态情感分析
1
作者 林宜山 左景 卢树华 《浙江大学学报(工学版)》 北大核心 2025年第8期1653-1661,1679,共10页
针对多模态情感分析中单模态特征质量较差及多模态特征交互不够充分的问题,提出基于多头自注意力机制和MLP-Interactor的多模态情感分析方法.通过基于多头自注意力机制的模态内特征交互模块,实现单模态内的特征交互,提高单模态特征的质... 针对多模态情感分析中单模态特征质量较差及多模态特征交互不够充分的问题,提出基于多头自注意力机制和MLP-Interactor的多模态情感分析方法.通过基于多头自注意力机制的模态内特征交互模块,实现单模态内的特征交互,提高单模态特征的质量.通过MLP-Interactor机制实现多模态特征之间的充分交互,学习不同模态之间的一致性信息.利用提出方法,在CMU-MOSI和CMU-MOSEI 2个公开数据集上进行大量的实验验证与测试.结果表明,提出方法超越了当前诸多的先进方法,可以有效地提升多模态情感分析的准确性. 展开更多
关键词 多模态情感分析 MLP-interactor 多头自注意力机制 特征交互
在线阅读 下载PDF
融合依存信息Attention机制的药物关系抽取研究 被引量:1
2
作者 李丽双 钱爽 +2 位作者 周安桥 刘阳 郭元凯 《中文信息学报》 CSCD 北大核心 2019年第2期89-96,共8页
药物关系(Drug-Drug Interaction,DDI)抽取是生物医学关系抽取领域的重要分支,现有方法主要强调实体、位置等信息对关系抽取的影响。相关研究表明,依存信息对于关系抽取具有重要作用,如何合理利用依存信息是关系抽取研究中需要解决的问... 药物关系(Drug-Drug Interaction,DDI)抽取是生物医学关系抽取领域的重要分支,现有方法主要强调实体、位置等信息对关系抽取的影响。相关研究表明,依存信息对于关系抽取具有重要作用,如何合理利用依存信息是关系抽取研究中需要解决的问题。该文提出一种融合依存信息Attention机制的药物关系抽取模型,衡量最短依存路径与句子的相关性,捕捉对实体间关系有用的信息。首先使用双向GRU(BiGRU)网络分别学习原句子和最短依存路径(Shortest Dependency Path,SDP)的语义信息和上下文信息,然后通过Attention机制将SDP信息与原句子信息融合,最后利用融合依存信息之后的句子表示进行分类预测。在DDIExtraction2013语料上进行了实验评估,模型F值为73.72%。 展开更多
关键词 生物医学关系抽取 药物关系抽取 依存信息 attention
在线阅读 下载PDF
基于Attention-BiLSTM网络的车辆换道意图识别 被引量:1
3
作者 黄开启 罗涛 《浙江工业大学学报》 CAS 北大核心 2023年第3期264-270,共7页
针对换道意图识别方法仅考虑车辆历史状态信息,未充分利用车辆连续性和时序性特征的问题,提出了一种基于Attention-BiLSTM网络的换道意图识别方法。首先,分析行驶车辆之间的交互行为,采用双向长短期记忆网络学习换道意图特征编码信息;其... 针对换道意图识别方法仅考虑车辆历史状态信息,未充分利用车辆连续性和时序性特征的问题,提出了一种基于Attention-BiLSTM网络的换道意图识别方法。首先,分析行驶车辆之间的交互行为,采用双向长短期记忆网络学习换道意图特征编码信息;其次,通过引入模拟人脑推理行为的注意力机制进行网络权重自适应分配,提高网络捕捉重要状态信息能力;最后,利用HighD车辆轨迹数据集对模型进行训练和评估。试验结果表明:所提出的Attention-BiLSTM模型与LSTM模型相比,其准确率和F1分数分别提高了13.2%和10.5%,有效提升网络对周围车辆换道意图的识别性能。 展开更多
关键词 换道意图识别 双向长短期记忆网络 注意力机制 交互行为
在线阅读 下载PDF
基于时空交互网络的人体行为检测方法研究 被引量:1
4
作者 田青 张浩然 +2 位作者 楚柏青 张正 豆飞 《计算机应用与软件》 北大核心 2025年第4期156-165,共10页
针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和... 针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和时间流网络中引入改进的空间变换网络和视觉注意力模型;设计基于像素筛选器的特征融合模块,用于重点区域时序信息相关性的计算和两类不同维度特征的聚合;对网络的损失函数进行了优化。在AVA数据集上的实验结果表明该方法在检测精度、速度以及泛化能力上具有优越性。 展开更多
关键词 时空交互网络 人体行为检测 视觉注意力 特征融合 损失函数
在线阅读 下载PDF
基于尺度交互蒸馏网络的薄壳山核桃品种识别方法 被引量:1
5
作者 赵宁 陈智坤 +3 位作者 杨朋飞 王瑞多 张计育 李永荣 《农业工程学报》 北大核心 2025年第5期209-216,共8页
薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习... 薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习薄壳山核桃的可判别性特征实现品种鉴定。研究选择波尼等12种薄壳山核桃,建立了9048张实拍图像的品种识别数据集;针对薄壳山核桃图片取样中距离变化导致的目标尺度多样性问题,设计了一种全局-局部特征协同学习方案,用于提取尺度不变特征;与此同时,该研究结合尺度知识蒸馏方案,通过训练提取的不同尺度数据进行预测保证模型训练的有效性。结果表明,通过训练该方法对上述12个品种的薄壳山核桃品种识别准确率均达到了96.98%,显著提高了薄壳山核桃的品种鉴定准确率。该研究开发的薄壳山核桃品种自动识别模型对于未来果实鉴定及产品分选提供了技术手段。 展开更多
关键词 薄壳山核桃 品种鉴定 尺度交互蒸馏 多尺度上下文注意融合 知识蒸馏
在线阅读 下载PDF
互动平台信息交流能否提升上市公司内部控制质量?——来自“互动易”和“e互动”的数据证据 被引量:1
6
作者 尹海员 查茹娜 《财经论丛》 北大核心 2025年第4期87-100,共14页
本文利用2012—2023年间我国沪深两市A股上市公司在投资者互动平台上的交流数据,分析互动平台信息交流行为对公司内部控制质量的影响效应及其规律。研究发现,网络互动平台的信息交流可以发挥外部治理效应,从互动数量和互动质量两个维度... 本文利用2012—2023年间我国沪深两市A股上市公司在投资者互动平台上的交流数据,分析互动平台信息交流行为对公司内部控制质量的影响效应及其规律。研究发现,网络互动平台的信息交流可以发挥外部治理效应,从互动数量和互动质量两个维度衡量的平台信息交流行为都能显著提升上市公司内控质量,其中互动质量的提升效应相较于互动数量更为明显。进一步分析发现,媒体报道关注度在这一影响效应中起到了中介作用,并且以声誉机制和市场压力两种形式体现。对目标导向的内控分项指数回归发现,网络互动平台信息交流主要显著正向作用于战略指数与资产安全指数。对规模较小、董事会秘书更为尽责的样本公司来说,互动平台信息交流所产生的内控质量提升效应更为显著。本文研究结论对于透视交易所互动平台的公司治理效应,以及拓展上市公司内控质量提升路径等方面具有借鉴意义。 展开更多
关键词 投资者互动平台 内控质量 信息交流 媒体关注
在线阅读 下载PDF
基于联合交互注意力的图文情感分析方法
7
作者 胡慧君 丁子毅 +1 位作者 张耀峰 刘茂福 《北京航空航天大学学报》 北大核心 2025年第7期2262-2270,共9页
社交媒体中的图文情感对于引导舆论走向具有重要意义,越来越受到自然语言处理(NLP)领域的广泛关注。当前,社交媒体图文情感分析的研究对象主要为单幅图像文本对,针对无时序性及多样性的图集文本对的研究相对较少,为有效挖掘图集中图像... 社交媒体中的图文情感对于引导舆论走向具有重要意义,越来越受到自然语言处理(NLP)领域的广泛关注。当前,社交媒体图文情感分析的研究对象主要为单幅图像文本对,针对无时序性及多样性的图集文本对的研究相对较少,为有效挖掘图集中图像与文本之间情感一致性信息,提出基于联合交互注意力的图文情感分析(SA-JIA)方法。该方法使用RoBERTa和双向门控循环单元(Bi-GRU)来提取文本表达特征,使用ResNet50获取图像视觉特征,利用联合注意力来找到图文情感信息表达一致的显著区域,获得新的文本和图像视觉特征,采用交互注意力关注模态间的特征交互,并进行多模态特征融合,进而完成情感分类任务。在IsTS-CN数据集和CCIR20-YQ数据集上进行了实验验证,结果表明:所提方法能够提升社交媒体图文情感分析的性能。 展开更多
关键词 社交媒体 图文情感分析 联合注意力 交互注意力 多模态融合
在线阅读 下载PDF
基于多重相似性和增强注意力预测药物-靶标相互作用
8
作者 王伟 余梦雪 +5 位作者 孙斌 万仕彤 刘栋 周运 张红军 王鲜芳 《河南师范大学学报(自然科学版)》 北大核心 2025年第2期99-107,共9页
在新药发现和药物重定位研究中,发现药物与靶标之间的相互作用是重要的研究内容.针对药物与靶标相互作用网络,提出一种基于多重相似性和增强注意力机制的图卷积神经网络模型(RSGCN)预测药物-靶标相互作用.首先,提出了多重相似性来捕捉... 在新药发现和药物重定位研究中,发现药物与靶标之间的相互作用是重要的研究内容.针对药物与靶标相互作用网络,提出一种基于多重相似性和增强注意力机制的图卷积神经网络模型(RSGCN)预测药物-靶标相互作用.首先,提出了多重相似性来捕捉网络结构特征,以充分利用节点间的直接或间接关系.然后,通过PCA降维减少相似性噪声对实验结果的影响.最后,采用图卷积神经网络(graph convolution neural network,GCN)获得节点嵌入表示,并融入基于注意力的增强层,通过增强注意力机制获得节点间的注意力权重,能够高效地预测药物与靶标之间的相互作用.在黄金标准数据集上的实验结果表明RSGCN模型具有较好的性能. 展开更多
关键词 图卷积神经网络(GCN) 多重相似性 PCA 增强注意力机制 药物-靶标相互作用
在线阅读 下载PDF
面向点云理解的双邻域图卷积方法
9
作者 李宗民 徐畅 +2 位作者 白云 鲜世洋 戎光彩 《浙江大学学报(工学版)》 北大核心 2025年第5期879-889,共11页
针对现有方法对局部点云结构建模时空间跨度有限以及传统特征聚合方法造成一定信息损失的问题,提出双邻域图卷积网络(DNGCN).在原始点云中增加角度先验,以增强对点云局部几何结构的理解,捕捉局部细节.对原始邻域进行扩展,在局域内设计... 针对现有方法对局部点云结构建模时空间跨度有限以及传统特征聚合方法造成一定信息损失的问题,提出双邻域图卷积网络(DNGCN).在原始点云中增加角度先验,以增强对点云局部几何结构的理解,捕捉局部细节.对原始邻域进行扩展,在局域内设计双邻域图卷积,通过集成高斯自适应聚合,在提取较大感受野范围内显著特征的同时,充分保留原始邻域信息.通过局部-全局信息交互来增大局部点的空间跨度,捕获远距离依赖关系.本文方法在分类数据集ModelNet40和ScanObjectNN上分别取得了94.1%、89.6%的总体精度,与其他先进算法相比有显著提升,较DGCNN分别提升了1.2%、11.5%.在部件分割数据集ShapeNetPart和语义分割数据集ScanNetv2、S3DIS上均获得优秀的性能,平均交并比分别为86.7%、74.9%和69.8%.通过大量的实验,证明了该模型的有效性. 展开更多
关键词 点云特征 图卷积网络 几何增强 局部全局交互 注意力机制
在线阅读 下载PDF
基于跨域交互注意力和对比学习引导的红外与可见光图像融合
10
作者 邸敬 梁婵 +1 位作者 刘冀钊 廉敬 《中国光学(中英文)》 北大核心 2025年第2期317-332,共16页
现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外... 现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外和可见光图像中分别提取和增强细节信息,并利用跳跃连接避免信息丢失,生成增强后的细节图像。接着,构建了联合双分支编码器和跨域交互注意力模块的图像融合网络,确保特征融合时充分进行特征交互,并通过解码器重建为最终的融合图像。然后,引入了通过对比学习块进行浅层和深层属性和内容的对比学习网络,优化特征表示,进一步提升图像融合网络的性能。最后,为了约束网络训练以保留源图像的固有特征,设计了一种基于对比约束的损失函数,以辅助融合过程对源图像信息的对比保留。将提出方法与前沿融合方法进行了定性和定量的分析比较。在TNO、MSRS、RoadSence数据集上的实验结果表明:本文方法的8项客观评价指标均较对比方法有显著提升。本文方法融合后图像具有丰富的细节纹理、显著的清晰度和对比度,有效提高了道路交通、安防监控等实际应用中的目标识别和环境感知能力。 展开更多
关键词 红外与可见光图像融合 对比学习 跨域交互注意力机制 对比约束损失
在线阅读 下载PDF
考虑时空信息结合的电力系统暂态稳定评估
11
作者 李欣 李文斌 +3 位作者 赵张飞 李新宇 欧阳子帅 郭攀锋 《电力系统及其自动化学报》 北大核心 2025年第6期68-80,共13页
为进一步提升电力系统暂态稳定评估模型性能并解决数据样本不平衡导致的模型评估结果可信度低的问题,本文提出一种基于时空信息结合及损失函数改进的新型电力系统暂态稳定评估模型。首先,分别利用下采样交互卷积网络与图注意力网络充分... 为进一步提升电力系统暂态稳定评估模型性能并解决数据样本不平衡导致的模型评估结果可信度低的问题,本文提出一种基于时空信息结合及损失函数改进的新型电力系统暂态稳定评估模型。首先,分别利用下采样交互卷积网络与图注意力网络充分挖掘电力系统运行数据中的时序特征信息及空间特征信息,并采用拼接操作对特征信息进行融合,提升模型对电力系统暂态稳定特征的提取与表征能力。然后,引入焦点损失函数提升模型对失稳样本的辨识能力,并采用物理知识对其进行改进,以增加模型评估结果的可信性。最后,分别采用IEEE 39、IEEE 145和IEEE 300节点系统对所提模型进行验证,实验结果表明,所提评估模型相较其他评估模型具有更优的评估性能及可信性。 展开更多
关键词 暂态稳定评估 时空特征 图注意力 交互卷积 物理知识
在线阅读 下载PDF
基于图时空注意力的多车交互轨迹预测模型
12
作者 张新锋 赵娟 +1 位作者 刘国华 刘鹏菲 《汽车技术》 北大核心 2025年第3期30-38,共9页
为有效提取高速交通场景下车辆间的交互特征,从而准确预测动态障碍轨迹,基于编-解码框架,提出基于图时空注意力的多车交互轨迹预测模型。结合斥力场和图模型建立车-车图交互场,利用节点和邻接特征矩阵表征车辆之间的动态交互,通过图空... 为有效提取高速交通场景下车辆间的交互特征,从而准确预测动态障碍轨迹,基于编-解码框架,提出基于图时空注意力的多车交互轨迹预测模型。结合斥力场和图模型建立车-车图交互场,利用节点和邻接特征矩阵表征车辆之间的动态交互,通过图空间注意力和时间多头注意力提取深层时空交互,获取图时空融合编码;将车辆横纵向行为意图独热编码与其拼接,实现目标车辆多模态轨迹预测。利用NGSIM数据集进行验证,相较于其他6种模型,该模型RMSE和NLL值最低;通过消融实验进一步验证图交互场的有效性,结果表明,该模型能够有效提高车辆轨迹预测精度。 展开更多
关键词 多车交互 斥力场 注意力机制 图模型 轨迹预测
在线阅读 下载PDF
多维度聚合Transformer的图像超分辨率重建
13
作者 陈清江 陈鹏民 《光学精密工程》 北大核心 2025年第12期1955-1970,共16页
针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。... 针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。其次,设计了空间-通道交互模块,并将其集成于Transformer层中,利用四种形式的注意力机制充分提取关键特征并实现特征融合,从而提升模型性能。最后,提出了特征重用Transformer模块,深入挖掘各层特征之间的关联,精准提取并高效重用重要特征,进一步加强模型表现。实验结果表明,在五个基准测试集上,所提方法优于其他先进算法。在不同放大倍数的超分辨率任务中,相较于基于Swin Transformer的图像恢复方法,峰值信噪比和结构相似度分别平均提升了约0.26 dB和0.0024,且重建效果更加清晰。该方法有效克服了现有方法的不足,在超分辨率任务中展现出显著的性能提升和应用潜力。 展开更多
关键词 图像超分辨率 TRANSFORMER 注意力机制 特征交互 特征重用 多尺度
在线阅读 下载PDF
结合CNN-Transformer特征交互的红外与可见光图像融合方法
14
作者 张德银 张裕尧 +1 位作者 李俊佟 吴章辉 《红外技术》 北大核心 2025年第7期813-822,共10页
针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合... 针对CNN与Transformer提取的特征之间交互作用未充分挖掘而导致的融合图像易产生红外特征分布不均匀、轮廓不清晰以及重要背景信息丢失等问题,本文提出了一种新的结合CNN-Transformer特征交互的红外与可见光图像融合网络。首先,新融合网络设计了新的空间通道混合注意力机制以提升全局及局部特征的提取效率并得到混合特征块;其次,利用CNN-Transformer的特征交互获取融合混合特征块,并构建多尺度重构网络以实现图像特征重构输出;最后,使用TNO数据集将新融合网络与其它9种融合网络进行对比图像融合实验。实验结果表明,新融合网络获得的融合图像在视觉感知方面表现优异,既突出了红外特征和物体轮廓,又保留了丰富的背景纹理细节;网络在EN、SD、AG、SF、SCD以及VIF指标上相较于现有融合网络平均提高约64.73%、8.17%、69.05%、66.34%、15.39%和25.66%。消融实验证明了新模型的有效性。 展开更多
关键词 CNN-Transformer特征交互 全局特征 混合注意力 图像融合 局部特征
在线阅读 下载PDF
具有特征交互适应的3D双手网格重建方法
15
作者 刘佳 张家辉 陈大鹏 《信号处理》 北大核心 2025年第7期1291-1302,共12页
从单张RGB图像中实现双手的3D交互式网格重建是一项极具挑战性的任务。由于双手之间的相互遮挡以及局部外观相似性较高,导致部分特征提取不够准确,从而丢失了双手之间的交互信息并使重建的手部网格与输入图像出现不对齐等问题。为了解... 从单张RGB图像中实现双手的3D交互式网格重建是一项极具挑战性的任务。由于双手之间的相互遮挡以及局部外观相似性较高,导致部分特征提取不够准确,从而丢失了双手之间的交互信息并使重建的手部网格与输入图像出现不对齐等问题。为了解决上述问题,本文首先提出一种包含两个部分的特征交互适应模块,第一部分特征交互在保留左右手分离特征的同时生成两种新的特征表示,并通过交互注意力模块捕获双手的交互特征;第二部分特征适应则是将此交互特征利用交互注意力模块适应到每只手,为左右手特征注入全局上下文信息。其次,引入三层图卷积细化网络结构用于精确回归双手网格顶点,并通过基于注意力机制的特征对齐模块增强顶点特征和图像特征的对齐,从而增强重建的手部网格和输入图像的对齐。同时提出一种新的多层感知机结构,通过下采样和上采样操作学习多尺度特征信息。最后,设计相对偏移损失函数约束双手的空间关系。在InterHand2.6M数据集上的定量和定性实验表明,与现有的优秀方法相比,所提出的方法显著提升了模型性能,其中平均每关节位置误差(Mean Per Joint Position Error,MPJPE)和平均每顶点位置误差(Mean Per Vertex Position Error,MPVPE)分别降低至7.19 mm和7.33 mm。此外,在RGB2Hands和EgoHands数据集上进行泛化性实验,定性实验结果表明所提出的方法具有良好的泛化能力,能够适应不同环境背景下的手部网格重建。 展开更多
关键词 双手重建 注意力机制 特征交互适应 特征对齐 图卷积网络
在线阅读 下载PDF
多尺度密集交互注意力残差真实图像去噪网络
16
作者 郭业才 胡晓伟 +1 位作者 AMITAVE Saha 毛湘南 《图学学报》 北大核心 2025年第2期279-287,共9页
针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级... 针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级联模块(MSCM)利用多维密集交互残差单元(MDIU)对图像特征进行多维映射,并逐步级联以增强模型之间的信息传递和交互性,充分拟合训练数据;引入双路全局注意力模块(DGAM)对多级特征进行全局联合学习,获取更具有判别性的特征信息;跳跃连接促进结构之间的参数共享,使不同维度的特征充分融合,保证信息的完整性;最后,采用残差学习构建出清晰的去噪图像。结果表明,该算法在真实噪声数据集(DND和SIDD)上峰值信噪比分别为39.80 dB和39.62 dB,结构相似性分别为95.4%和95.8%,均优于主流去噪算法。此外,该算法在低光度场景下应用也能保留更多细节,从而显著提升图像质量。 展开更多
关键词 图像去噪 多尺度特征提取 多维密集交互 卷积神经网络 注意力
在线阅读 下载PDF
基于层次化视觉注意力的富语义视频对话生成 被引量:1
17
作者 赵倩 郭斌 +3 位作者 刘宇博 孙卓 王豪 陈梦琦 《计算机科学》 北大核心 2025年第1期315-322,共8页
视频对话是多模态人机交互领域中的重要内容。视频对话中包含大量时空视觉信息和复杂的多模态关系,这给相关研究带来了巨大的挑战。现有的视频对话模型利用跨模态注意力机制或图结构捕捉视频语义和对话上下文之间的相关性,然而,所有视... 视频对话是多模态人机交互领域中的重要内容。视频对话中包含大量时空视觉信息和复杂的多模态关系,这给相关研究带来了巨大的挑战。现有的视频对话模型利用跨模态注意力机制或图结构捕捉视频语义和对话上下文之间的相关性,然而,所有视觉信息均是在单一粗粒度下处理的,这导致模型容易忽略一些细粒度时空信息,如同一物体在时间上的持续运动或图像不显著位置的物体信息,从而降低了视频对话性能。同时,细粒度处理全部视觉信息又将增加处理时延,降低视频对话的流畅性。因此,提出了一种层次化视觉注意力的富语义视频对话生成方法。首先根据对话上下文,利用全局视觉注意力捕捉全局视觉语义信息,并定位到对话输入关注的视频时间序列/空间范围,其次利用局部注意力机制进一步捕捉细粒度视觉信息,结合多任务学习方法,生成对话回复。在DSTC7 AVSD数据集上的实验结果表明,相比现有基准方法,所提方法生成的对话具备更高的准确性和多样性,其中METEOR指标提高了23.24%。 展开更多
关键词 多模态人机交互 层次化注意力机制 多任务学习 场景感知
在线阅读 下载PDF
基于交叉注意力的点击率预测模型 被引量:1
18
作者 何李杰 高茂庭 《计算机工程与应用》 北大核心 2025年第7期353-360,共8页
有效特征的挖掘是点击率预测的关键,针对点击率预测模型对局部组合特征与全局特征间的信息交流考虑不充分,对组合特征的重要度表达不准确的问题,提出一种基于交叉注意力的点击率预测模型(CANN),通过交叉注意力机制突出组合特征与全局特... 有效特征的挖掘是点击率预测的关键,针对点击率预测模型对局部组合特征与全局特征间的信息交流考虑不充分,对组合特征的重要度表达不准确的问题,提出一种基于交叉注意力的点击率预测模型(CANN),通过交叉注意力机制突出组合特征与全局特征间的联系和交流,以充分挖掘有效特征。通过全局平均池化分别得到每个特征的特征值并拼接成全局特征;采用轴加权融合的方式来捕获组合特征;通过交叉注意力机制实现全局特征与组合特征交叉,得到组合特征的权重来表达其重要性,并将加权的组合特征融合到全局特征,以提高信息交流;通过多层感知机学习,得到点击率预测值。在两个公开和真实的数据集上的实验结果验证了该模型的有效性。 展开更多
关键词 点击率预测 交叉注意力 特征交互 神经网络
在线阅读 下载PDF
基于注意力循环神经网络的联合深度推荐模型 被引量:1
19
作者 郭东坡 何彬 +1 位作者 张明焱 段超 《现代电子技术》 北大核心 2025年第1期80-84,共5页
为了向用户推荐符合兴趣偏好的项目,设计一种基于注意力循环神经网络的联合深度推荐模型。将双层注意力机制设置于网络中,该模型由五个部分构成,在输入层中生成联合深度推荐模型的输入矩阵,通过序列编码层对项目评论文本语义展开正向和... 为了向用户推荐符合兴趣偏好的项目,设计一种基于注意力循环神经网络的联合深度推荐模型。将双层注意力机制设置于网络中,该模型由五个部分构成,在输入层中生成联合深度推荐模型的输入矩阵,通过序列编码层对项目评论文本语义展开正向和反向编码,获得隐藏状态输出,并将其输入双层注意力机制中,提取项目特征,利用全连接层提取用户偏好特征。在预测层中建立项目与用户的交互模型,获得项目评分,为用户推荐高评分的项目。为了提高模型精度,加权融合MSE损失函数、CE损失函数和RK损失函数建立组合损失函数,对深度联合训练模型展开训练,提高模型的推荐性能。仿真结果表明,所提方法具有良好的推荐效果,能够适应不断变化的市场需求和用户行为。 展开更多
关键词 双层注意力机制 循环神经网络 用户偏好 组合损失函数 交互模型 联合深度推荐模型
在线阅读 下载PDF
基于交互式多头注意力机制的虚拟试穿网络
20
作者 黄丽丽 郑军红 +1 位作者 金耀 何利力 《现代纺织技术》 北大核心 2025年第5期96-105,共10页
为解决现有虚拟试穿模型的服装特征与细节容易丢失(如无法准确识别服装的长短袖、颜色及袖、领口细节)等问题,提出基于交互式多头注意力机制的虚拟试穿网络。在StableVITON模型的服装编码块中引入交互式多头注意力机制,促进不同头之间... 为解决现有虚拟试穿模型的服装特征与细节容易丢失(如无法准确识别服装的长短袖、颜色及袖、领口细节)等问题,提出基于交互式多头注意力机制的虚拟试穿网络。在StableVITON模型的服装编码块中引入交互式多头注意力机制,促进不同头之间的交互,学习丰富的特征相关性,从而增强网络注意力性能,保留更多的服装特征和细节。在VITON-HD数据集上进行定性和定量实验,结果表明:与其他主流模型相比,该虚拟试穿网络的服装整体特征、局部细节更加真实;与StableVITON模型相比,该网络在平均结构相似性(SSIM)上提高了1.53%,平均感知图像相似度(LPIPS)降低了0.71%,平均弗雷歇距离(FID)降低了0.15%,平均核Inception距离(KID)降低了1.14%。该虚拟试穿网络有效保留了服装特征细节,显著增强了图像的保真度,其合成的试穿图像能为消费者带来更好的购物体验,可广泛应用于虚拟试穿等数字时尚应用场景。 展开更多
关键词 交互式 多头注意力 StableVITON 虚拟试穿 稳定扩散
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部