期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
基于多尺度渐近金字塔的太阳电池缺陷检测网络
1
作者 朱磊 耿萃萃 +3 位作者 李博涛 潘杨 张博 姚丽娜 《太阳能学报》 北大核心 2025年第5期267-274,共8页
以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关... 以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关注重点区域的同时减少参数量的引入;最后提出一种改进渐近金字塔网络AFPNa结构,缓解网络在特征融合过程中信息的丢失或退化问题,提升缺陷检测精度。实验结果表明,与YOLOv8原模型及RTMDET等7种先进检测网络相比,MSANet具有更高的检测精度,相较原模型均值平均精度提升5.7个百分点。 展开更多
关键词 缺陷检测 深度学习 太阳电池 分层特征融合结构 多尺度渐近金字塔 空间注意力机制
在线阅读 下载PDF
基于层次化视觉注意力的富语义视频对话生成 被引量:1
2
作者 赵倩 郭斌 +3 位作者 刘宇博 孙卓 王豪 陈梦琦 《计算机科学》 北大核心 2025年第1期315-322,共8页
视频对话是多模态人机交互领域中的重要内容。视频对话中包含大量时空视觉信息和复杂的多模态关系,这给相关研究带来了巨大的挑战。现有的视频对话模型利用跨模态注意力机制或图结构捕捉视频语义和对话上下文之间的相关性,然而,所有视... 视频对话是多模态人机交互领域中的重要内容。视频对话中包含大量时空视觉信息和复杂的多模态关系,这给相关研究带来了巨大的挑战。现有的视频对话模型利用跨模态注意力机制或图结构捕捉视频语义和对话上下文之间的相关性,然而,所有视觉信息均是在单一粗粒度下处理的,这导致模型容易忽略一些细粒度时空信息,如同一物体在时间上的持续运动或图像不显著位置的物体信息,从而降低了视频对话性能。同时,细粒度处理全部视觉信息又将增加处理时延,降低视频对话的流畅性。因此,提出了一种层次化视觉注意力的富语义视频对话生成方法。首先根据对话上下文,利用全局视觉注意力捕捉全局视觉语义信息,并定位到对话输入关注的视频时间序列/空间范围,其次利用局部注意力机制进一步捕捉细粒度视觉信息,结合多任务学习方法,生成对话回复。在DSTC7 AVSD数据集上的实验结果表明,相比现有基准方法,所提方法生成的对话具备更高的准确性和多样性,其中METEOR指标提高了23.24%。 展开更多
关键词 多模态人机交互 层次化注意力机制 多任务学习 场景感知
在线阅读 下载PDF
面向目的地预测的层次化空间嵌入BiGRU模型
3
作者 周翔宇 刘毅志 +2 位作者 赵肄江 廖祝华 张德城 《浙江大学学报(工学版)》 北大核心 2025年第6期1211-1218,共8页
结合空间嵌入和神经网络目的地的预测方法在预测精度和时间性能之间存在权衡,并且面临长期依赖的问题.为此,提出面向目的地预测的层次化空间嵌入双向门控循环单元(HSE-BiGRU)模型.该模型采用层次化架构:第1层通过粗粒度网格嵌入技术,将... 结合空间嵌入和神经网络目的地的预测方法在预测精度和时间性能之间存在权衡,并且面临长期依赖的问题.为此,提出面向目的地预测的层次化空间嵌入双向门控循环单元(HSE-BiGRU)模型.该模型采用层次化架构:第1层通过粗粒度网格嵌入技术,将GPS轨迹数据转换为网格嵌入序列,利用带注意力的BiGRU网络捕获网格嵌入序列中的时空依赖关系,预测目的地所在的网格区域;第2层采用四叉树嵌入技术将网格区域内的轨迹数据转换为四叉树嵌入序列,运用带注意力的BiGRU网络聚焦关键位置节点以提取四叉树嵌入序列的运动特征;结合2层提取的特征信息精准预测目的地.使用波尔图市的出租车数据集进行性能评估,结果表明,所提方法在预测精度和时间性能上均优于CNN、T-CONV、CNN-LSTM等基线模型. 展开更多
关键词 目的地预测 层次化架构 网格嵌入 四叉树嵌入 双向门控循环单元(BiGRU) 注意力机制
在线阅读 下载PDF
基于注意力机制和跨模态层级特征融合的群养肉牛个体质量估测
4
作者 宋平 杨颖 +3 位作者 刘刚 姚冲 李子若 毛天赐 《农业工程学报》 北大核心 2025年第10期221-231,共11页
为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-g... 为解决群养场景下肉牛个体质量称量复杂、精度低的问题,该研究提出了基于注意力机制和跨模态层级特征融合模型CMHFF-ResNet(cross-modal hierarchical feature fusion resnet)。首先,无接触式地采集俯视视角下日常活动的肉牛的RGB(red-green-blue)图像与深度图像,使用引入定向边界框OBB(oriented bounding box)的YOLOv8网络对肉牛进行旋转目标检测和识别,精准定位群养场景中的个体目标;其次,以ResNet50为骨干网络构建双流估重模型,分别提取RGB和深度模态特征,并引入CBAM(convolutional block attention module)注意力机制以增强关键特征表达能力。设计跨模态的层级特征融合,有效结合RGB流和深度流的特征并充分利用浅层特征;第三,引入肉牛的身份信息便于网络学习肉牛身份与其体质量之间的对应关系,为优化模型效率,将全连接层替换为KAN(kolmogorov-arnold networks),显著减少参数量;最后,将双流的输出结果融合,回归肉牛体质量值。在试验中,构建了包含2546对RGB-D图像的数据集,包括2373对训练数据和173对验证数据。结果表明,CMHFF-ResNet在验证集上的平均绝对误差为14.19 kg。与基于RGB和深度的单流模型相比,双流模型在平均绝对误差上分别降低16.943%和26.133%。同时,该方法优于其他现有肉牛体质量估测方法:与多元线性回归、改进MobileNetv2模型、改进DenseNet201模型和改进跨模态特征融合模型CFF-ResNet相比,在平均绝对误差上分别减少57.233%、34.699%、24.761%和20.991%,提升了群养环境下肉牛个体质量估测的精度与泛化性,能够有效地学习跨模态的层级特征表示。该研究为大规模群养环境中肉牛个体质量的高精度估测提供了参考。 展开更多
关键词 模型 计算机视觉 目标检测 体质量估测 注意力机制 跨模态层级特征融合 双流网络
在线阅读 下载PDF
一种分层的结构性异常检测方法
5
作者 沙昊 罗雷 杨健 《计算机应用与软件》 北大核心 2025年第6期178-185,共8页
异常检测和定位在工业流水线中扮演着关键的角色。目前大部分方法仅使用单一类型的特征进行异常检测,无法获得稳定的性能。为此,开发出一个全新的分层特征融合框架,即联合重构高层特征和底层特征来设计结构性的特征融合模块。同时为解... 异常检测和定位在工业流水线中扮演着关键的角色。目前大部分方法仅使用单一类型的特征进行异常检测,无法获得稳定的性能。为此,开发出一个全新的分层特征融合框架,即联合重构高层特征和底层特征来设计结构性的特征融合模块。同时为解决泛化性过强问题,该框架在Cutpaste方法的基础上引入注意力机制。针对异常定位和异常检测两个任务,该框架在MVTec数据集上的AUROC指标分别达到了0.979和0.987,相较于主流的异常检测算法有显著提升。 展开更多
关键词 异常检测 分层重构 注意力机制 异常构造
在线阅读 下载PDF
基于层级尺度交互的U-Net遥感影像建筑物提取方法
6
作者 余快 宋宝贵 +1 位作者 邵攀 余翱 《广西师范大学学报(自然科学版)》 北大核心 2025年第2期121-132,共12页
针对U-Net及其改进网络在跳跃链接中因忽略多层级特征间相互作用而导致对特征的表征能力不足问题,本文提出一种基于层级尺度交互的U-Net遥感影像建筑物提取方法。首先,在U-Net网络跳跃连接中设计层级尺度交互模块,实现多层级特征的交互... 针对U-Net及其改进网络在跳跃链接中因忽略多层级特征间相互作用而导致对特征的表征能力不足问题,本文提出一种基于层级尺度交互的U-Net遥感影像建筑物提取方法。首先,在U-Net网络跳跃连接中设计层级尺度交互模块,实现多层级特征的交互增强,提升对特征的表征能力;然后,通过改进空洞空间金字塔池化模块,提出一种多尺度特征提取模块,并将其应用到最高层级特征,来提升网络提取多尺度特征的能力;最后,将自校准卷积引入到解码过程,促进浅层与深层特征更好地融合。在公开建筑物提取数据集WHU和Inria上,将本文方法与6种遥感影像建筑物提取方法进行对比,实验结果表明,本文方法的IoU分别为91.26%和79.23%,均优于对比方法。 展开更多
关键词 遥感影像 建筑物提取 U-Net 层级尺度交互 多尺度 注意力机制
在线阅读 下载PDF
融合层次对比学习的威胁情报实体关系抽取
7
作者 周法国 宋亚楠 廖俊斌 《计算机工程与设计》 北大核心 2025年第1期131-137,共7页
针对当前威胁情报领域实体关系抽取语义利用不充分、准确率低下的问题,提出一种基于层次对比学习的威胁情报领域实体关系抽取模型。利用预训练模型提取文本特征,融合三元组、句子级别正负样例信息输入到层次对比层进行全局语义和局部边... 针对当前威胁情报领域实体关系抽取语义利用不充分、准确率低下的问题,提出一种基于层次对比学习的威胁情报领域实体关系抽取模型。利用预训练模型提取文本特征,融合三元组、句子级别正负样例信息输入到层次对比层进行全局语义和局部边界增强,通过级联解码层加强实体识别与关系抽取的交互,采用层叠指针标注方式抽取出所有的实体关系三元组。根据威胁情报数据特点设计实体关系标注方案,构建数据集进行实验验证,模型在自建数据集上F1值达到82%,在公开数据集上的结果达到79%,验证了模型的有效性。 展开更多
关键词 威胁情报 实体关系抽取 层次对比学习 级联解码 正负样例信息 自建数据集 多头注意力机制
在线阅读 下载PDF
基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法 被引量:7
8
作者 曾昭霖 严馨 +2 位作者 徐广义 陈玮 邓忠莹 《小型微型计算机系统》 CSCD 北大核心 2023年第1期185-192,共8页
针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Atte... 针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Attention神经网络模型,获得具有丰富上下文语义信息的句子、文档向量表示;并在此过程中通过双线性变换注意力机制,使得文档向量表示不仅具有反映文档深层主旨信息的基本特性,还融入句子与用户查询的相关性信息,然后利用句向量与其进行相似度计算获得相应的句子重要性得分;其次,由句子重要性得分、句子中包含的关键词特征、句子的长度特征以及句子的时序权重系数加权组合得到最终的句子综合特征权重得分;最后,利用MMR算法来选择摘要句.实验结果表明,与其他方法相比本文提出的方法能在一定程度上提高面向查询的多文档抽取式摘要的质量,具有一定的有效性及优越性. 展开更多
关键词 面向查询的抽取式摘要 中文多文档 层级BiGRU 注意力机制
在线阅读 下载PDF
邻域信息分层感知的知识图谱补全方法 被引量:2
9
作者 梁梅霖 段友祥 +1 位作者 昌伦杰 孙歧峰 《计算机工程与应用》 CSCD 北大核心 2024年第2期147-153,共7页
知识图谱补全(KGC)旨在利用知识图谱的现有知识推断三元组的缺失值。近期的一些研究表明,将图卷积网络(GCN)应用于KGC任务有助于改善模型的推理性能。针对目前大多数GCN模型存在的同等对待邻域信息、忽略了邻接实体对中心实体的不同贡... 知识图谱补全(KGC)旨在利用知识图谱的现有知识推断三元组的缺失值。近期的一些研究表明,将图卷积网络(GCN)应用于KGC任务有助于改善模型的推理性能。针对目前大多数GCN模型存在的同等对待邻域信息、忽略了邻接实体对中心实体的不同贡献度、采用简单的线性变换更新关系嵌入等问题,提出了一个邻域信息分层感知的图神经网络模型NAHAT,在关系更新中引入实体特征信息,通过聚合实体和关系表征来丰富异质关系语义,提高模型的表达能力。同时,将自我对立的负样本训练应用到损失计算中,实现模型的高效训练。实验结果表明,与图卷积网络模型COMPGCN相比,所提出的模型在FB15K-237数据集上Hits@1、Hits@10指标分别提高了3%、2.6%;在WN18RR数据集上分别提高了0.9%、2.2%。验证了所提出的模型的有效性。 展开更多
关键词 知识图谱 知识表示学习 分层注意力机制 图神经网络
在线阅读 下载PDF
融合对比学习和BERT的层级多标签文本分类模型 被引量:3
10
作者 代林林 张超群 +2 位作者 汤卫东 刘成星 张龙昊 《计算机工程与设计》 北大核心 2024年第10期3111-3119,共9页
为有效解决现有文本分类模型难以建模标签语义关系的问题,提出一种融合对比学习和自注意力机制的层级多标签文本分类模型,命名为SampleHCT。设计一个标签特征提取模块,能有效提取标签的语义和层次结构特征。采用自注意力机制构建具有混... 为有效解决现有文本分类模型难以建模标签语义关系的问题,提出一种融合对比学习和自注意力机制的层级多标签文本分类模型,命名为SampleHCT。设计一个标签特征提取模块,能有效提取标签的语义和层次结构特征。采用自注意力机制构建具有混合标签信息的阳性样本。使用对比学习训练文本编码器的标签意识。实验结果表明,SampleHCT相较于19个基准模型,取得了更高的分类分数,验证了其具有更有效的标签信息建模方式。 展开更多
关键词 文本分类 对比学习 自注意力机制 层级结构 多标签 标签信息 全局特征
在线阅读 下载PDF
基于SE-MultiResNet50算法的辣椒病害种类及程度分级检测 被引量:1
11
作者 唐源 鲁茂悦 +3 位作者 李丽平 唐有万 陈阳洋 李昱瑾 《中国农机化学报》 北大核心 2024年第12期259-266,274,共9页
在实际的辣椒种植环境中,由于其复杂背景,辣椒叶片病害的识别难度较大。目前,关于受害程度分级检测和辣椒病害分级缺乏公开的数据集。以成都市农林科学院辣椒种植基地的叶片为研究对象,采用U2-Net对叶片进行分割,生成具有不同复杂背景... 在实际的辣椒种植环境中,由于其复杂背景,辣椒叶片病害的识别难度较大。目前,关于受害程度分级检测和辣椒病害分级缺乏公开的数据集。以成都市农林科学院辣椒种植基地的叶片为研究对象,采用U2-Net对叶片进行分割,生成具有不同复杂背景的合成图像,从而丰富数据集。针对常见的辣椒细菌性斑点、白粉病和病毒病3种病害以及健康叶片,提出一种SE-MultiResNet50检测模型。该模型在全由复杂背景图像组成的测试集上表现出色:辣椒病害种类的识别准确率达到91.05%,受害严重程度分级的准确率为92.08%。结果表明,该检测模型在复杂背景下具有较高的识别精度,成功实现对辣椒病害种类分类和受害严重程度分级的智能识别。同时,提供一种新的数据集扩充方法,为相关领域的研究提供新的思路和途径。 展开更多
关键词 辣椒 病虫害 分级检测 注意力机制 ResNet50
在线阅读 下载PDF
结合CNN与TCN神经网络的滚动轴承寿命预测 被引量:4
12
作者 孙丹铭 陈长征 孙业彭 《机械设计与制造》 北大核心 2024年第8期160-165,共6页
针对滚动轴承振动信号特征提取不充分、过于依赖人工特征提取及预测精度低等问题,提出了CNN-TCN-Attention网络模型预测方法。该方法选取滚动轴承振动信号作为输入通过增强顶帽算子(EAVGH)对信号进行特征增强,运用卷积神经网络(CNN)来... 针对滚动轴承振动信号特征提取不充分、过于依赖人工特征提取及预测精度低等问题,提出了CNN-TCN-Attention网络模型预测方法。该方法选取滚动轴承振动信号作为输入通过增强顶帽算子(EAVGH)对信号进行特征增强,运用卷积神经网络(CNN)来提取信号中的深层特征,并构建TCN-Attention模型对滚动轴承剩余寿命进行预测。将注意力机制与时间卷积网络相结合可以有效的提高模型预测精度,通过轴承寿命实验数据进行验证,CNN-TCN-Attention预测模型能有效的提取滚动轴承振动信号中的深层特征,并且具有较高的预测精度。 展开更多
关键词 增强形态顶帽变换 注意力机制 时间卷积网络 寿命预测
在线阅读 下载PDF
CMHICL:基于跨模态分层交互网络和对比学习的多模态讽刺检测 被引量:2
13
作者 林洁霞 朱小栋 《计算机应用研究》 CSCD 北大核心 2024年第9期2620-2627,共8页
多模态讽刺检测的关键在于有效地对齐和融合不同模态的特征。然而,现有融合方法通常忽略多模态间组成结构的关系,并且在识别讽刺时也经常忽略多模态数据中与讽刺情感相关的共同特征的重要性。因此,提出一种基于跨模态分层交互网络和对... 多模态讽刺检测的关键在于有效地对齐和融合不同模态的特征。然而,现有融合方法通常忽略多模态间组成结构的关系,并且在识别讽刺时也经常忽略多模态数据中与讽刺情感相关的共同特征的重要性。因此,提出一种基于跨模态分层交互网络和对比学习的模型。首先,跨模态分层交互网络采用了基于交叉注意力机制的最小单元对齐模块和基于图注意力网络的组成结构融合模块,从不同层面上识别文本和图像之间的不一致性,将低一致性的样本判定为含讽刺意味的样本。其次,该模型通过数据增强和类别增强两个对比学习任务,帮助学习讽刺相关的共同特征。实验结果表明,所提模型与基线模型相比,准确率提升了0.81%,F_(1)值提升了1.6%,验证了提出的分层交互网络和对比学习方法在多模态讽刺检测中的关键作用。 展开更多
关键词 多模态讽刺检测 分层交互 对比学习 交叉注意力机制 图注意力网络
在线阅读 下载PDF
基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测 被引量:3
14
作者 王光华 张纪欣 +3 位作者 崔良 薛书倩 张彬 张沛 《全球能源互联网》 CSCD 北大核心 2024年第4期393-405,共13页
分布式屋顶光伏地理位置分散,受地理环境遮挡和多种气象因素影响,导致光伏出力特性存在差异,给变电站级分布式屋顶光伏日前功率预测造成挑战。针对上述问题,提出了一种基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测方法... 分布式屋顶光伏地理位置分散,受地理环境遮挡和多种气象因素影响,导致光伏出力特性存在差异,给变电站级分布式屋顶光伏日前功率预测造成挑战。针对上述问题,提出了一种基于双重注意力变换模型的分布式屋顶光伏变电站级日前功率预测方法。首先,基于动态时间规整算法计算分布式光伏用户出力特性间的相似度,并基于凝聚层次聚类法将其划分成若干类;然后,利用自主注意力网络学习各时间步间的时序关联特性,通道卷积注意力机制学习多特征变量间的相关性,构建日前功率预测模型;最后,将每一类日前预测结果相加,实现变电站级日前功率预测。算例结果表明所提方法在多种天气状况下,较Transformer、长短期记忆神经网络和时序卷积网络,预测精度显著提升。 展开更多
关键词 日前功率预测 动态时间规整 凝聚层次聚类 双重注意力变换模型
在线阅读 下载PDF
基于双重注意力和分层感知表征的IQA方法 被引量:1
15
作者 史再峰 佟博文 +2 位作者 孔凡宁 康泰 罗韬 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2024年第3期234-243,共10页
图像质量评价在图像处理领域有着广泛的应用.基于深度学习的方法以多通道特征的形式获取图像信息,但在特征下采样过程中会丢失局部空间细节,导致对于图像信息的表征能力不足.针对以上问题,本文基于人类视觉系统的分层感知机制,提出了一... 图像质量评价在图像处理领域有着广泛的应用.基于深度学习的方法以多通道特征的形式获取图像信息,但在特征下采样过程中会丢失局部空间细节,导致对于图像信息的表征能力不足.针对以上问题,本文基于人类视觉系统的分层感知机制,提出了一种全参考图像质量评价方法,采用Siamese结构的卷积神经网络实现非线性映射,从不同尺度和视觉复杂度表征图像信息,并通过双重注意力模拟人类在评价图像质量时对视觉注意力的调控过程.此方法在特征提取阶段引入空间注意力机制,对特征图的二维空间位置赋以权重,计算人在感知图像失真信息时对空间区域的注意力差别.在特征融合阶段利用分组通道注意力模块显式建模通道间的依赖关系,对感知差异特征进行自适应的校准,使网络关注对于图像质量评价影响大的通道特征.实验结果表明,该方法在LIVE、TID2013和CSIQ 3个公开数据集上的斯皮尔曼相关系数分别达到0.975、0.938和0.963,在应对复杂失真类型图像时的性能提升显著,与人类主观评价的一致性良好. 展开更多
关键词 图像质量评价 卷积神经网络 双重注意力机制 分层感知表征
在线阅读 下载PDF
可解释性分层神经模糊网络的股票价格预测算法 被引量:1
16
作者 廖宏昊 胡峰 邓维斌 《计算机工程与设计》 北大核心 2024年第12期3615-3621,共7页
针对现有的股票价格预测模型难以兼顾精度与可解释性的问题,提出一种基于分层神经模糊网络的股票价格预测模型。提出一种结合注意力机制的自适应神经模糊网络单元(ANFIS-A),以此单元构建分层自适应神经模糊网络;结合二进制灰狼优化算法(... 针对现有的股票价格预测模型难以兼顾精度与可解释性的问题,提出一种基于分层神经模糊网络的股票价格预测模型。提出一种结合注意力机制的自适应神经模糊网络单元(ANFIS-A),以此单元构建分层自适应神经模糊网络;结合二进制灰狼优化算法(BGWO),提出一种特征子集选择算法;提出一种规则消除的递归算法,进一步减少规则数量,提高规则的可解释性。实验结果表明,该模型在预测股票价格方面具有较高的准确性和可解释性。 展开更多
关键词 灰狼优化算法 层次自适应模糊神经网络 注意力机制 股票价格预测 可解释性 金融时间序列 规则消除
在线阅读 下载PDF
一种分层注意力机制与用户动态偏好融合的序列推荐算法
17
作者 闫猛猛 汪海涛 +1 位作者 贺建峰 陈星 《小型微型计算机系统》 CSCD 北大核心 2024年第3期621-628,共8页
针对现有的序列推荐算法通常仅采用单一项目信息来捕获项目的潜在特征,以及循环神经网络存在时间依赖性随序列中位置单调变化的问题,提出一种分层注意力机制与用户动态偏好融合的序列推荐算法.首先,针对单一项目信息不足以学习项目准确... 针对现有的序列推荐算法通常仅采用单一项目信息来捕获项目的潜在特征,以及循环神经网络存在时间依赖性随序列中位置单调变化的问题,提出一种分层注意力机制与用户动态偏好融合的序列推荐算法.首先,针对单一项目信息不足以学习项目准确表示的问题,提出一种分层注意力机制用于学习高质量的项目表示.其次,针对循环神经网络的时间依赖性严重损害了用户近期偏好建模的问题,引入文本卷积神经网络来提取循环隐藏状态之间的短期序列模式,并根据用户意图将用户长期偏好与近期偏好进行动态融合.此外,针对传统自注意力机制无法对序列中元素的相对位置信息进行建模的问题,对现有的自注意力机制进行了改进,充分捕获序列中元素的相对位置信息.并在公开数据集MovieLens-1M与Amazon-Book上与现有优秀算法作比较,实验结果证明了所提算法的有效性. 展开更多
关键词 序列推荐 分层注意力机制 文本卷积神经网络 动态偏好
在线阅读 下载PDF
基于改进YOLOv8s的玫瑰鲜切花分级方法 被引量:2
18
作者 张玉玉 邴树营 +2 位作者 纪元浩 严蓓蓓 许金普 《智慧农业(中英文)》 CSCD 2024年第2期118-127,共10页
[目的/意义]针对当前玫瑰鲜切花分级仍依赖人工进行简单分级,造成效率低、准确率低等问题,提出一种新的模型Flower-YOLOv8s来实现玫瑰鲜切花的分级检测。[方法]以单一背景下单支玫瑰花的花头作为检测目标,将鲜切花分为A、B、C、D四个等... [目的/意义]针对当前玫瑰鲜切花分级仍依赖人工进行简单分级,造成效率低、准确率低等问题,提出一种新的模型Flower-YOLOv8s来实现玫瑰鲜切花的分级检测。[方法]以单一背景下单支玫瑰花的花头作为检测目标,将鲜切花分为A、B、C、D四个等级,对YOLOv8s(You Only Look Once version 8 small)模型进行了优化改进。首先,构建了一个全新的玫瑰鲜切花分级检测数据集。其次,在YOLOv8s的骨干网络分别添加CBAM(Con⁃volutional Block Attention Module)和SAM(Spatial Attion Module)两个注意力机制模块进行对比实验;选择SAM模块并对其进一步优化,针对模型轻量化需求,再结合深度可分离卷积模块一起添加到C2f结构中,形成Flower-YOLOv8s模型。[结果和讨论]从实验结果来看YOLOv8s添加SAM的模型具有更高的检测精度,mAP@0.5达到86.4%。Flower-YOLOv8s相较于基线模型精确率提高了2.1%,达到97.4%,平均精度均值(mAP)提高了0.7%,同时降低了模型参数和计算量,分别降低2.26 M和4.45 MB;最后使用相同的数据集和预处理方法与Fast-RCNN、Faster-RCNN、SSD、YOLOv3、YOLOv5s和YOLOv8s进行对比实验,证明所提出的实验方法综合强于其他经典YOLO模型。[结论]提出的基于改进YOLOv8s的玫瑰鲜切花分级方法研究能有效提升玫瑰鲜切花分级检测的精准度,为玫瑰鲜切花分级检测技术提供一定的参考价值。 展开更多
关键词 YOLOv8s 玫瑰鲜切花 分级检测 深度学习 SAM 注意力机制
在线阅读 下载PDF
注意力改进的动态自组织模块化神经网络结构设计及应用
19
作者 张昭昭 潘浩然 朱应钦 《计算机科学》 CSCD 北大核心 2024年第S02期163-171,共9页
针对混沌时间序列的复杂性和非线性特点,提出了一种专注于此类挑战的新型神经网络模型,即注意力改进的动态自组织模块化神经网络模型(ADAMNN)。该模型基于分而治之的思想,通过注意力机制计算不同子网络与输入数据的相似度,并利用层次聚... 针对混沌时间序列的复杂性和非线性特点,提出了一种专注于此类挑战的新型神经网络模型,即注意力改进的动态自组织模块化神经网络模型(ADAMNN)。该模型基于分而治之的思想,通过注意力机制计算不同子网络与输入数据的相似度,并利用层次聚类自适应地划分子网络。随后,采用基于层次聚类的动态生长机制,对子网络簇进行增减,最后通过激活的子网络簇对输入样本进行在线学习;同时,结合传统的集成输出方法,提出了一种基于注意力机制的子网络加权集成输出方法。最终分别在Mackey-Glass时间序列、M-G快时变时间序列、非线性系统辨识、煤矿开采过程中在瓦斯浓度数据集上进行了实验,ADAMNN展现出了实时更新子网络中心、动态构建子网络簇的能力,而且与基于欧几里得空间的动态自适应模块化神经网络相比,预测准确度提高了约40%。 展开更多
关键词 模块化神经网络 自组织神经网络 混沌时间序列 注意力机制 层次聚类
在线阅读 下载PDF
一种用于基于方面情感分析的深度分层网络模型 被引量:48
20
作者 刘全 梁斌 +1 位作者 徐进 周倩 《计算机学报》 EI CSCD 北大核心 2018年第12期2637-2652,共16页
近年来,基于方面情感分析已成为自然语言处理领域的研究热点之一.结合注意力机制的深度网络模型在基于方面情感分析任务中取得了令人瞩目的成功,针对以独立句子作为网络模型输入的方法无法获取句子间相互关系,以及仅使用词语层注意力机... 近年来,基于方面情感分析已成为自然语言处理领域的研究热点之一.结合注意力机制的深度网络模型在基于方面情感分析任务中取得了令人瞩目的成功,针对以独立句子作为网络模型输入的方法无法获取句子间相互关系,以及仅使用词语层注意力机制难以充分获取同一评论中句子间的相互联系等问题,提出一种结合区域卷积神经网络和分层长短期记忆网络(Regional Convolutional Neural Network-Hierarchical Long Short-Term Memory,RCNN-HLSTM)的深度分层网络模型用在基于方面情感分析任务中.该模型通过区域CNN既可以保留不同句子在评论中的时序关系也可以大大降低仅使用LSTM网络的时间代价.此外,该模型利用一个分层LSTM网络来获取待分类句子内部词语之间的相互联系,以及待分类句子和评论中其他句子之间的情感特征信息.通过词语层和句子层注意力机制能有效获取特定方面在句子中的局部特征和整个评论中的长距离依赖关系,弥补了仅使用词语层注意力机制的不足.最后在多种语言的不同领域数据集上进行实验,取得了比传统的深度网络模型、结合注意力机制的深度网络模型以及考虑句子间关系的双向分层LSTM网络模型更好的分类效果. 展开更多
关键词 深度学习 基于方面情感分析 分层模型 循环神经网络 卷积神经网络 注意力机
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部