期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
基于组卷积和膨胀卷积的轻量注意力模块
1
作者 张恩淘 郝晓丽 牛保宁 《计算机工程与设计》 北大核心 2025年第2期493-499,共7页
为解决目前的注意力模块中参数量大、通道压缩导致信息丢失、空间信息学习不充分的缺点,提出一种基于组卷积、通道清洗和膨胀卷积的轻量注意力模块。采取组卷积和通道清洗的方式学习通道权重,能够在不压缩通道的前提下减少大量参数,使... 为解决目前的注意力模块中参数量大、通道压缩导致信息丢失、空间信息学习不充分的缺点,提出一种基于组卷积、通道清洗和膨胀卷积的轻量注意力模块。采取组卷积和通道清洗的方式学习通道权重,能够在不压缩通道的前提下减少大量参数,使不同组之间产生交互,充分学习通道信息。采取连续的膨胀卷积,合理设置膨胀率充分且均衡的学习空间信息。通过CIFAR100和VOC 2007+2012数据集对所提模块在图像分类和目标检测中进行实验,验证其能够在较少的花费下带来较大的提升。 展开更多
关键词 深度学习 卷积神经网络 注意力机制 卷积 膨胀卷积 图像分类 目标检测
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
2
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
基于残差膨胀卷积与门控编解码网络的语音增强
3
作者 李珂 王雅静 +1 位作者 昝志辉 齐瑞洁 《电子测量与仪器学报》 北大核心 2025年第4期74-83,共10页
语音信号的时序依赖性特征和上下文信息在语音增强任务中至关重要,针对编解码网络对其捕获不充分导致增强效果差的问题,构建了一种非对称的残差膨胀卷积与门控编解码网络(RD-EGN),该网络包含编码器、中间层和解码器3部分。编码器设计了... 语音信号的时序依赖性特征和上下文信息在语音增强任务中至关重要,针对编解码网络对其捕获不充分导致增强效果差的问题,构建了一种非对称的残差膨胀卷积与门控编解码网络(RD-EGN),该网络包含编码器、中间层和解码器3部分。编码器设计了一种因果卷积层结构,以时序特征建模,捕获语音序列中不同层的特征,并保持语音信号的因果性;中间层设计了残差膨胀卷积网络(RDCN),融合膨胀卷积、残差连接和级联的扩张块使网络拥有更高的感受野,以跨层的方式传递信息并提取语音长时依赖性特征,在此基础上将RDCN与长短时记忆网络相结合,捕获更广泛的上下文信息;解码器引入门控机制,动态调整信息流的门控程度,获得更丰富的全局特征并重建增强语音。分别在TIMIT、UrbanSound8k、VoiceBank及NOISE92数据集上进行消融及性能对照,实验结果表明,RD-EGN相较于卷积循环网络(CRN)、自编码器卷积神经网络(AECNN)、膨胀-密集自动编码器(DDAEC)等具有较少的训练参数和较高的SSNR得分、主观评价指标(CSIG,CBAK和COVL)得分,并且在客观评价指标方面,语音质量客观评价指标(PESQ)提高了2.5%~7.1%,短时客观可懂度(STOI)提高了1%~5.3%,具有较为突出的增强性能与泛化能力。 展开更多
关键词 语音增强 深度学习 编解码网络 膨胀卷积 门控机制
在线阅读 下载PDF
基于BERT和膨胀卷积的煤矿事故命名实体识别
4
作者 戚嘉祥 王占刚 《计算机工程与设计》 北大核心 2025年第10期2961-2968,共8页
针对煤矿领域缺少数据集,实体边界模糊,训练效率低,识别结果不理想等问题,构建煤矿事故数据集并提出一种命名实体识别模型。通过动态加权方法融合BERT模型的每层输出,获得更丰富的语义表示;利用多尺度的残差迭代膨胀卷积网络学习上下文... 针对煤矿领域缺少数据集,实体边界模糊,训练效率低,识别结果不理想等问题,构建煤矿事故数据集并提出一种命名实体识别模型。通过动态加权方法融合BERT模型的每层输出,获得更丰富的语义表示;利用多尺度的残差迭代膨胀卷积网络学习上下文信息;最后通过条件随机场得到最优标签序列。通过煤矿事故数据集进行实验,模型F1值达到86.31%,对比基线模型大幅提高,同时缩短了训练时间,验证了模型的有效性,通过多个公开数据集验证了模型具备泛化能力。 展开更多
关键词 命名实体识别 煤矿事故 注意力机制 加权融合 膨胀卷积 条件随机场 深度学习
在线阅读 下载PDF
融合多粒度膨胀卷积和扩展边界的中文命名实体识别算法
5
作者 侯向丹 孙晓凯 刘洪普 《计算机工程与应用》 北大核心 2025年第7期196-203,共8页
命名实体识别在自然语言处理领域扮演着基础且关键的角色,它是信息提取、问答系统、机器翻译等众多常见应用的核心组成元素。其识别成果将直接决定后续多个下游自然语言处理任务的表现,因此具有极大的研究价值。但现有的对中文命名实体... 命名实体识别在自然语言处理领域扮演着基础且关键的角色,它是信息提取、问答系统、机器翻译等众多常见应用的核心组成元素。其识别成果将直接决定后续多个下游自然语言处理任务的表现,因此具有极大的研究价值。但现有的对中文命名实体识别的研究主要集中在规律性实体上,对于非规律性实体和多表现形式实体的识别效果有待提升,如各种名称。为了解决这一问题,在基于规则启发模型(regularity-inspired recognition network,RICON)的基础上,提出了一种“实体的扩展规则网络”(extension regular of entity network,ERoEN),通过加入边界扩展机制捕获每个扩展后实体的规律,从而提取非规律性实体前后的隐含特征,以此提高对非规律性实体的识别能力;并且引入多粒度膨胀卷积层捕获不同距离的上下文信息,增强实体与上下文的关联性,最终提高对多表现形式实体的识别效果。通过在OntoNote4、Weibo和CLUENER2020数据集上的验证,ERoEN模型相比于RICON模型大部分实验中在F1值上分别提升了1.27、1.02和1.13个百分点。 展开更多
关键词 命名实体识别 注意力机制 膨胀卷积 边界扩展
在线阅读 下载PDF
融合对抗训练与迭代膨胀卷积的藏医药命名实体识别方法
6
作者 拉毛杰 万玛才旦 +2 位作者 拥措 高兴 尼玛扎西 《高原科学研究》 2025年第1期105-118,共14页
当前藏文命名实体识别模型在处理藏医药领域的实体识别任务时,往往面临迁移性和泛化能力受限以及语义关联捕捉不充分和实体边界模糊等问题。文章提出一种融合对抗训练与迭代膨胀卷积的藏医药文本命名实体识别模型(TM-ATD)。该方法首先... 当前藏文命名实体识别模型在处理藏医药领域的实体识别任务时,往往面临迁移性和泛化能力受限以及语义关联捕捉不充分和实体边界模糊等问题。文章提出一种融合对抗训练与迭代膨胀卷积的藏医药文本命名实体识别模型(TM-ATD)。该方法首先基于《四部医典》构建了藏文音节标注的数据集TibetanAI_YUTOK_NER。其次采用预训练模型对藏文音节进行特征编码,融合对抗训练生成对抗样本以增强模型鲁棒性和泛化能力;通过双向长短时记忆网络捕捉序列依赖关系;采用迭代膨胀卷积全面捕捉文本上下文信息和全局特征,并利用多头自注意力机制增强局部上下文的理解能力,强化实体边界信息和文本语义关联。最后采用条件随机场进行解码操作输出最优标签序列。实验结果表明,融合对抗训练与迭代膨胀卷积的方法在藏医药文本数据集和藏文数据集TibetanAI_NER上的F1值分别达到了76.59%和54.91%,相较于基线模型,F1分别提升了3.03%和0.77%。 展开更多
关键词 藏医药 命名实体识别 预训练模型 对抗训练 膨胀卷积
在线阅读 下载PDF
基于特征重用和膨胀卷积的遥感图像舰船检测 被引量:2
7
作者 曲海成 李瑞柯 +1 位作者 王蒙 单以盟 《智能系统学报》 CSCD 北大核心 2024年第5期1298-1308,共11页
在光学遥感图像中,港口内的舰船目标通常处于密集的船只群中,并受到周围环境的干扰和遮挡,如集装箱、车辆等。为了进一步提高现有舰船目标检测算法的精度和泛化性能,提出了一种基于特征重用和膨胀卷积的遥感图像舰船检测算法。首先构建... 在光学遥感图像中,港口内的舰船目标通常处于密集的船只群中,并受到周围环境的干扰和遮挡,如集装箱、车辆等。为了进一步提高现有舰船目标检测算法的精度和泛化性能,提出了一种基于特征重用和膨胀卷积的遥感图像舰船检测算法。首先构建了基于分组卷积和拆分注意力的残差块来提取特征,同时嵌入可变形卷积提取更加符合舰船尺度变化的特征;接着,构造了多尺度感受野模块,通过并行提取多尺度特征后再进行融合来减少信息损失;最后,在原有特征金字塔的基础上构建了一条自底向上的特征重用聚合路径以提高特征表示能力。在大型遥感数据集DOTA和舰船数据集HRSC2016上进行实验,实验结果表明,所提方法能够有效缓解舰船目标漏检和误检问题,提高了遥感图像舰船目标检测的精度。 展开更多
关键词 遥感图像 舰船检测 特征重用 膨胀卷积 拆分注意力 分组卷积 特征金字塔 可变形卷积
在线阅读 下载PDF
融合膨胀卷积与ECA的钢材缺陷检测算法 被引量:2
8
作者 曹义亲 曹鑫晨 《计算机工程与设计》 北大核心 2024年第11期3312-3319,共8页
针对带钢材料表面缺陷检测中感受野受限导致目标漏检率高的问题,基于YoloX-s模型提出一种膨胀卷积与注意力机制融合的目标检测算法。在Backbone部分采用SPPF结构替换SPP结构,在Neck部分引入混合膨胀卷积模块用以增大检测的感受野,嵌入... 针对带钢材料表面缺陷检测中感受野受限导致目标漏检率高的问题,基于YoloX-s模型提出一种膨胀卷积与注意力机制融合的目标检测算法。在Backbone部分采用SPPF结构替换SPP结构,在Neck部分引入混合膨胀卷积模块用以增大检测的感受野,嵌入注意力机制ECA-net模块,保留特征图更多的通道信息,减少漏检率。后处理阶段采用CIoU损失函数,提高模型召回率。实验结果表明,改进算法在NEU-DET数据集上的mAP达到80.8%,较原模型提高4.6%,检测速度达到160 f/s,在带钢材料表面缺陷检测中具有一定的使用价值。 展开更多
关键词 带钢材料 缺陷检测 空间金字塔池化改进 膨胀卷积 注意力机制模块 损失函数 东北大学热轧带钢表面缺陷数据集
在线阅读 下载PDF
基于时空认知膨胀卷积网络与多源影响因素的PM_(2.5)细粒度预测模型 被引量:2
9
作者 刘希亮 赵俊杰 +3 位作者 张羽民 林绍福 李建强 梅强 《北京工业大学学报》 CAS CSCD 北大核心 2024年第3期333-347,共15页
为实现精确化、细粒度的PM_(2.5)浓度预测,提出了基于时空认知膨胀卷积网络(spatial-temporal cognitive dilated convolution network,ST-C-DCN)的PM_(2.5)浓度预测模型ST-C-DCN。该模型将时空因素、气象因素运用于PM_(2.5)浓度预测,... 为实现精确化、细粒度的PM_(2.5)浓度预测,提出了基于时空认知膨胀卷积网络(spatial-temporal cognitive dilated convolution network,ST-C-DCN)的PM_(2.5)浓度预测模型ST-C-DCN。该模型将时空因素、气象因素运用于PM_(2.5)浓度预测,基于因果卷积网络提取时空特征,并采用时空注意力机制优化了时空特征的提取。基于海口市空气污染数据的实验测试表明:对于单个监测站,基线模型相比,ST-C-DCN的均方根误差(root mean square error,RMSE)平均下降24.7%,平均绝对误差(mean absolute error,MAE)平均下降9.93%,拟合优度(R-squared,R^(2))平均上升3.35%。对于全部监测站点的预测,ST-C-DCN在win-tie-loss(包括MSE、RMSE、MAE、R^(2))实验中,均获得了最多的获胜次数,分别为68,68、63和64。通过不同数据抽样条件下的Friedman检验,证明了ST-C-DCN对比基准有显著的性能提升。ST-C-DCN为细粒度PM_(2.5)预测提供了一个具有潜力的方向。 展开更多
关键词 PM_(2.5)预测 多源影响因素 膨胀卷积网络 贝叶斯优化 Shapley分析 Friedman检验
在线阅读 下载PDF
基于动态蛇形-膨胀卷积模型的矿区地裂缝提取 被引量:1
10
作者 王晓宇 蔡音飞 胡海峰 《测绘通报》 CSCD 北大核心 2024年第10期144-150,共7页
采动裂缝是煤矿地下开采造成的破坏形式之一。针对矿区地表环境复杂、无人机图像裂缝提取方法精度较低的问题,本文融合动态蛇形卷积和膨胀卷积构建了全新的动态蛇形-膨胀卷积,并将其添加到现有分割模型的编码、解码结构,以优化整体网络... 采动裂缝是煤矿地下开采造成的破坏形式之一。针对矿区地表环境复杂、无人机图像裂缝提取方法精度较低的问题,本文融合动态蛇形卷积和膨胀卷积构建了全新的动态蛇形-膨胀卷积,并将其添加到现有分割模型的编码、解码结构,以优化整体网络模型结构;构建了矿区裂缝数据集,并在该自制数据集上进行裂缝提取精度验证。结果表明,加入动态蛇形-膨胀卷积,可使模型的分割精度(平均交并比)提高14.96%,对于实现地裂缝准确提取具有实践价值。 展开更多
关键词 地下开采 地裂缝 无人机 裂缝提取 动态蛇形-膨胀卷积 精度评价
在线阅读 下载PDF
基于BERT特征融合与膨胀卷积的汉语副词框架语义角色标注
11
作者 王超 吕国英 +2 位作者 李茹 柴清华 李晋荣 《中文信息学报》 CSCD 北大核心 2024年第2期25-35,共11页
汉语框架语义角色标注对汉语框架语义分析具有重要作用。目前汉语框架语义角色标注任务主要针对动词框架,但是汉语没有丰富的形态变化,很多语法意义都是通过虚词来表现的,其中副词研究是现代汉语虚词研究的重要部分,因此该文从副词角度... 汉语框架语义角色标注对汉语框架语义分析具有重要作用。目前汉语框架语义角色标注任务主要针对动词框架,但是汉语没有丰富的形态变化,很多语法意义都是通过虚词来表现的,其中副词研究是现代汉语虚词研究的重要部分,因此该文从副词角度出发构建了汉语副词框架及数据集,且对框架下的词元按照语义强弱进行了等级划分。目前的语义角色标注模型大多基于BiLSTM网络模型,该模型虽然可以很好地获取全局信息,但容易忽略句子局部特征,且无法并行训练。针对上述问题,该文提出了基于BERT特征融合与膨胀卷积的语义角色标注模型,该模型包括四层:BERT层用于表达句子的丰富语义信息,Attention层对BERT获取的每一层信息进行动态权重融合,膨胀卷积(IDCNN)层进行特征提取,CRF层修正预测标签。该模型在三个副词框架数据集上表现良好,F1值均达到了82%以上。此外,将该模型应用于CFN数据集上,F1值达到88.29%,较基线模型提升了4%以上。 展开更多
关键词 汉语框架语义角色标注 副词 BERT 膨胀卷积 CRF
在线阅读 下载PDF
基于门控膨胀卷积循环网络的单声道语音增强 被引量:3
12
作者 尤昕源 王恒 《计算机应用》 CSCD 北大核心 2024年第4期1317-1324,共8页
上下文信息的使用在语音增强任务中具有重要作用。针对全局语音利用不充分的问题,提出一种用于复数频谱映射的门控膨胀卷积循环网络(GDCRN)。GDCRN包含编码器、门控时间卷积模块(GTCM)和解码器这3部分,编码器和解码器是非对称的网络结... 上下文信息的使用在语音增强任务中具有重要作用。针对全局语音利用不充分的问题,提出一种用于复数频谱映射的门控膨胀卷积循环网络(GDCRN)。GDCRN包含编码器、门控时间卷积模块(GTCM)和解码器这3部分,编码器和解码器是非对称的网络结构。首先,编码器利用门控膨胀卷积模块(GDCM)扩大感受野,处理特征;其次,使用GTCM捕获更长的上下文信息,并选择性传递特征;最后,解码器使用结合门控线性单元(GLU)的反卷积,反卷积与编码器中对应层的卷积层使用跳跃连接,并引入通道时频注意力(CTFA)机制。实验结果表明,相较于时间卷积神经网络(TCNN)、门控卷积循环网络(GCRN)等网络,所提网络的参数量和训练时间更少,客观语音质量评估(PESQ)和短时客观可懂度(STOI)都有显著改善,最高可提升0.2589和4.67个百分点,具有更好的增强效果与更强的泛化能力。 展开更多
关键词 语音增强 复数频谱映射 膨胀卷积 门控机制 注意力机制
在线阅读 下载PDF
基于多尺度门控膨胀卷积网络的时间序列预测算法 被引量:2
13
作者 曾渝 张洋 +3 位作者 曾尚 付茂栗 何启学 曾林隆 《计算机应用》 CSCD 北大核心 2024年第11期3427-3434,共8页
针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题,提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法,将原始协变量序列和预测变量序列分解为各自的周期项和趋势... 针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题,提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法,将原始协变量序列和预测变量序列分解为各自的周期项和趋势项,从而实现独立的预测。对于周期项,引入多头门控膨胀卷积网络的编码器,以提取各自的周期信息;在解码器阶段,使用交叉注意力机制进行通道信息的交互融合,并将预测变量的周期信息采样对齐后通过时间注意力与通道融合信息进行周期预测。对趋势项则采用自回归方式进行趋势预测。最后将趋势预测与周期预测的结果相加得到预测序列。与长短期记忆(LSTM)、Informer等多个主流基准模型进行比较,所提模型在ETTm1、ETTh1等5个数据集上的均方误差(MSE)平均下降了19.2%~52.8%,平均绝对误差(MAE)平均下降了12.1%~33.8%。通过消融实验验证了所提出的多尺度分解模块、多头门控膨胀卷积以及时间注意力模块能提升时序预测的准确度。 展开更多
关键词 时间序列预测 序列分解 膨胀卷积 编码器 解码器 注意力机制
在线阅读 下载PDF
基于膨胀卷积神经网络模型的中文分词方法 被引量:20
14
作者 王星 李超 陈吉 《中文信息学报》 CSCD 北大核心 2019年第9期24-30,共7页
目前,许多深度神经网络模型以双向长短时记忆网络结构处理中文分词任务,存在输入特征不够丰富、语义理解不全、计算速度慢的问题。针对以上问题,该文提出一种基于膨胀卷积神经网络模型的中文分词方法。通过加入汉字字根信息并用卷积神... 目前,许多深度神经网络模型以双向长短时记忆网络结构处理中文分词任务,存在输入特征不够丰富、语义理解不全、计算速度慢的问题。针对以上问题,该文提出一种基于膨胀卷积神经网络模型的中文分词方法。通过加入汉字字根信息并用卷积神经网络提取特征来丰富输入特征;使用膨胀卷积神经网络模型并加入残差结构进行训练,能够更好理解语义信息并提高计算速度。基于Bakeoff 2005语料库的4个数据集设计实验,与双向长短时记忆网络模型的中文分词方法做对比,实验表明该文提出的模型取得了更好的分词效果,并具有更快的计算速度。 展开更多
关键词 中文分词 膨胀卷积 深度学习 自然语言处理
在线阅读 下载PDF
基于注意力门控膨胀卷积网络的单通道语音增强 被引量:11
15
作者 张天骐 柏浩钧 +1 位作者 叶绍鹏 刘鉴兴 《电子与信息学报》 EI CSCD 北大核心 2022年第9期3277-3288,共12页
在有监督语音增强任务中,上下文信息对目标语音的估计产生重要影响,为了获取更加丰富的语音全局相关特征,该文以尽可能小的参数为前提,设计了一种新型卷积网络来进行语音增强。所提网络包含编码层、传输层与解码层3个部分:编解码部分提... 在有监督语音增强任务中,上下文信息对目标语音的估计产生重要影响,为了获取更加丰富的语音全局相关特征,该文以尽可能小的参数为前提,设计了一种新型卷积网络来进行语音增强。所提网络包含编码层、传输层与解码层3个部分:编解码部分提出一种2维非对称膨胀残差(2D-ADR)模块,其能明显减小训练参数并扩大感受野,提升网络对上下文信息的获取能力;传输层提出一种1维门控膨胀残差(1D-GDR)模块,该模块结合膨胀卷积、残差学习与门控机制,能够选择性传递特征并获取更多时序相关信息,同时采用密集跳跃连接的方式对8个1D-GDR模块进行堆叠,以增强层间信息流动并提供更多梯度传播方式;最后,对相应编解码层进行跳跃连接并引入注意力机制,以使解码过程获得更加鲁棒的底层特征。实验部分,使用了不同的参数设置以及对比方法来验证网络的有效性与鲁棒性,通过在28种噪声环境下训练及测试,相比于其他方法,该文方法以1.25×10^(6)的参数取得了更优的客观和主观指标,具备较强的增强效果与泛化能力。 展开更多
关键词 语音增强 膨胀卷积 残差学习 门控机制 注意力机制
在线阅读 下载PDF
融合动态掩码预训练与膨胀卷积的实体识别 被引量:1
16
作者 葛志辉 洪龙翔 +1 位作者 李陶深 叶进 《广西大学学报(自然科学版)》 CAS 北大核心 2022年第3期692-703,共12页
针对传统的BERT模型在使用中文语料进行预训练时无法获取词的信息问题,本文中在预训练阶段引入基于动态掩码的RoBERTa预训练模型;该预训练模型所生成的语义表示含有词的信息,能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模... 针对传统的BERT模型在使用中文语料进行预训练时无法获取词的信息问题,本文中在预训练阶段引入基于动态掩码的RoBERTa预训练模型;该预训练模型所生成的语义表示含有词的信息,能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,更适用于中文命名实体识别任务;同时通过字在上下文中能形成词的词向量对相应的字向量进行了增强;为了提高模型的效率,在序列建模层引入膨胀卷积神经网络。实验表明,该模型在多尺度上下文和结构化预测方面比传统CNN有更好的容量,在常用中文实体识别任务语料库上,验证了模型的有效性。 展开更多
关键词 实体识别 深度学习 膨胀卷积神经网络 条件随机场
在线阅读 下载PDF
残差膨胀卷积结构下的多模态特征调制方式识别 被引量:1
17
作者 左晓亚 张俊杰 +2 位作者 姚如贵 樊晔 蒋丽凤 《信号处理》 CSCD 北大核心 2023年第11期2013-2021,共9页
自动调制方式识别技术在通信领域有着不可或缺的作用,针对传统的卷积神经网络在信号分类问题中特征提取能力不足的问题,本文研究了一种利用多维度特征的端到端双流膨胀卷积神经网络来对调制信号进行分类的方法。该方法不仅利用原始采样... 自动调制方式识别技术在通信领域有着不可或缺的作用,针对传统的卷积神经网络在信号分类问题中特征提取能力不足的问题,本文研究了一种利用多维度特征的端到端双流膨胀卷积神经网络来对调制信号进行分类的方法。该方法不仅利用原始采样信号,还利用输入信号的瞬时幅度和相位信息;原始IQ(In-phase and Quadrature,IQ)数据输入进神经网络后,网络首先通过内置的数据预处理模块对输入的IQ信号进行预处理,提取原始信号的幅度和相位信息,再将原始IQ信号和幅度相位两种特征信息分别通过两个并行的卷积神经网络结构分别进行特征提取;本文所设计的双流卷积神经网络模型中的膨胀残差网络分支利用卷积核的膨胀卷积特性,将膨胀卷积与残差网络结构相结合,在网络参数不变的情况下使得卷积核具有更大的感受野,同时也能够更好地结合上下文信息,另一个网络分支是将卷积神经网络与长短期记忆神经网络相串联,然后将两个并行卷积神经网络的输出特征向量进行矩阵相乘达到两种特征信息融合的目的。整个识别过程是基于端到端的,数据预处理模块内嵌到神经网络内部,由神经网络完成对数据的预处理,只需将原始的IQ数据直接送入神经网络即可;仿真实验结果显示相比较于单分支结构的卷积神经网络模型或者循环神经网络模型,本文所提出的基于残差膨胀卷积的双流网络结构在数据集RML2016.10a上识别准确率有了极大地提升,识别准确率最高能够达到85%,同时对于单分支结构无法识别的16QAM和64QAM两种信号,本文模型也具有一定的分类能力。 展开更多
关键词 调制方式识别 膨胀卷积 双流卷积神经网络
在线阅读 下载PDF
基于特征膨胀卷积模块的轻量化技术研究 被引量:2
18
作者 许新征 李杉 《电子学报》 EI CAS CSCD 北大核心 2023年第2期355-364,共10页
本文从卷积神经网络模型的网络结构入手,利用特征复用的思想,设计了高效的特征膨胀卷积模块.该模块减少了标准卷积模块的输出通道数,引入了多分支结构.通过各个分支上的廉价操作对标准卷积操作的输出特征图进行变换和融合,产生新的特征... 本文从卷积神经网络模型的网络结构入手,利用特征复用的思想,设计了高效的特征膨胀卷积模块.该模块减少了标准卷积模块的输出通道数,引入了多分支结构.通过各个分支上的廉价操作对标准卷积操作的输出特征图进行变换和融合,产生新的特征图.模块的最终输出由各个分支上生成的特征图进行合并连接得到.特征膨胀卷积模块利用特征复用思想复用模型中的特征,在降低模型计算量的同时,丰富了特征图隐含的信息,提高了模型的性能.最后,将特征膨胀卷积模块代替标准卷积模块,设计了轻量化的VGG16(Visual Geometry Group 16-Layer)模型和残差结构,并且在CIFAR数据集和ILSVRC2012(ImageNet Large Scale Visual Recognition Challenge 2012)数据集上取得了较好的分类效果. 展开更多
关键词 卷积神经网络 轻量化 特征复用 特征膨胀卷积 深度学习 图像分类
在线阅读 下载PDF
多尺度膨胀卷积在图像分类中的应用 被引量:7
19
作者 吴昊昊 王方石 《计算机科学》 CSCD 北大核心 2020年第S01期166-171,186,共7页
在采用深度学习进行图像分类时,为减少下采样导致的空间信息损失,往往采用膨胀卷积代替下采样,但尚未有文献研究膨胀卷积作用于不同网络层的性能差异。文中进行了大量图像分类实验,找到了适宜膨胀卷积作用的最佳网络层。但使用膨胀卷积... 在采用深度学习进行图像分类时,为减少下采样导致的空间信息损失,往往采用膨胀卷积代替下采样,但尚未有文献研究膨胀卷积作用于不同网络层的性能差异。文中进行了大量图像分类实验,找到了适宜膨胀卷积作用的最佳网络层。但使用膨胀卷积会丢失近邻点的相关信息,导致网格现象,造成图像部分局部信息的丢失。为消除网格现象,又提出在前述最佳网络层采用多尺度膨胀卷积构建神经网络的方法。实验结果表明,所提出的构建网络方法在图像分类中取得了较好的效果。 展开更多
关键词 神经网络 图像分类 膨胀卷积 多尺度
在线阅读 下载PDF
基于膨胀卷积迭代与注意力机制的实体名识别方法 被引量:5
20
作者 吕江海 杜军平 +1 位作者 周南 薛哲 《计算机工程》 CAS CSCD 北大核心 2021年第1期58-65,71,共9页
针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特... 针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特性,即用简单的结构记录尽可能多的输入信息,并在准确提取文本序列特征的同时加快神经网络模型的训练速度。通过引入ATT运用文本语法信息和单词词性信息,从众多文本特征中选择对实体名识别更关键的特征,从而提高文本特征提取的准确性。在新闻数据集和微博数据集上的实验结果表明,神经网络模型的训练速度比传统的双向长短期记忆神经网络有显著提升,基于注意力的实体名识别方法的评价指标比传统的无注意力机制方法提高2%左右。 展开更多
关键词 实体名识别 注意力机制 膨胀卷积 长短期记忆网络 条件随机场
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部