针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法...针对数据存储中心硬盘故障数据稀少造成的故障预测效果不佳的问题,面向自我检测分析与报告技术(self-monitoring analysis and reporting technology,SMART)数据信息的时序特征,提出一种通过数据增强解决不平衡问题的硬盘故障预测算法。该算法利用长短期记忆网络改进传统的生成对抗网络,生成包含故障恶化趋势信息的序列段数据,解决了数据集不平衡问题。同时,为进一步提高预测性能,预测模型融合了时序注意力机制和特征注意力机制,挖掘不同SMART特征和时间步对硬盘故障恶化过程的敏感程度。此外,在特征选择阶段结合了多种典型特征选择算法来选取关键特征。在真实硬盘数据集上进行了实验验证,结果表明,所提算法的准确率、召回率和F 1值均有较大提升。展开更多
针对在工业环境下因图片数据样本量较小影响带钢表面缺陷检测分类精度,通常采用数据增广策略但需保证细节特征多样性的问题,提出了一种多样性激励深度卷积生成对抗网络VS-DCGAN(variety-stimulation deep convolutional generation adve...针对在工业环境下因图片数据样本量较小影响带钢表面缺陷检测分类精度,通常采用数据增广策略但需保证细节特征多样性的问题,提出了一种多样性激励深度卷积生成对抗网络VS-DCGAN(variety-stimulation deep convolutional generation adversal network)和MobileViT的带钢表面缺陷分类方法。首先,引入深度卷积生成对抗网络,利用通道注意力机制和多样性激励模块对其进行改进;再用VS-DCGAN对原始数据集进行扩充并保证细节特征多样性;然后,在扩充后的带钢表面缺陷数据集上训练轻量级分类网络MobileViT;最终实现带钢表面缺陷的分类。实验结果表明,多样性激励深度卷积生成对抗网络可以生成与原始图像数据分布相似且细节特征更丰富的带钢表面缺陷图片,达到了数据增强的目的;且扩充后的数据集能够使得轻量级分类网络MobileViT的训练效果更优异,3个版本的分类准确率分别为97.33%、98.66%、97.33%,分别提高了0.33%、1.5%、2.13%,高效地实现了带钢表面缺陷分类。展开更多
为了识别中文文本中的嵌套实体,并提高实体识别的准确度,本文提出一种基于多尺度卷积和数据增强的中文嵌套实体识别模型DAMCNER(Data Augmentation and Multi-scale Convolution based Named Entity Recognition).该模型首先利用预训练...为了识别中文文本中的嵌套实体,并提高实体识别的准确度,本文提出一种基于多尺度卷积和数据增强的中文嵌套实体识别模型DAMCNER(Data Augmentation and Multi-scale Convolution based Named Entity Recognition).该模型首先利用预训练模型生成原始输入的嵌入表示并对嵌入特征进行语义增强,之后通过多头双仿射注意力机制构造跨度特征矩阵,并使用多尺度膨胀卷积层和基于内容的注意力机制对跨度特征矩阵进行进一步的特征提取,最后使用多层感知机进行跨度解码.此外,本文设计了数据增强模块强化数据样本的多样性,让模型具有更强的鲁棒性和泛化能力,并且进一步提升识别精确度.在三个公开的中文嵌套实体数据集上的实验结果表明,DAMCNER模型的性能优于现有基线模型,F1值平均提升了1.52%.实验证明DAMCNER模型在不同场景下均有较好效果,有效提升了中文嵌套实体识别的效果.展开更多
文摘为了识别中文文本中的嵌套实体,并提高实体识别的准确度,本文提出一种基于多尺度卷积和数据增强的中文嵌套实体识别模型DAMCNER(Data Augmentation and Multi-scale Convolution based Named Entity Recognition).该模型首先利用预训练模型生成原始输入的嵌入表示并对嵌入特征进行语义增强,之后通过多头双仿射注意力机制构造跨度特征矩阵,并使用多尺度膨胀卷积层和基于内容的注意力机制对跨度特征矩阵进行进一步的特征提取,最后使用多层感知机进行跨度解码.此外,本文设计了数据增强模块强化数据样本的多样性,让模型具有更强的鲁棒性和泛化能力,并且进一步提升识别精确度.在三个公开的中文嵌套实体数据集上的实验结果表明,DAMCNER模型的性能优于现有基线模型,F1值平均提升了1.52%.实验证明DAMCNER模型在不同场景下均有较好效果,有效提升了中文嵌套实体识别的效果.