针对红外小目标图像的低分辨率、特征信息少、识别准确率低等问题,提出嵌入空间位置信息和多视角特征提取(Embedded Spatial Location Information and Multi-view Feature Extraction,ESLIMFE)的红外小目标检测模型。首先,随着网络深...针对红外小目标图像的低分辨率、特征信息少、识别准确率低等问题,提出嵌入空间位置信息和多视角特征提取(Embedded Spatial Location Information and Multi-view Feature Extraction,ESLIMFE)的红外小目标检测模型。首先,随着网络深度的增加导致特征图分辨率逐渐减小从而丢失细节信息,因此在骨干网络中嵌入空间位置信息融合注意力机制(Spatial Location Information Fusion,SLIF)弥补小目标特征信息。其次,结合C3模块和动态蛇形卷积提出多视角特征提取(Multi-view Feature Extraction,MVFE)模块,通过在不同视角下提取同一特征来增强小目标的特征表达能力。采用大选择核(Large Selection Kernel,LSK)模块,通过使用不同大小的卷积核提取小目标多尺度信息,以提高对红外小目标定位能力。最后,引入基于注意力的尺度内特征交互(Attention-based Intrascale Feature Interaction,AIFI)模块增强特征之间的交互性。在对空红外小目标数据集上进行实验,实验结果表明,mAP75的检测精度为90.5%,mAP50~95检测精度为74.5%,文中模型能够较好地实现对红外小目标精确检测。展开更多
跌倒是威胁老年人健康最危险的意外事故之一,身体平衡能力与跌倒有极大关系。目前对老人身体平衡能力的研究集中于身体素质的粗略评估或人体关键部位加速度信息的瞬时变化,针对其难以准确对平衡能力进行评判的不足,提出一种基于HBKPSP(H...跌倒是威胁老年人健康最危险的意外事故之一,身体平衡能力与跌倒有极大关系。目前对老人身体平衡能力的研究集中于身体素质的粗略评估或人体关键部位加速度信息的瞬时变化,针对其难以准确对平衡能力进行评判的不足,提出一种基于HBKPSP(Human Body Key Parts’Spatial Position)的平衡能力测定方法。首先,基于人体42个关键部位的空间位置信息,对66名老年人3秒的行走过程进行了分析,初步提取了25个用于衡量人体平衡能力的特征;然后,研究了25个特征与老年人平衡能力之间的关系,结果表明其中重心与冠状面偏移量,重心与矢状面偏移量,胯部、肩部、臂部等在矢状面内偏移程度等13个特征可以用作衡量老年人身体平衡能力的指标;最后,对13个平衡指标进行降维处理至三维,并对其进行聚类分析,结果表明降维后的平衡指标和聚类方法可以用于明显区别平衡能力较好和平衡能力较差的两类老年人。最后一句属自我评价,作者同意删本文的研究内容可以为老年人身体平衡能力测定提供参考依据,并为进一步跌倒风险评估提供研究基础。展开更多
【目的】针对遥感图像分类任务,为使模型精确捕获高层语义信息的同时降低计算复杂度,解决遥感图像分类任务中类内差异大而类间差异小的问题,提出了基于Mobile Vi T轻量化网络的遥感图像分类方法。【方法】基于Transformer框架,通过在卷...【目的】针对遥感图像分类任务,为使模型精确捕获高层语义信息的同时降低计算复杂度,解决遥感图像分类任务中类内差异大而类间差异小的问题,提出了基于Mobile Vi T轻量化网络的遥感图像分类方法。【方法】基于Transformer框架,通过在卷积神经网络中引入注意力机制来实现对图像特征的提取和编码。在训练阶段,Mobile Vi T使用类似于传统Transformer模型的自监督学习方法,即通过无监督的方式学习图像特征的表示。通过使用一种名为Contrastive Multiview Coding(CMC)的学习策略,该策略可以通过最大化不同视角下的图像相似性来学习图像特征。在训练过程中,Mobile Vi T使用随机数据增强技术和Dropout等方法来增加模型的泛化能力,同时应用权重衰减和梯度剪裁等技术来避免过拟合和爆炸梯度问题。在推理阶段,Mobile Vi T将输入的图像沿着通道轴划分成多个块,并将每个块作为一个序列输入到Transformer网络中。在Transformer网络中,Mobile Vi T采用多头自注意力机制和全连接层,将每个块的特征编码成一个固定长度的向量。然后,Mobile Vi T使用全局池化操作来获得整个图像的表示,并将其送入一个分类器中进行预测。在Mobile Vi T中,局部注意力机制和跨尺度注意力机制被嵌入到了Transformer网络结构中,从而提升了模型的性能。【结果】本方法可以避免过拟合问题,实现对图像特征的高效提取和编码,在AID测试集的准确率达95.0%,在RSD46-WHU测试集的准确率达87.4%,具有较好的鲁棒性,能够在短时间的训练中快速提升准确率,在不损失大量精度的情况下,极大地减少了Transformer框架训练所需的参数,可为Transformer轻量化设计奠定基础。展开更多
文摘跌倒是威胁老年人健康最危险的意外事故之一,身体平衡能力与跌倒有极大关系。目前对老人身体平衡能力的研究集中于身体素质的粗略评估或人体关键部位加速度信息的瞬时变化,针对其难以准确对平衡能力进行评判的不足,提出一种基于HBKPSP(Human Body Key Parts’Spatial Position)的平衡能力测定方法。首先,基于人体42个关键部位的空间位置信息,对66名老年人3秒的行走过程进行了分析,初步提取了25个用于衡量人体平衡能力的特征;然后,研究了25个特征与老年人平衡能力之间的关系,结果表明其中重心与冠状面偏移量,重心与矢状面偏移量,胯部、肩部、臂部等在矢状面内偏移程度等13个特征可以用作衡量老年人身体平衡能力的指标;最后,对13个平衡指标进行降维处理至三维,并对其进行聚类分析,结果表明降维后的平衡指标和聚类方法可以用于明显区别平衡能力较好和平衡能力较差的两类老年人。最后一句属自我评价,作者同意删本文的研究内容可以为老年人身体平衡能力测定提供参考依据,并为进一步跌倒风险评估提供研究基础。
文摘【目的】针对遥感图像分类任务,为使模型精确捕获高层语义信息的同时降低计算复杂度,解决遥感图像分类任务中类内差异大而类间差异小的问题,提出了基于Mobile Vi T轻量化网络的遥感图像分类方法。【方法】基于Transformer框架,通过在卷积神经网络中引入注意力机制来实现对图像特征的提取和编码。在训练阶段,Mobile Vi T使用类似于传统Transformer模型的自监督学习方法,即通过无监督的方式学习图像特征的表示。通过使用一种名为Contrastive Multiview Coding(CMC)的学习策略,该策略可以通过最大化不同视角下的图像相似性来学习图像特征。在训练过程中,Mobile Vi T使用随机数据增强技术和Dropout等方法来增加模型的泛化能力,同时应用权重衰减和梯度剪裁等技术来避免过拟合和爆炸梯度问题。在推理阶段,Mobile Vi T将输入的图像沿着通道轴划分成多个块,并将每个块作为一个序列输入到Transformer网络中。在Transformer网络中,Mobile Vi T采用多头自注意力机制和全连接层,将每个块的特征编码成一个固定长度的向量。然后,Mobile Vi T使用全局池化操作来获得整个图像的表示,并将其送入一个分类器中进行预测。在Mobile Vi T中,局部注意力机制和跨尺度注意力机制被嵌入到了Transformer网络结构中,从而提升了模型的性能。【结果】本方法可以避免过拟合问题,实现对图像特征的高效提取和编码,在AID测试集的准确率达95.0%,在RSD46-WHU测试集的准确率达87.4%,具有较好的鲁棒性,能够在短时间的训练中快速提升准确率,在不损失大量精度的情况下,极大地减少了Transformer框架训练所需的参数,可为Transformer轻量化设计奠定基础。