人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先...人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。展开更多
为实现YOLO(you only look once)模型的超参数自动优化,提出基于正交优化策略的YOLO模型超参数优化方法(hyper-parameter optimization of YOLO model based on orthogonal optimization strategy,OOS)。首先基于统计学的正交试验原理,...为实现YOLO(you only look once)模型的超参数自动优化,提出基于正交优化策略的YOLO模型超参数优化方法(hyper-parameter optimization of YOLO model based on orthogonal optimization strategy,OOS)。首先基于统计学的正交试验原理,提出了种群的正交搜索方法与超参数贡献度分析策略,提高了算法的优化效率;然后,设计了均匀正交搜索策略和邻域正交搜索策略,以缓解YOLO模型陷入局部最优和早熟收敛问题。最后,在NWPU VHR-10和Pascal VOC两个目标检测数据集上,以YOLOv5、YOLOv5s-Transformer和YOLOv7为优化对象进行测试,测试结果表明,所提出的OOS超参数优化方法对于YOLO模型的识别精度均有所提升。在两个数据集上的平均识别精度mAP@0.5分别提升至93.94%、93.18%、93.45%以及85.81%、84.59%、90.62%;mAP@0.5-0.95提升至60.00%、60.08%、56.98%以及62.27%、58.89%、71.91%,可为目标检测模型的超参数智能优化提供一种新方法。展开更多
为满足智能制造企业对产品质量检测的需求,服务制造企业生产管理,对缺陷检测技术的研究现状、典型方法和应用进行梳理.首先总结了磁粉检测法、渗透检测法、涡流检测法、超声波检测法、机器视觉和基于深度学习的缺陷检测技术的优缺点;对...为满足智能制造企业对产品质量检测的需求,服务制造企业生产管理,对缺陷检测技术的研究现状、典型方法和应用进行梳理.首先总结了磁粉检测法、渗透检测法、涡流检测法、超声波检测法、机器视觉和基于深度学习的缺陷检测技术的优缺点;对比分析了磁粉检测法、渗透检测法、涡流检测法、超声波检测法、机器视觉检测的主流缺陷检测技术和基于深度学习的缺陷检测技术的研究现状;然后,梳理了缺陷检测技术在电子元器件、管道、焊接件、机械零件和质量控制中的典型应用;最后,对缺陷检测技术的研究情况进行了总结和展望,指出该研究领域亟需解决的问题和未来发展的方向,并从高精度、高定位、快速检测、小目标、复杂背景、被遮挡物体检测、物体关联关系等几个方面总结近年来发表在ICCV(International Conference on Computer Vision)和CVPR(International Conference on Computer Vision and Pattern Recognition)等知名国际会议上相关论文的核心思想和源代码,为缺陷检测技术的进一步发展提供理论和应用上的借鉴与参考.展开更多
表面肌电信号(Surface Electromyography,sEMG)常用于预测人体意图行为,是一种不平稳、非周期、含有噪声的生物电信号,容易受工频干扰、环境干扰等影响,导致对其进行预测存在一定难度。对此,提出了一种基于变分模态分解(Variatio-nal Mo...表面肌电信号(Surface Electromyography,sEMG)常用于预测人体意图行为,是一种不平稳、非周期、含有噪声的生物电信号,容易受工频干扰、环境干扰等影响,导致对其进行预测存在一定难度。对此,提出了一种基于变分模态分解(Variatio-nal Mode Decomposition,VMD)和改进粒子群优化(Particle Swarm Optimization,PSO)算法的复合神经网络模型(Composite Neural Network Model,CNNM)。该模型结合了长短期记忆网络(Long-Short Term Memory,LSTM)、卷积神经网络(Convolutional Neural Networks,CNN)和双向长短期记忆网络(Bidirectional Long Short Term Memory,BiLSTM)。首先对PSO算法进行改进以优化VMD的参数,通过VMD处理sEMG信号,提出希尔伯特能量法,对分解后的分量进行加权重构,降低信号复杂性并保留关键特征。然后利用LSTM方法从sEMG信号中提取时间特征,利用CNN方法进一步提取空间特征,并通过注意力机制强化对关键信息的提取,最后输入BiLSTM中进行预测识别。实验结果表明,该模型的预测准确率可达99.9%,相较于其他模型提高了3%~8%,并通过消融实验验证了各模块的作用。该研究旨在提高手势动作的预测识别精度,为康复训练机器人的控制提供有效的解决方案。展开更多
动力电池的荷电状态(State of Charge,SOC)是保障储能电站正常运行和安全的重要参数之一。提出一种基于卷积神经网络(CNN)与门控循环神经网络(GRU)结合的电池SOC预测方法。首先使用该网络分别对单体电池充放电实验数据进行估计并于真实...动力电池的荷电状态(State of Charge,SOC)是保障储能电站正常运行和安全的重要参数之一。提出一种基于卷积神经网络(CNN)与门控循环神经网络(GRU)结合的电池SOC预测方法。首先使用该网络分别对单体电池充放电实验数据进行估计并于真实SOC值进行对比分析,测试结果显示,充电时所提出的CNN-GRU联合神经网络估计的SOC值与真实值之间的误差绝对值[0.0004%,1.71%]。放电时充电时所提出的CNN-GRU联合神经网络估计的SOC值与真实值之间的误差绝对值[0.0002%,3.0%]。然后采用电池组的运营数据进行电池组的SOC的估计,并与实际运行数据的中SOC值进行比较,充电时的误差绝对值范围为[0.0029%,3.1%],放电时误差绝对值范围为[0.0001%,3.7%]。结果表明所提出的CNN-GRU联合算法在纯电动公交车锂电池组SOC估计方面具有良好的应用价值。展开更多
文摘人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。
文摘为实现YOLO(you only look once)模型的超参数自动优化,提出基于正交优化策略的YOLO模型超参数优化方法(hyper-parameter optimization of YOLO model based on orthogonal optimization strategy,OOS)。首先基于统计学的正交试验原理,提出了种群的正交搜索方法与超参数贡献度分析策略,提高了算法的优化效率;然后,设计了均匀正交搜索策略和邻域正交搜索策略,以缓解YOLO模型陷入局部最优和早熟收敛问题。最后,在NWPU VHR-10和Pascal VOC两个目标检测数据集上,以YOLOv5、YOLOv5s-Transformer和YOLOv7为优化对象进行测试,测试结果表明,所提出的OOS超参数优化方法对于YOLO模型的识别精度均有所提升。在两个数据集上的平均识别精度mAP@0.5分别提升至93.94%、93.18%、93.45%以及85.81%、84.59%、90.62%;mAP@0.5-0.95提升至60.00%、60.08%、56.98%以及62.27%、58.89%、71.91%,可为目标检测模型的超参数智能优化提供一种新方法。
文摘为满足智能制造企业对产品质量检测的需求,服务制造企业生产管理,对缺陷检测技术的研究现状、典型方法和应用进行梳理.首先总结了磁粉检测法、渗透检测法、涡流检测法、超声波检测法、机器视觉和基于深度学习的缺陷检测技术的优缺点;对比分析了磁粉检测法、渗透检测法、涡流检测法、超声波检测法、机器视觉检测的主流缺陷检测技术和基于深度学习的缺陷检测技术的研究现状;然后,梳理了缺陷检测技术在电子元器件、管道、焊接件、机械零件和质量控制中的典型应用;最后,对缺陷检测技术的研究情况进行了总结和展望,指出该研究领域亟需解决的问题和未来发展的方向,并从高精度、高定位、快速检测、小目标、复杂背景、被遮挡物体检测、物体关联关系等几个方面总结近年来发表在ICCV(International Conference on Computer Vision)和CVPR(International Conference on Computer Vision and Pattern Recognition)等知名国际会议上相关论文的核心思想和源代码,为缺陷检测技术的进一步发展提供理论和应用上的借鉴与参考.
文摘表面肌电信号(Surface Electromyography,sEMG)常用于预测人体意图行为,是一种不平稳、非周期、含有噪声的生物电信号,容易受工频干扰、环境干扰等影响,导致对其进行预测存在一定难度。对此,提出了一种基于变分模态分解(Variatio-nal Mode Decomposition,VMD)和改进粒子群优化(Particle Swarm Optimization,PSO)算法的复合神经网络模型(Composite Neural Network Model,CNNM)。该模型结合了长短期记忆网络(Long-Short Term Memory,LSTM)、卷积神经网络(Convolutional Neural Networks,CNN)和双向长短期记忆网络(Bidirectional Long Short Term Memory,BiLSTM)。首先对PSO算法进行改进以优化VMD的参数,通过VMD处理sEMG信号,提出希尔伯特能量法,对分解后的分量进行加权重构,降低信号复杂性并保留关键特征。然后利用LSTM方法从sEMG信号中提取时间特征,利用CNN方法进一步提取空间特征,并通过注意力机制强化对关键信息的提取,最后输入BiLSTM中进行预测识别。实验结果表明,该模型的预测准确率可达99.9%,相较于其他模型提高了3%~8%,并通过消融实验验证了各模块的作用。该研究旨在提高手势动作的预测识别精度,为康复训练机器人的控制提供有效的解决方案。
文摘动力电池的荷电状态(State of Charge,SOC)是保障储能电站正常运行和安全的重要参数之一。提出一种基于卷积神经网络(CNN)与门控循环神经网络(GRU)结合的电池SOC预测方法。首先使用该网络分别对单体电池充放电实验数据进行估计并于真实SOC值进行对比分析,测试结果显示,充电时所提出的CNN-GRU联合神经网络估计的SOC值与真实值之间的误差绝对值[0.0004%,1.71%]。放电时充电时所提出的CNN-GRU联合神经网络估计的SOC值与真实值之间的误差绝对值[0.0002%,3.0%]。然后采用电池组的运营数据进行电池组的SOC的估计,并与实际运行数据的中SOC值进行比较,充电时的误差绝对值范围为[0.0029%,3.1%],放电时误差绝对值范围为[0.0001%,3.7%]。结果表明所提出的CNN-GRU联合算法在纯电动公交车锂电池组SOC估计方面具有良好的应用价值。