人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先...人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。展开更多
针对城市场景下载人电动垂直起降飞行器(electric vertical takeoff and landing,eVTOL)路径规划问题进行了研究。首先,使用危险度栅格法进行三维城市空间建模,对选定型号的eVTOL飞行器,以航程、运行风险和高度变化为目标函数,结合飞行...针对城市场景下载人电动垂直起降飞行器(electric vertical takeoff and landing,eVTOL)路径规划问题进行了研究。首先,使用危险度栅格法进行三维城市空间建模,对选定型号的eVTOL飞行器,以航程、运行风险和高度变化为目标函数,结合飞行器自身特性及环境限制,构建了多约束条件的载人eVTOL路径规划模型。然后,设计了一种改进人工电场算法(im-proved artificial electric field algorithm,IAEFA),在传统人工电场算法(artificial electric field algorithm,AEFA)的基础上增加了自适应库伦参数,并在库伦常数的计算中引入递减系数,以此进行仿真求解。实验结果显示,所构建的模型可以达到预期效果。使用改进算法进行路径规划的求解效果更优,相较传统粒子群算法和人工电场法,航程更短,高度变化更小且运行更为安全。最后,根据对照实验确定递减系数的取值,当递减系数取值为1.5时,改进算法的求解效果最优。展开更多
深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言...深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。展开更多
文摘人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。
文摘针对城市场景下载人电动垂直起降飞行器(electric vertical takeoff and landing,eVTOL)路径规划问题进行了研究。首先,使用危险度栅格法进行三维城市空间建模,对选定型号的eVTOL飞行器,以航程、运行风险和高度变化为目标函数,结合飞行器自身特性及环境限制,构建了多约束条件的载人eVTOL路径规划模型。然后,设计了一种改进人工电场算法(im-proved artificial electric field algorithm,IAEFA),在传统人工电场算法(artificial electric field algorithm,AEFA)的基础上增加了自适应库伦参数,并在库伦常数的计算中引入递减系数,以此进行仿真求解。实验结果显示,所构建的模型可以达到预期效果。使用改进算法进行路径规划的求解效果更优,相较传统粒子群算法和人工电场法,航程更短,高度变化更小且运行更为安全。最后,根据对照实验确定递减系数的取值,当递减系数取值为1.5时,改进算法的求解效果最优。
文摘深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。