人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先...人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。展开更多
针对现有信道估计方案导致正交时频空间(Orthogonal Time Frequency Space,OTFS)调制系统峰均功率比(Peak-to-Average Power Ratio,PAPR)高或频谱效率(Spectral Efficiency,SE)低的问题,提出一种多叠加导频的低PAPR、高SE信道估计方法...针对现有信道估计方案导致正交时频空间(Orthogonal Time Frequency Space,OTFS)调制系统峰均功率比(Peak-to-Average Power Ratio,PAPR)高或频谱效率(Spectral Efficiency,SE)低的问题,提出一种多叠加导频的低PAPR、高SE信道估计方法。发送端利用时域正交性和离散傅里叶域相位的随机性,在时延多普勒域中嵌入与数据相叠加的5导频符号的导频图案实现低PAPR,提高SE。接收端以数据符号与噪声之和的能量均值为基准,实现导频信号检测,同时根据每个导频的不同位置信息恢复出存在相位旋转的数据信号。基于能量准则,利用多个独立的接收信号进行联合信道估计,以降低数据符号的干扰,并采用消息传递算法进行数据恢复。仿真结果表明,该方法比单叠加导频信道估计的PAPR低,同时较嵌入式导频信道估计的SE提高约14.4%。展开更多
在基于增强现实装配引导的复杂零/部件装配场景中,由于手部对零/部件的遮挡,导致零件位姿解算时产生较大的误差,甚至造成求解失败。目前针对手工装配零件的位姿估计算法在解决零件遮挡问题时没有考虑手部信息,使得位姿估计精度难以满足...在基于增强现实装配引导的复杂零/部件装配场景中,由于手部对零/部件的遮挡,导致零件位姿解算时产生较大的误差,甚至造成求解失败。目前针对手工装配零件的位姿估计算法在解决零件遮挡问题时没有考虑手部信息,使得位姿估计精度难以满足增强装配实际应用的要求。针对上述问题,提出了融合手部姿态的零件6D位姿估计算法,即HandICG算法。该算法将手部的姿态信息与迭代对应几何(Iterative Corresponding Geometry,ICG)算法进行融合,当发生手部遮挡时,将手部的姿态信息应用到零件姿态的求解中,从而显著提高手部遮挡情况下零件位姿估计的精度,实验表明,平均模型点距离(Average Distance of Model points,ADD)相关评价指标达到74.73%,是ICG算法的2.61倍。该算法显著提升了增强装配场景中零件位姿解算的准确性和鲁棒性。展开更多
针对现有时间维度波达方向(direction of arrival,DOA)估计方案中,时间调控速率受限导致目标信号频谱混叠的问题,提出了一种基于异步调控的DOA估计方法,该方法能够有效提升调控速率,进而提升信号处理的信号带宽。在不改变时间调控超表面...针对现有时间维度波达方向(direction of arrival,DOA)估计方案中,时间调控速率受限导致目标信号频谱混叠的问题,提出了一种基于异步调控的DOA估计方法,该方法能够有效提升调控速率,进而提升信号处理的信号带宽。在不改变时间调控超表面(time-varying metasurface,TVM)硬件约束的情况下,该方法利用单元状态会持续一段时间的性质,交错不同列单元的变化起始时间,在一个状态持续时间内获得了多个不同的响应。异步调控方法能够使TVM在受材料限制的情况下,等效增加虚拟多通道个数,提高DOA估计的精度。仿真结果验证了方法的有效性,相较于现有的同步调控方法,新方法在DOA估计性能上有了较大提升,能够逼近理论上的最优DOA估计结果。展开更多
文摘人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。
文摘针对现有信道估计方案导致正交时频空间(Orthogonal Time Frequency Space,OTFS)调制系统峰均功率比(Peak-to-Average Power Ratio,PAPR)高或频谱效率(Spectral Efficiency,SE)低的问题,提出一种多叠加导频的低PAPR、高SE信道估计方法。发送端利用时域正交性和离散傅里叶域相位的随机性,在时延多普勒域中嵌入与数据相叠加的5导频符号的导频图案实现低PAPR,提高SE。接收端以数据符号与噪声之和的能量均值为基准,实现导频信号检测,同时根据每个导频的不同位置信息恢复出存在相位旋转的数据信号。基于能量准则,利用多个独立的接收信号进行联合信道估计,以降低数据符号的干扰,并采用消息传递算法进行数据恢复。仿真结果表明,该方法比单叠加导频信道估计的PAPR低,同时较嵌入式导频信道估计的SE提高约14.4%。
文摘在基于增强现实装配引导的复杂零/部件装配场景中,由于手部对零/部件的遮挡,导致零件位姿解算时产生较大的误差,甚至造成求解失败。目前针对手工装配零件的位姿估计算法在解决零件遮挡问题时没有考虑手部信息,使得位姿估计精度难以满足增强装配实际应用的要求。针对上述问题,提出了融合手部姿态的零件6D位姿估计算法,即HandICG算法。该算法将手部的姿态信息与迭代对应几何(Iterative Corresponding Geometry,ICG)算法进行融合,当发生手部遮挡时,将手部的姿态信息应用到零件姿态的求解中,从而显著提高手部遮挡情况下零件位姿估计的精度,实验表明,平均模型点距离(Average Distance of Model points,ADD)相关评价指标达到74.73%,是ICG算法的2.61倍。该算法显著提升了增强装配场景中零件位姿解算的准确性和鲁棒性。
文摘针对现有时间维度波达方向(direction of arrival,DOA)估计方案中,时间调控速率受限导致目标信号频谱混叠的问题,提出了一种基于异步调控的DOA估计方法,该方法能够有效提升调控速率,进而提升信号处理的信号带宽。在不改变时间调控超表面(time-varying metasurface,TVM)硬件约束的情况下,该方法利用单元状态会持续一段时间的性质,交错不同列单元的变化起始时间,在一个状态持续时间内获得了多个不同的响应。异步调控方法能够使TVM在受材料限制的情况下,等效增加虚拟多通道个数,提高DOA估计的精度。仿真结果验证了方法的有效性,相较于现有的同步调控方法,新方法在DOA估计性能上有了较大提升,能够逼近理论上的最优DOA估计结果。