- 
                题名基于改进Transformer的三维人体姿态估计
            
- 1
- 
                
            
- 
                
                            作者
                                陈从平
                                郁春明
                                闫焕章
                                江高勇
                                张屹
                                戴国洪
                
            
- 
                    机构
                    
                            常州大学机械与轨道交通学院
                    
                
- 
                出处
                
                
                    《传感器与微系统》
                    
                            CSCD
                            北大核心
                    
                2024年第6期117-121,共5页
            
- 
                        基金
                        
                                    国家自然科学基金资助项目(51875053)
                                    国家重点研发计划资助项目(2018YFC1903101)。
                        
                    
- 
                    文摘
                        本文设计一种用于三维(3D)人体姿态(pose)估计的改进Transformer的多级特征编码网络。采用空间池化(pooling)算子结构来替换注意力(Attention)模块,缩减了模型参数量和运行复杂度,串联该结构得到初始特征表示,然后使用交叉注意力(CA)机制进行特征信息交互学习,并应用跨步卷积降低时间维度并合并相近的Pose到Pose序列的单个表示。在Human3.6M数据集上进行验证实验。结果表明:该方法针对3D人体Pose估计,混合使用Pooling结构和Attention机制能达到有效的估计效果,与原始Transformer的方法进行对比,模型参数量降低了30%,位置精度提升了8.6%。
                        
                    
            
- 
                    关键词
                    
                            姿态估计
                            Transformer模型
                            空间池化算子
                            交叉注意力机制
                            跨步卷积
                    
                
- 
                    Keywords
                    
                            pose estimation
                            Transformer model
                            spatial pooling operator
                            cross-attention mechanism
                            strided convolution
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391.41
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
- 
                
            
            - 
                题名引入特征交互的红外与可见光图像自适应融合
                    被引量:3
            
- 2
- 
                
            
- 
                
                            作者
                                陈从平
                                闫焕章
                                郁春明
                                江高勇
                                凌阳
                                戴国洪
                
            
- 
                    机构
                    
                            常州大学机械与轨道交通学院
                            常州大学材料科学与工程学院
                    
                
- 
                出处
                
                
                    《激光与红外》
                    
                            CAS
                            CSCD
                            北大核心
                    
                2023年第7期1052-1059,共8页
            
- 
                        基金
                        
                                    江苏省产业前瞻与关键核心技术-碳达峰碳中和科技创新专项资金项目(No.BE2022044)资助。
                        
                    
- 
                    文摘
                        在图像融合领域,现有的基于卷积神经网络(CNN)或Transformer架构的方法存在两个局限性:首先,浅层纹理特征与深层语义特征之间无法有效聚合;其次,红外与可见光特征的权重比例无法自适应变化。本文提出一种引入特征交互的红外与可见光图像自适应融合方法。首先,构建一种基于Transformer的特征交互模块,聚合跨尺度特征信息,增强特征表达能力。其次,设计一种融合模块,自适应地调整特征权重比例。所提出的融合方法通过两阶段训练策略完成。第一个阶段,应用创新的特征交互概念训练编码器,增强特征表达,重建特征图像。第二个阶段,基于设计的权重自适应调整模块训练红外与可见光特征融合任务。公开数据集的实验结果表明,与现有方法相比,本方法在主观和客观的评价方面均优于其他典型方法。
                        
                    
            
- 
                    关键词
                    
                            图像融合
                            TRANSFORMER
                            特征交互
                            自适应融合
                            跨尺度
                    
                
- 
                    Keywords
                    
                            image fusion
                            Transformer
                            feature interaction
                            adaptive fusion
                            cross scale
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391.41
[自动化与计算机技术—计算机应用技术]                                
                            
                            
                                
                                    TN219
[电子电信—物理电子学]                                
                            
                    
                
-