- 
                题名基于CenterNet的实时行人检测模型
                    被引量:6
            
- 1
- 
                
            
- 
                
                            作者
                                姜建勇
                                吴云
                                龙慧云
                                黄自萌
                                蓝林
                
            
- 
                    机构
                    
                            贵州大学计算机科学与技术学院
                    
                
- 
                出处
                
                
                    《计算机工程》
                    
                            CAS
                            CSCD
                            北大核心
                    
                2021年第10期276-282,共7页
            
- 
                        基金
                        
                                    国家自然科学基金(61741124)
                                    贵州省科技计划项目(5781)。
                        
                    
- 
                    文摘
                        针对传统目标检测模型不能同时兼顾检测速度和准确度的问题,提出一种新的PD-CenterNet模型。在CenterNet的基础上对网络结构和损失函数进行改进,在网络结构的上采路径中,设计基于注意力机制的特征融合模块,对低级特征和高级特性进行融合,在损失函数中通过设计α、γ、δ3个影响因子来提高正样本与降低负样本的损失,以平衡正负样本的损失。实验结果表明,相比CenterNet模型,该模型在网络结构和损失函数上的准确度分别提高5.1%、9.81%。
                        
                    
            
- 
                    关键词
                    
                            PD-CenterNet网络
                            实时检测
                            行人检测
                            样本不平衡
                            损失函数
                            特征融合
                    
                
- 
                    Keywords
                    
                            PD-CenterNet
                            real-time detection
                            pedestrian detection
                            sample imbalance
                            loss function
                            feature fusion
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
- 
                
            
            - 
                题名融合注意力机制与多任务学习的DR分级模型
                    被引量:4
            
- 2
- 
                
            
- 
                
                            作者
                                徐常转
                                吴云
                                蓝林
                                黄自萌
                
            
- 
                    机构
                    
                            贵州大学计算机科学与技术学院
                    
                
- 
                出处
                
                
                    《计算机工程与应用》
                    
                            CSCD
                            北大核心
                    
                2021年第24期212-218,共7页
            
- 
                        基金
                        
                                    国家自然科学基金([2018]61741124)
                                    贵州省科技计划项目([2018]5781)。
                        
                    
- 
                    文摘
                        在糖尿病患者中,糖尿病视网膜病变(Diabetic Retinopathy,DR)是导致失明的主要原因。针对眼底图像中存在极难发现的微动脉瘤等微小病理特征的问题,提出了一种注意力机制模块。该模块通过融合特征图原本的特征信息与注意力单元得到的通道信息,为微小特征增加了网络的权重,再使用除操作去除特征图中的冗余信息,得到注意力机制特征作为双任务的输入;针对均方误差(Mean Square Error,MSE)损失难优化和交叉熵(Cross Entropy,CE)损失未考虑错分DR等级的代价,设计了多任务学习模块,加权融合了回归任务的MSE损失和分类任务的CE损失。基于这两个模块的设计,提出了融合注意力机制的多任务学习网络(Fusion of Attention mechanism and MultiTasking learning network,FAMT)。在kaggle数据集上的实验表明,FAMT网络在验证集上的Kappa比仅使用回归任务的网络高出了2%,比仅使用分类任务的网络提高了4%;FAMT网络在测试集上的Kappa比EfficientNet网络高出1%,比M2CNN网络高出了5%。
                        
                    
            
- 
                    关键词
                    
                            糖尿病视网膜分级
                            深度学习
                            注意力机制
                            多任务学习
                            卷积神经网络
                    
                
- 
                    Keywords
                    
                            diabetic retina grading
                            deep learning
                            attention mechanism
                            multi-task learning
                            convolutional neural network
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
-