- 
                题名基于URL特征检测的违法网站识别方法
                    被引量:10
            
- 1
- 
                
            
- 
                
                            作者
                                凡友荣
                                杨涛
                                王永剑
                                姜国庆
                
            
- 
                    机构
                    
                            公安部第三研究所
                            信息网络安全公安部重点实验室
                    
                
- 
                出处
                
                
                    《计算机工程》
                    
                            CAS
                            CSCD
                            北大核心
                    
                2018年第3期171-177,共7页
            
- 
                        基金
                        
                                    国家重点研发计划项目(2016YFC0800909)
                                    中央高校基本科研业务费专项资金(C16356)
                        
                    
- 
                    文摘
                        为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽取违法网站的URL特征,从中筛选出准确率高、具有特定含义的特征作为有效的违法网站特征,并通过检测未知网站是否具有违法网站的URL特征识别出违法网站。实验结果证明,该方法能有效度量同类网站间的关联程度,结合Fast Unfolding算法能有效区分不同类型的网站。与基于URL词法特征、HTM L、语义特征的违法网站识别方法相比,其F-M easure值最高。
                        
                    
            
- 
                    关键词
                    
                            URL特征
                            违法网站识别
                            网站相似度
                            聚类
                            访问路径
                    
                
- 
                    Keywords
                    
                            URL feature 
                             illegal website identification 
                             website similarity 
                             clustering 
                             access path
                    
                
- 
                    分类号
                    
                            
                                
                                    TP311
[自动化与计算机技术—计算机软件与理论]                                
                            
                    
                
- 
                
            
            - 
                题名基于知识图谱的电信欺诈通联特征挖掘方法
                    被引量:19
            
- 2
- 
                
            
- 
                
                            作者
                                凡友荣
                                杨涛
                                孔华锋
                                彭如香
                                姜国庆
                
            
- 
                    机构
                    
                            公安部第三研究所
                            武汉商学院
                    
                
- 
                出处
                
                
                    《计算机应用与软件》
                    
                            北大核心
                    
                2019年第11期182-187,共6页
            
- 
                        基金
                        
                                    国家重点研发计划项目(2018YFC0830401,2018YFC0806903)
                                    公安部第三研究所2019年基本科研业务费专项资金项目(C19354)
                        
                    
- 
                    文摘
                        提出一种基于知识图谱的通联特征挖掘方法,为电信欺诈案件相关的数据分析及线索挖掘提供技术支持.基于仿真的通话数据和电信欺诈案件数据,在分布式图数据库中构建知识图谱.在此基础上使用图遍历及图算法、混合高斯模型,从联系链路、必要人物、核心人物的发现以及社会关系识别这4个维度进行分析挖掘.在混合高斯模型中,提取9个关键通话特征,从通话模式聚类的角度来识别不同的社会关系.通过实验证明,图遍历及图算法能为电信欺诈人员和团伙的发现提供重要线索.混合高斯模型识别出了5类社会关系,并且发现涉案人员之间的通话模式具有一定的特殊性,即通话次数多且多发生在凌晨,通话时间较长且保持联系的时间较长.
                        
                    
            
- 
                    关键词
                    
                            知识图谱
                            通联特征
                            线索挖掘
                    
                
- 
                    Keywords
                    
                            Knowledge graph
                            Call features
                            Clue mining
                    
                
- 
                    分类号
                    
                            
                                
                                    TP301.6
[自动化与计算机技术—计算机系统结构]                                
                            
                    
                
- 
                
            
            - 
                题名基于CPD-SMOTE的类不平衡数据分类算法研究
                    被引量:7
            
- 3
- 
                
            
- 
                
                            作者
                                彭如香
                                杨涛
                                孔华锋
                                姜国庆
                                凡友荣
                
            
- 
                    机构
                    
                            公安部第三研究所
                            信息网络安全公安部重点实验室
                    
                
- 
                出处
                
                
                    《计算机应用与软件》
                    
                            北大核心
                    
                2018年第12期259-262,268,共5页
            
- 
                        基金
                        
                                    国家重点研发计划课题(2016YFC0800909)
                                    公安部科技强警基础工作专项项目(2018GBJC19)
                                    上海市科委科研项目(17DZ1101004)
                        
                    
- 
                    文摘
                        类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。
                        
                    
            
- 
                    关键词
                    
                            SMOTE
                            类不平衡
                            分类算法
                    
                
- 
                    Keywords
                    
                            SMOTE
                            Class imbalance
                            Classification algorithm
                    
                
- 
                    分类号
                    
                            
                                
                                    TP301.6
[自动化与计算机技术—计算机系统结构]                                
                            
                    
                
- 
                
            
            - 
                题名基于阶段式SIR-F模型的新冠肺炎疫情评估及预测
                    被引量:4
            
- 4
- 
                
            
- 
                
                            作者
                                凡友荣
                                杨涛
                                孔华锋
                
            
- 
                    机构
                    
                            公安部第三研究所
                            武汉商学院
                    
                
- 
                出处
                
                
                    《计算机应用与软件》
                    
                            北大核心
                    
                2020年第11期51-56,62,共7页
            
- 
                        基金
                        
                                    国家重点研发计划项目(2018YFC0806903)
                                    公安部科技强警基础工作专项项目(2019GABJC20)。
                        
                    
- 
                    文摘
                        针对新冠肺炎疫情的发展呈现阶段性变化的特征,提出一种以阶段划分为基础,各阶段分别进行模型拟合的分析方法。在传统SIR(Susceptible-Infected-Recovered)模型的基础上考虑"未确诊感染者"、"治愈者"和"死亡者",构建阶段性SIR-F模型。结合增长态势识别、阶段划分、防控措施影响分析的方法,使用Python实现模拟仿真。实验证明,分阶段的拟合方法能比较准确地刻画疫情数据随时间的变化规律,以及防控措施产生的影响。
                        
                    
            
- 
                    关键词
                    
                            新型冠状病毒肺炎
                            疫情分析
                            预测
                            防控措施
                            SIR模型
                    
                
- 
                    Keywords
                    
                            COVID-19
                            Epidemic assessment
                            Prediction
                            Prevention and control measures
                            SIR mode
                    
                
- 
                    分类号
                    
                            
                                
                                    TP391.9
[自动化与计算机技术—计算机应用技术]                                
                            
                    
                
-