期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于URL特征检测的违法网站识别方法 被引量:10
1
作者 凡友荣 杨涛 +1 位作者 王永剑 姜国庆 《计算机工程》 CAS CSCD 北大核心 2018年第3期171-177,共7页
为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽... 为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽取违法网站的URL特征,从中筛选出准确率高、具有特定含义的特征作为有效的违法网站特征,并通过检测未知网站是否具有违法网站的URL特征识别出违法网站。实验结果证明,该方法能有效度量同类网站间的关联程度,结合Fast Unfolding算法能有效区分不同类型的网站。与基于URL词法特征、HTM L、语义特征的违法网站识别方法相比,其F-M easure值最高。 展开更多
关键词 URL特征 违法网站识别 网站相似度 聚类 访问路径
在线阅读 下载PDF
基于知识图谱的电信欺诈通联特征挖掘方法 被引量:19
2
作者 凡友荣 杨涛 +2 位作者 孔华锋 彭如香 姜国庆 《计算机应用与软件》 北大核心 2019年第11期182-187,共6页
提出一种基于知识图谱的通联特征挖掘方法,为电信欺诈案件相关的数据分析及线索挖掘提供技术支持.基于仿真的通话数据和电信欺诈案件数据,在分布式图数据库中构建知识图谱.在此基础上使用图遍历及图算法、混合高斯模型,从联系链路、必... 提出一种基于知识图谱的通联特征挖掘方法,为电信欺诈案件相关的数据分析及线索挖掘提供技术支持.基于仿真的通话数据和电信欺诈案件数据,在分布式图数据库中构建知识图谱.在此基础上使用图遍历及图算法、混合高斯模型,从联系链路、必要人物、核心人物的发现以及社会关系识别这4个维度进行分析挖掘.在混合高斯模型中,提取9个关键通话特征,从通话模式聚类的角度来识别不同的社会关系.通过实验证明,图遍历及图算法能为电信欺诈人员和团伙的发现提供重要线索.混合高斯模型识别出了5类社会关系,并且发现涉案人员之间的通话模式具有一定的特殊性,即通话次数多且多发生在凌晨,通话时间较长且保持联系的时间较长. 展开更多
关键词 知识图谱 通联特征 线索挖掘
在线阅读 下载PDF
基于CPD-SMOTE的类不平衡数据分类算法研究 被引量:7
3
作者 彭如香 杨涛 +2 位作者 孔华锋 姜国庆 凡友荣 《计算机应用与软件》 北大核心 2018年第12期259-262,268,共5页
类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Techn... 类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。 展开更多
关键词 SMOTE 类不平衡 分类算法
在线阅读 下载PDF
基于阶段式SIR-F模型的新冠肺炎疫情评估及预测 被引量:4
4
作者 凡友荣 杨涛 孔华锋 《计算机应用与软件》 北大核心 2020年第11期51-56,62,共7页
针对新冠肺炎疫情的发展呈现阶段性变化的特征,提出一种以阶段划分为基础,各阶段分别进行模型拟合的分析方法。在传统SIR(Susceptible-Infected-Recovered)模型的基础上考虑"未确诊感染者"、"治愈者"和"死亡者... 针对新冠肺炎疫情的发展呈现阶段性变化的特征,提出一种以阶段划分为基础,各阶段分别进行模型拟合的分析方法。在传统SIR(Susceptible-Infected-Recovered)模型的基础上考虑"未确诊感染者"、"治愈者"和"死亡者",构建阶段性SIR-F模型。结合增长态势识别、阶段划分、防控措施影响分析的方法,使用Python实现模拟仿真。实验证明,分阶段的拟合方法能比较准确地刻画疫情数据随时间的变化规律,以及防控措施产生的影响。 展开更多
关键词 新型冠状病毒肺炎 疫情分析 预测 防控措施 SIR模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部