面向钓鱼网站敏感特征项选取的IIGAIN算法被引量：5

IIGAIN ALGORITHM ORIENTED TO FISHING WEBSITES SENSITIVE FEATURE ITEMS SELECTION

在线阅读下载PDF

导出

摘要传统的钓鱼网站检测技术主要采用随机或者凭经验选取敏感特征项用于检测的方法,无法保证检测的准确性。为此,提出一种面向钓鱼网站敏感特征选取的改进的信息增益算法IIGAIN(Improved Information Gain Algorithm)。该算法综合考虑了特征项的类内离散度,通过对特征项的类内离散度差值做相应的处理,以处理后的结果作为惩罚项改进信息增益算法。实验结果表明,利用IIGAIN进行特征项选取的钓鱼网站检测方法的检测准确性明显优于随机选取特征项的钓鱼网站检测方法。 Traditional detection technique for fishing websites mainly employs the means of random or empirical sensitive feature items selection in detection,it cannot guarantee the detection accuracy. Therefore,in this paper we propose an improved information gain algorithm（ IIGAIN） which is oriented to fishing website sensitive feature items selection. The algorithm comprehensively considers the within-class dispersion of feature items,by processing correspondingly the difference of within-class dispersion of feature items,it uses the result obtained after processing as the penalty item to improve the information gain algorithm. Experimental result shows that the fishing websites detection method using IIGAIN for feature items selection has conspicuous superiority in accuracy of detection than the fishing websites detection method based on random feature item selection algorithm.

作者王燕王兴芬任俊玲

机构地区北京信息科技大学计算机学院

出处《计算机应用与软件》 CSCD 2016年第4期297-301,共5页 Computer Applications and Software

基金北京市教委科技重点项目(KZ201411232036)

关键词钓鱼网站检测敏感特征项信息增益类内离散度 Fishing websites detection Sensitivity feature item Information gain Within-class dispersion

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

作者简介王燕，硕士生，主研领域：网络安全。王兴芬，教授。任俊玲，副教授。

引文网络
相关文献

参考文献6

1赵跃华,胡向涛.网络钓鱼攻击的防御技术及防御框架设计[J].计算机应用研究,2013,30(6):1863-1866. 被引量：11
2黄华军,钱亮,王耀钧.基于异常特征的钓鱼网站URL检测技术[J].信息网络安全,2012(1):23-25. 被引量：44
3何高辉,邹福泰,谭大礼,王明政.基于SVM主动学习算法的网络钓鱼检测系统[J].计算机工程,2011,37(19):126-128. 被引量：10
4宋秋明,曹晓芸.基于敏感特征的网络钓鱼网站检测方法[D].大连:大连理工大学,2013.
5李学明,李海瑞,薛亮,何光军.基于信息增益与信息熵的TFIDF算法[J].计算机工程,2012,38(8):37-40. 被引量：48
6徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56

二级参考文献53

1龚静,周经野.一种基于多重因子加权的文本特征项权值计算方法[J].计算技术与自动化,2007,26(1):81-83. 被引量：10
2Justin M K. Beyond Blacklists: Learning to Detect Malicious Web Sites from Suspicious URLs[C]//Proc. of ACM SIGKDD’09. Paris, France: ACM Press, 2009: 1245-1253.
3Basnet S M. Detection of Phishing Attacks: A Machine Learning Approach[M]//Prasad B. Soft Computing Applications in Industry. Berlin, Germany: Springer, 2008.
4Pan Ying. Anomaly Based Web Phishing Page Detection[C]//Proc. of Computer Security Applications Conference. Miami Beach, Florida, USA: [s. n.], 2006: 381-392.
5Wilson T M. Improved Heterogeneous Distance Functions[J]. Journal of Artificial Intelligence Research, 1997, 6(1): 1-34.
6Anti-Phishing Working Group [EB/OL]. http://www.antiphishing. org, 2008-01/2011-12-15.
7PhishTank [EB/OL]. http://www.phishtank.com, 2011-04/2011-12-15.
8Engin Kirda, Christopher Kruegel. Protecting Users against Phishing Attacks[J]. The Computer Journal, 2006, 49(05):554-561.
9Ian Fette, Norman Sadeh, Anthony Tomasic. Learning to Detect Phishing Emails[C]. In Proc. of the WWW 2007, Alberta, Canada, May 8-12, 2007: 649-656.
10Chenfeng Vincent Zhou, Christopher Leckie, Shanika Karunasekera. Collaborative Detection of Fast Flux Phishing Domains[J]. Journal of Networks, 2009, 4(01):75-84.

共引文献160

1杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
2葛志,常青,江山,柯文俊,杜泽峰.典型软件的故障仿真和预测方法[J].计算机应用研究,2020,37(S01):230-234.
3黄臻臻,吴扬扬.中文网页体裁分类特征项的权值调整策略[J].广西师范大学学报（自然科学版）,2007,25(2):173-177. 被引量：3
4谭金波.文本层次分类中特征项权重算法的比较研究[J].情报杂志,2007,26(9):87-88. 被引量：5
5刘海峰,王元元,张学仁.文本分类中一种改进的特征选择方法[J].情报科学,2007,25(10):1534-1537. 被引量：9
6熊忠阳,张鹏招,张玉芳.基于χ~2统计的文本分类特征选择方法的研究[J].计算机应用,2008,28(2):513-514. 被引量：44
7熊忠阳,黎刚,陈小莉,陈伟.文本分类中词语权重计算方法的改进与应用[J].计算机工程与应用,2008,44(5):187-189. 被引量：28
8桂海霞,孟祥瑞.基于粗糙集与KNN的Web文本分类的研究[J].安徽理工大学学报（自然科学版）,2008,28(4):89-92.
9谭金波.面向网络教育资源的文本自动分类系统的设计与实现[J].中国远程教育,2009(7):68-70. 被引量：1
10谭金波.基于层次结构的网页自动分类系统的设计与实现[J].情报杂志,2009,28(6):170-172.

同被引文献23

1杨欢,张玉清,胡予濮,刘奇旭.基于权限频繁模式挖掘算法的Android恶意应用检测方法[J].通信学报,2013,34(S1):106-115. 被引量：48
2张卫丰,周毓明,许蕾,徐宝文.基于匈牙利匹配算法的钓鱼网页检测方法[J].计算机学报,2010,33(10):1963-1975. 被引量：15
3宋明秋,曹晓芸.基于敏感特征的网络钓鱼网站检测方法[J].大连理工大学学报,2013,53(6):903-907. 被引量：9
4侯整风,杨波,朱晓玲.一种适合中文的多模式匹配算法[J].计算机科学,2013,40(11):117-121. 被引量：4
5毛毅,陈稳霖,郭宝龙,陈一昕.基于密度估计的逻辑回归模型[J].自动化学报,2014,40(1):62-72. 被引量：33
6杨欢,张玉清,胡予濮,刘奇旭.基于多类特征的Android应用恶意行为检测系统[J].计算机学报,2014,37(1):15-27. 被引量：89
7王伟平,张兵.支持页面特征伪造识别的钓鱼网页检测方法[J].山东大学学报（理学版）,2014,49(9):90-96. 被引量：3
8刘永明,杨婧.基于图像相似性的Android钓鱼恶意应用检测方法[J].计算机系统应用,2014,23(12):170-175. 被引量：5
9吴含前,朱云杰,谢珏.基于逻辑回归的中文在线评论有效性检测模型[J].东南大学学报（自然科学版）,2015,45(3):433-437. 被引量：11
10梁天超,荆晓远,姚永芳,董西伟.基于加权RFE-Bayes方法的软件缺陷预测模型[J].计算机技术与发展,2015,25(10):131-134. 被引量：2

引证文献5

1胡向东,刘可,张峰,林家富,付俊,郭智慧.基于页面敏感特征的金融类钓鱼网页检测方法[J].网络与信息安全学报,2017,3(2):31-38. 被引量：8
2魏琴芳,李林乐,张峰,胡向东.一种安卓系统手机恶意软件链接串行联合检测方法[J].重庆邮电大学学报（自然科学版）,2017,29(2):251-256. 被引量：4
3朱琪,林果园.基于改进随机森林算法的钓鱼网站检测方法研究[J].微电子学与计算机,2019,36(4):43-46. 被引量：5
4陈鹏,李勇志,余肖生.基于特征选择模型的钓鱼网站快速识别方法[J].计算机技术与发展,2021,31(4):40-45. 被引量：5
5Shengli Zhou,Cheng Xu,Rui Xu,Weijie Ding,Chao Chen,Xiaoyang Xu.Image Recognition Model of Fraudulent Websites Based on Image Leader Decision and Inception-V3 Transfer Learning[J].China Communications,2024,21(1):215-227.

二级引证文献22

1张茜,延志伟,李洪涛,耿光刚.网络钓鱼欺诈检测技术研究[J].网络与信息安全学报,2017,3(7):7-24. 被引量：13
2魏三强.AR开发中的Unity 3D与原生代码交互技术[J].重庆理工大学学报（自然科学）,2017,31(11):166-171. 被引量：5
3张峰,胡向东,林家富,郭智慧,付俊,刘可.基于SVM的金融类钓鱼网页检测方法[J].重庆邮电大学学报（自然科学版）,2017,29(6):806-813. 被引量：2
4杨鹏,曾朋,赵广振,吕培培.基于Logistic回归和XGBoost的钓鱼网站检测方法[J].东南大学学报（自然科学版）,2019,49(2):207-212. 被引量：4
5张涛,王俊峰.基于文本嵌入特征表示的恶意软件家族分类[J].四川大学学报（自然科学版）,2019,56(3):441-449. 被引量：5
6陈哲,尹亚光,何晶.互联网电视应用溯源技术研究[J].有线电视技术,2019,26(10):86-88. 被引量：1
7王雨琪,刘博文,林果园.基于URL语言特征的钓鱼网站检测算法[J].计算机工程与应用,2019,55(24):84-90. 被引量：8
8文星.基于移动终端适配技术的网站页面信息显示方法[J].自动化与仪器仪表,2019,0(12):126-129. 被引量：2
9张二鹏,彭华熹.基于微流量的Android恶意应用下载链接检测技术研究[J].信息通信技术与政策,2020(2):35-40.
10付溪,李晖,赵兴文.网络钓鱼识别研究综述[J].网络与信息安全学报,2020,6(5):1-10. 被引量：4

1黄旭,朱艳琴,罗喜召.实时文本分类系统的研究与实现[J].计算机工程,2008,34(18):87-88. 被引量：5
2卢康,周安民.基于图像相似性的钓鱼网站检测[J].信息安全与通信保密,2016,14(3):115-117. 被引量：5
3黄旭,朱艳琴,罗喜召.面向不良文本信息的中文网页分类方法[J].微电子学与计算机,2008,25(6):215-217. 被引量：1
4田双柱,陈勇,延志伟,李晓东.基于多维度特征的不良网站检测[J].计算机系统应用,2017,26(2):207-211. 被引量：2
5张国战.网络钓鱼的攻击方式与识别技术[J].价值工程,2013,32(34):164-165. 被引量：1
6梁雪松.基于浏览器的钓鱼网站检测技术研究[J].信息安全与通信保密,2007,29(11):53-55. 被引量：7
7飘零雪.网站检测更智能、更全面、更快速[J].网友世界,2010(3):109-109.
8许朝阳.文本分类中特征选择方法的分析和改进[J].计算机与现代化,2010(4):37-39. 被引量：2
9开芳.利用测试网站检测出你的浏览器安全级别[J].计算机与网络,2004,30(20):42-42.
10苑春燕,李爱华.基于信息增益和相关性的贝叶斯分类算法研究[J].网络与信息,2010,24(2):30-31.

计算机应用与软件

2016年第4期

浏览历史

内容加载中请稍等...

面向钓鱼网站敏感特征项选取的IIGAIN算法被引量：5

参考文献6

二级参考文献53

共引文献160

同被引文献23

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

面向钓鱼网站敏感特征项选取的IIGAIN算法 被引量：5

参考文献6

二级参考文献53

共引文献160

同被引文献23

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

面向钓鱼网站敏感特征项选取的IIGAIN算法被引量：5