-
题名网页内容链接层次语义树的恶意网页检测方法
被引量:2
- 1
-
-
作者
陈本刚
宋礼鹏
-
机构
中北大学大数据学院大数据与网络安全研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第11期90-97,共8页
-
基金
国家自然科学基金(No.61772478)
中北大学第十四届研究生科技立项(No.20181542)。
-
文摘
针对攻击者利用URL缩短服务导致仅依赖于URL特征的恶意网页检测失效的问题,及恶意网页检测中恶意与良性网页高度不均衡的问题,提出一种融合网页内容层次语义树特征的成本敏感学习的恶意网页检测方法。该方法通过构建网页内容链接层次语义树,提取基于语义树的特征,解决了URL缩短服务导致特征失效的问题;并通过构建成本敏感学习的检测模型,解决了数据类别不均衡的问题。实验结果表明,与现有的方法相比,提出的方法不仅能应对缩短服务的问题,还能在类别不均衡的恶意网页检测任务中表现出较低的漏报率2.1%和误报率3.3%。此外,在25万条无标签数据集上,该方法比反病毒工具VirusTotal的查全率提升了38.2%。
-
关键词
恶意网页检测
缩短服务
链接层次语义树
成本敏感
-
Keywords
malicious webpage detection
URL shortening service
link level semantic tree
cost sensitive
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名话题案例知识库动态模型及优化策略
- 2
-
-
作者
赵立永
李爱民
-
机构
北京科技大学计算机与通信工程学院
山东轻工业学院信息学院
-
出处
《计算机工程》
CAS
CSCD
2012年第10期263-265,268,共4页
-
基金
国家科技支撑计划基金资助项目(2011BAK08B04)
-
文摘
传统的话题检测方法仅通过最初几篇话题相关报道的特征来表示话题,不能适应话题动态变化的特点。为此,提出一种话题案例知识库的动态模型。采用资源描述框架,实现话题案例知识表示,并在层次语义树基础上,利用案例融合策略实现话题案例知识库的动态更新,使用最大容忍优化策略解决话题质心漂移问题。实验结果表明,通过提高话题案例知识的全面性和内聚性,该模型能够改进话题检测和追踪的效果。
-
关键词
话题检测
案例知识库
动态模型
优化策略
层次语义树
话题质心
-
Keywords
topic detection
case knowledge base
dynamic model
optimization strategy
Hierarchical Semantic Tree(HST)
topic centroid
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-