-
题名基于参数语义的日志解析方法
- 1
-
-
作者
邢瀚韬
阮树骅
陈良国
曾雪梅
-
机构
四川大学网络空间安全学院
数据安全防护与智能治理教育部重点实验室
四川大学网络空间安全研究院
-
出处
《信息网络安全》
北大核心
2025年第4期610-618,共9页
-
基金
中央高校基本科研业务费专项资金[SCU2024D012]
四川大学理工学科内涵发展项目[2020SCUNG129]。
-
文摘
现代信息系统规模日益扩大,通过分析结构各异的多源日志可以快速了解系统行为。日志参数的语义表征了系统中的实体信息,对实现多源日志的联合分析至关重要。但现有解析方法对日志参数的语义特征捕捉不足,存在语义缺失、语义覆盖范围不广、语义识别准确率不足等问题。因此,文章提出一种基于参数语义的日志解析方法(PS-Parser),该方法通过构建BERT模型捕捉日志上下文语义特征,提取日志参数的语义,并通过常规参数语义特征库,补全日志参数不同层次的语义,最终根据参数语义表征系统实体,实现多源日志联合分析。文章在6个多源真实数据集上进行实验,日志参数解析的平均准确率为94.7%,平均语义覆盖率为81.7%,语义解析的平均F1分数为0.991,相较于现有方法有显著提升,验证了所提方法的有效性。最后,针对大数据系统下的日志分析场景,验证了基于参数语义的日志解析方法对多源日志联合分析工作的支持作用。
-
关键词
日志解析
参数语义提取
多源日志分析
-
Keywords
log parsing
semantic of parameters extraction
multi-source log analysis
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-