-
题名面向威胁情报的多层次知识蒸馏实体识别方法研究
- 1
-
-
作者
文伍扬
李欣
李明锋
唐伟杰
刘士铭
-
机构
中国人民公安大学信息网络安全学院
-
出处
《情报杂志》
2025年第9期96-103,87,共9页
-
基金
国家重点研发计划项目“跨域多源视频监控网络安全体系研究”(编号:2022YFC3301101)研究成果。
-
文摘
[研究目的]随着网络环境日益复杂,构建精准高效的威胁情报抽取模型对于预警、阻断以及追踪攻击至关重要,为此,提出一种基于多层次知识蒸馏的命名实体识别方法。[研究方法]首先,针对威胁情报领域标注数据稀缺、实体分布不均衡等问题,设计了生成-过滤-平衡三阶段数据增强策略,有效扩充训练数据集。其次,以RoBERTa-BiLSTM-IDCNN-CRF为教师模型,选取结构类似的BiLSTM-CRF为学生模型构建异构蒸馏体系,通过多层次知识蒸馏逐层对齐教师隐藏特征,并融合基于硬负样本采样的对比学习机制,以增强学生模型对复杂语境的理解和实体类别的区分能力。[研究结果/结论]实验结果显示,在增强后的CDTier数据集上,学生模型在保持F1值94.08%的同时,其推理效率提升了22.05%,能够更好地满足网络安全领域对实时高效命名实体识别的实际需求。
-
关键词
威胁情报
实体识别
多层次知识蒸馏
对比学习
硬负样本采样
-
Keywords
cyber threat intelligence
named entity recognition
multi-level knowledge distillation
contrastive learning
hard negative sample sampling
-
分类号
G350
[文化科学]
-