-
题名基于预训练模型的漏洞信息检索系统研究
被引量:2
- 1
-
-
作者
刘烨
杨良斌
-
机构
国际关系学院网络空间安全学院
-
出处
《情报杂志》
CSSCI
北大核心
2024年第8期84-91,共8页
-
基金
中央高校基本科研业务经费“人工智能与大数据创新团队建设-数智技术在网络安全中的应用研究”(编号:3262024T01)
中国科学院文献情报中心委托项目“科研诚信数据的采集与清洗标引”(编号:H20230021)研究成果。
-
文摘
[研究目的]威胁情报中漏洞信息是指有关网络、系统、应用程序或供应链中存在的漏洞的信息。目前搜索引擎在漏洞信息检索上存在短板,利用预训练模型来构建漏洞检索系统可以提高检索效率。[研究方法]以公开的漏洞信息作为数据来源,构建了一个问答数据集,对Tiny Bert进行增量预训练。使用模型对于每个查询向量化,并把漏洞信息构建成faiss向量数据库,利用HNSW索引进行多通道和单通道召回检索。然后对模型进行对比学习微调生成双塔和单塔模型,利用双塔召回和单塔精排构建了一个简易的知识检索系统。[研究结论]实验结果表明,预训练模型可以显著地提升检索性能,对比学习微调的双塔模型在构建的漏洞信息测试集中TOP1召回率为92.17%。通过漏洞信息领域的检索实践,对构建威胁情报的检索系统提供了参考。
-
关键词
威胁情报
预训练模型
漏洞信息
多通道搜索技术
信息检索系统
-
Keywords
threat intelligence
pre-training model
vulnerability information
multi-channel search technique
information retrieval system
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-