-
题名基于自适应学习的大模型RAG增强方法
- 1
-
-
作者
孙亚茹
林九川
付文豪
宋铮
杨莹
卢涛
-
机构
公安部第三研究所网络侦查技术研发中心
-
出处
《计算机工程与设计》
北大核心
2025年第7期2004-2011,共8页
-
基金
国家重点研发计划基金项目(2021YFB3101404-2)
公安部第三研究所优青基金项目(KZC23261)
公安部第三研究所重点基科费基金项目(KYC24323)。
-
文摘
针对大模型在检索增强生成中存在的无效检索、结果不相关及信息利用率低等问题,提出一种自适应学习驱动的优化策略。该策略包含自适应检索增强和生成增强组件。前者通过建模领域问题特征,提升对检索意图的理解,结合知识图谱提高检索实体的覆盖性和关联性,增强检索精度;后者利用信息压缩与重排序技术,减少冗余信息,增强相关检索数据对生成过程的影响,确保生成内容的质量。实验结果表明,该策略在短文本生成、长文本生成、多选问答和大规模数据检索等任务中取得了较优结果,有效验证了其在高效利用外部数据资源方面的优越性。
-
关键词
大型语言模型
检索增强生成
自适应学习
意图识别
知识图谱
信息压缩
特征建模
-
Keywords
large language models
retrieval augmented generation
adaptive-learning
intent recognition
knowledge graph
information compression
feature modeling
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多层级图表征增强的加密应用流量识别方法
- 2
-
-
作者
王志宏
刘昇然
池泽桂
杨莹
-
机构
公安部第三研究所网络侦查技术研发中心
广东省公安厅网络警察总队
惠州市公安局网络警察支队
-
出处
《计算机科学》
北大核心
2025年第S2期871-877,共7页
-
基金
公安部科技强警基础工作计划项目(2023JC21)
国家重点研发计划项目(2021YFB3101405)。
-
文摘
随着对隐私保护和数据安全需求的提高,流量加密技术被越来越多的应用和服务使用。流量加密技术在保护用户隐私的同时,也为非法目的使用者提供了便利,给网络安全防御和监管带来了严重威胁。针对当前加密应用流量识别中单条和多条会话流表征不足的问题,提出了一种基于多层级图表征增强的加密应用流量识别方法。该方法从单条会话流出发,基于数据包负载长度、方向、包序列、簇信息等交互特征,实现了单条会话流中基于多类型交互信息的数据包图构建和表征。进一步,突破单条会话流限制,研究基于流序列关联关系的多会话流图构建和表征。最后,引入图神经网络技术,实现了基于数据包图表征和会话流图表征的加密应用流量识别。在通用的ISCX VPN-nonVPN 2016数据集上进行实验验证,结果表明所提方法在VPN和non-VPN类别上的整体识别准确率分别达到了98.1%和89.2%,且相比于现有Text-based-CNN和k-GNN等基线算法,其对不同类别流量识别结果的F1值有显著提升。
-
关键词
加密流量
加密应用识别
图神经网络
数据包图
会话流图
-
Keywords
Encrypted traffic
Encrypted application classification
Graph neural network
Package graph
Record graph
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-