期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
机械加工车间作业人员不安全行为识别模型
1
作者 胡啸峰 滕腾 +1 位作者 胡今鸣 温家骏 《中国安全科学学报》 北大核心 2025年第8期40-47,共8页
为提高机械加工车间作业人员的安全管理水平,构建基于YOLOv11的识别模型,融合元架构视觉模块(MetaFormer)、混合聚合网络(MANet)以及自适应特征网格卷积注意力机制(AFGC Attention),改进YOLOv11模型,并建立真实车间环境下的视频数据集,... 为提高机械加工车间作业人员的安全管理水平,构建基于YOLOv11的识别模型,融合元架构视觉模块(MetaFormer)、混合聚合网络(MANet)以及自适应特征网格卷积注意力机制(AFGC Attention),改进YOLOv11模型,并建立真实车间环境下的视频数据集,验证上述模型。结果表明:改进YOLOv11模型能够识别无人值守、未佩戴面罩作业、未穿着防护服作业3种行为,F1指数均达到0.93以上;改进的模型在小尺寸目标识别方面的性能具有显著提升,识别戴手套作业行为的F1指数从0.684提升至0.708,平均精度均值(m AP)@0.5值从0.604提升到0.651。 展开更多
关键词 机械加工车间 作业人员 不安全行为 YOLOv11 注意力机制
在线阅读 下载PDF
基于多主体仿真的重点城区脏弹袭击风险分析
2
作者 辛悦 曾昭龙 +2 位作者 沈兵 吴建松 胡啸峰 《中国安全生产科学技术》 CAS CSCD 北大核心 2021年第3期33-39,共7页
为研究“脏弹”恐怖袭击风险演化过程中的影响因素,针对重点城区“脏弹”恐怖袭击的预防需求,建立包含恐怖组织、防御力量及承灾载体的多主体仿真模型,通过实例分析恐怖组织在不同情景下的袭击成功概率,研究巡逻盘查、便衣侦查、安检等... 为研究“脏弹”恐怖袭击风险演化过程中的影响因素,针对重点城区“脏弹”恐怖袭击的预防需求,建立包含恐怖组织、防御力量及承灾载体的多主体仿真模型,通过实例分析恐怖组织在不同情景下的袭击成功概率,研究巡逻盘查、便衣侦查、安检等预防手段的风险补偿能力。结果表明:以室外人群为袭击目标时,袭击成功概率与袭击者对人员伤亡的预期值高度相关;以建筑物内部人员为袭击目标时,袭击者与建筑物之间的空间距离是影响袭击成功概率的重要因素,通过合理的城市空间规划可以在一定程度上实现对该类型恐怖袭击的风险补偿。研究结果可为公安及城市应急管理部门的相关工作提供决策支持。 展开更多
关键词 恐怖袭击 多主体仿真 “脏弹” 风险补偿 风险分析
在线阅读 下载PDF
演化视角下的网络暴力治理研究——基于SEIQR模型 被引量:1
3
作者 胡凯茜 李欣 刘明帅 《情报杂志》 北大核心 2025年第1期146-154,共9页
[研究目的]采用传染病模型模拟网络暴力舆情演化过程,有助于监管部门预测舆情趋势、评估治理策略和制定应急预案。[研究方法]首先,融入生命周期理论改进标准传染病模型,研究网络暴力舆情的扩散机制和影响模式;其次,基于中央网信办加强... [研究目的]采用传染病模型模拟网络暴力舆情演化过程,有助于监管部门预测舆情趋势、评估治理策略和制定应急预案。[研究方法]首先,融入生命周期理论改进标准传染病模型,研究网络暴力舆情的扩散机制和影响模式;其次,基于中央网信办加强网络暴力治理的通知内容深入分析模型基本再生数的参数含义;最后,通过六组对照仿真实验研究网络暴力舆情在不同阶段的治理侧重点。[研究结果/结论]实验结果表明,在网络暴力舆情的成长期加强内容识别预警有助于降低暴露人群比例;在爆发期通过及时发布权威信息能避免活跃人群放大负面舆论;在衰退期开展宣传教育能够增大传播链中隔离人群比例;在平缓期持续完善防控机制可以监督恢复人群的情绪变化。 展开更多
关键词 网络暴力 传染病模型 舆情演化 舆情治理 SEIQR模型
在线阅读 下载PDF
基于SDNE嵌入表达的深度学习跨网络身份关联方法 被引量:1
4
作者 程佳琳 袁得嵛 +1 位作者 孙泽宇 陈梓彦 《计算机科学与探索》 北大核心 2025年第2期417-428,共12页
挖掘海量虚拟身份之间的关联关系,确定不同虚拟身份的同一性对于用户精准推荐、异常用户检测、舆情管控等具有重要意义。为了判别多个不同虚拟网络身份是否为同一个人所拥有,提出了一种基于SDNE嵌入表达的深度学习算法(eSUIL)来解决跨... 挖掘海量虚拟身份之间的关联关系,确定不同虚拟身份的同一性对于用户精准推荐、异常用户检测、舆情管控等具有重要意义。为了判别多个不同虚拟网络身份是否为同一个人所拥有,提出了一种基于SDNE嵌入表达的深度学习算法(eSUIL)来解决跨网络用户身份关联的问题,并构建了一个跨网络用户身份关联统一框架。对社交网络中的用户关系进行扩展,借鉴SDNE模型的思想对不同网络中的用户节点进行嵌入学习,将用户节点映射到低维向量空间中。使用深度神经网络构造映射函数得到用户节点的准确表达。计算用户节点间的相似度以进行用户对齐,从而实现跨社交网络的用户身份关联。为了提高身份关联的准确性,还引入用户名信息作为辅助判断。在真实社交网络数据集和人工合成网络数据集上分别进行实验验证,实验结果表明,对比基线算法PALE、CLF以及Deep-link,在准确率和F1值上均提高了8个百分点以上,表明提出的eSUIL算法在身份关联方面具有优异的性能,能够准确关联不同网络中的同一用户身份。 展开更多
关键词 网络嵌入 社交网络 深度学习 身份关联
在线阅读 下载PDF
基于强化学习的超高层建筑非法入侵情景推演方法
5
作者 胡今鸣 胡啸峰 +2 位作者 石磊 石拓 滕腾 《智能系统学报》 北大核心 2025年第4期958-968,共11页
为计算超高层建筑潜在非法入侵者的“最优”入侵路径,本文提出了一种基于强化学习的情景推演方法。该方法将建筑公共走廊抽象为拓扑结构,利用贝叶斯网络计算入侵者通过每个拓扑节点的概率,结合强化学习算法获得外部人员的最优入侵路径,... 为计算超高层建筑潜在非法入侵者的“最优”入侵路径,本文提出了一种基于强化学习的情景推演方法。该方法将建筑公共走廊抽象为拓扑结构,利用贝叶斯网络计算入侵者通过每个拓扑节点的概率,结合强化学习算法获得外部人员的最优入侵路径,为超高层建筑非法入侵的高效防范提供精准依据。为验证方法的有效性,以北京市CBD地区某超高层建筑为例,将入侵终点设置为顶层,设计了3种不同的入侵情景。情景推演结果表明:在初始状态下(未进行任何优化措施),SARSA模型的训练性能最佳。优化安防系统后发现,在建筑内的层间节点增加安防系统投入最有效。该优化情景下,安防系统投入与风险值的非线性拟合结果显示,随着安防系统投入的增加,入侵风险显著降低。 展开更多
关键词 非法入侵 情景推演 超高层建筑 强化学习 贝叶斯网络 安防系统 SARSA模型 非线性回归
在线阅读 下载PDF
基于大语言模型的CIL-LLM类别增量学习框架
6
作者 王晓宇 李欣 +1 位作者 胡勉宁 薛迪 《计算机科学与探索》 北大核心 2025年第2期374-384,共11页
在文本分类领域,为了提升类别增量学习模型的分类准确率并避免灾难性遗忘问题,提出了一种基于大语言模型(LLM)的类别增量学习框架(CIL-LLM)。CIL-LLM框架通过抽样和压缩环节选取具有代表性的样本,利用较强语言理解能力的LLM基于上下文... 在文本分类领域,为了提升类别增量学习模型的分类准确率并避免灾难性遗忘问题,提出了一种基于大语言模型(LLM)的类别增量学习框架(CIL-LLM)。CIL-LLM框架通过抽样和压缩环节选取具有代表性的样本,利用较强语言理解能力的LLM基于上下文学习提炼关键技能,以这些技能作为分类的依据,从而降低了存储成本;采用关键词匹配环节选取最优技能,以此构建提示词,引导下游弱LLM进行分类,提高了分类的准确性;根据基于知识蒸馏的技能融合环节,不仅实现了技能库的有效拓展和更新,还兼顾了新旧类别特性的学习。对比实验结果表明,在THUCNews数据集上的测试中,与现有的L-SCL方法相比,CIL-LLM框架在所有任务上的平均准确率提升了6.3个百分点,性能下降率降低了3.1个百分点。此外,在消融实验中,经由CIL-LLM框架增强的SLEICL模型相比于原有模型,所有任务的平均准确率提高了10.4个百分点,性能下降率降低了3.3个百分点。消融实验进一步验证了提出的样本压缩、关键词匹配和技能融合环节均对模型的准确率和性能下降率产生了优化效果。 展开更多
关键词 类别增量学习 大语言模型(LLM) 主题分类 知识蒸馏
在线阅读 下载PDF
基于对比学习的多层图注意力网络身份关联模型
7
作者 程佳琳 袁得嵛 +1 位作者 陈梓彦 孙泽宇 《科学技术与工程》 北大核心 2025年第24期10334-10343,共10页
随着社交网络和在线平台的快速发展,身份关联问题成为安全审计和推荐系统中的重要研究课题。为有效解决身份关联问题,提出一种基于多层图注意力网络和对比学习相结合的方法。通过引入图注意力机制,模型能够更精确地捕捉用户之间的复杂关... 随着社交网络和在线平台的快速发展,身份关联问题成为安全审计和推荐系统中的重要研究课题。为有效解决身份关联问题,提出一种基于多层图注意力网络和对比学习相结合的方法。通过引入图注意力机制,模型能够更精确地捕捉用户之间的复杂关系,同时,对比学习的应用进一步提升了节点嵌入的判别能力和鲁棒性,模型中还融合一种联合优化策略,使得图注意力机制和对比学习能够协同工作,从而增强了模型的整体性能。实验结果表明:所提出的eCGAT-UIL模型在3个不同数据集上均可以表现出优异的性能,显著优于其他现有基线模型。 展开更多
关键词 网络嵌入 社交网络 图注意力网络 身份关联
在线阅读 下载PDF
面向威胁情报的多层次知识蒸馏实体识别方法研究
8
作者 文伍扬 李欣 +2 位作者 李明锋 唐伟杰 刘士铭 《情报杂志》 北大核心 2025年第9期96-103,87,共9页
[研究目的]随着网络环境日益复杂,构建精准高效的威胁情报抽取模型对于预警、阻断以及追踪攻击至关重要,为此,提出一种基于多层次知识蒸馏的命名实体识别方法。[研究方法]首先,针对威胁情报领域标注数据稀缺、实体分布不均衡等问题,设... [研究目的]随着网络环境日益复杂,构建精准高效的威胁情报抽取模型对于预警、阻断以及追踪攻击至关重要,为此,提出一种基于多层次知识蒸馏的命名实体识别方法。[研究方法]首先,针对威胁情报领域标注数据稀缺、实体分布不均衡等问题,设计了生成-过滤-平衡三阶段数据增强策略,有效扩充训练数据集。其次,以RoBERTa-BiLSTM-IDCNN-CRF为教师模型,选取结构类似的BiLSTM-CRF为学生模型构建异构蒸馏体系,通过多层次知识蒸馏逐层对齐教师隐藏特征,并融合基于硬负样本采样的对比学习机制,以增强学生模型对复杂语境的理解和实体类别的区分能力。[研究结果/结论]实验结果显示,在增强后的CDTier数据集上,学生模型在保持F1值94.08%的同时,其推理效率提升了22.05%,能够更好地满足网络安全领域对实时高效命名实体识别的实际需求。 展开更多
关键词 威胁情报 实体识别 多层次知识蒸馏 对比学习 硬负样本采样
在线阅读 下载PDF
基于强化学习的社交网络影响力最小化模型GCNNs-DDQN
9
作者 陈梓彦 袁得嵛 +1 位作者 孙泽宇 程佳琳 《计算机科学与探索》 北大核心 2025年第9期2458-2469,共12页
谣言传播迅速且危害较大,因此,利用辟谣信息对谣言传播进行抑制对于社会稳定有重要意义。为了使已经传播的谣言的影响力尽快减小并消失,提出一种结合图神经网络GCN、GNN、Double DQN的动态辟谣GCNNs-DDQN模型。使用GCN获得节点作为源节... 谣言传播迅速且危害较大,因此,利用辟谣信息对谣言传播进行抑制对于社会稳定有重要意义。为了使已经传播的谣言的影响力尽快减小并消失,提出一种结合图神经网络GCN、GNN、Double DQN的动态辟谣GCNNs-DDQN模型。使用GCN获得节点作为源节点和目标节点的初始节点嵌入,结合节点状态向量,将其作为输入传入4个耦合的GNN以获得复杂节点嵌入,进行Q值计算,同时使用Double DQN结合Q值与奖励,优化4个耦合的GNN和Double DQN模型的权重参数,从而实现根据谣言传播的情况,选择当前情况下影响力最大的节点发布辟谣信息。使用10个不同大小的真实数据集来评估模型的辟谣效果,并对各参数对辟谣效果的影响进行分析,最后进行消融实验。实验结果表明,GCNNs-DDQN模型具有更强的泛化能力,能够应用于不同的社交网络中,相较于传统算法,辟谣时间最高可缩短2个单位时间;对谣言有利的参数值的增加,会加大辟谣难度,增加阻断时间,而对辟谣信息有利的因素,则不一定会减少阻断时间,反而可能阻碍辟谣。 展开更多
关键词 谣言影响力最小化 图神经网络 Double DQN
在线阅读 下载PDF
面向视频专网的网络安全态势指标体系的构建 被引量:11
10
作者 李欣 段詠程 +1 位作者 黄淑华 樊志杰 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第9期1625-1634,共10页
针对当前面向视频专网的网络安全态势评估中缺乏一套完善的指标体系问题,对构建网络安全态势指标体系进行了研究。首先,重点对视频专网面临的网络安全风险进行了研究与分析;然后,结合以往网络安全态势评估技术中的基础评价指标,针对视... 针对当前面向视频专网的网络安全态势评估中缺乏一套完善的指标体系问题,对构建网络安全态势指标体系进行了研究。首先,重点对视频专网面临的网络安全风险进行了研究与分析;然后,结合以往网络安全态势评估技术中的基础评价指标,针对视频专网自身特点,构建了一套适用于视频专网的网络安全态势指标体系;最后,给出了指标值的计算方法,为视频专网的网络安全态势评估奠定基础。研究成果对于完善和丰富面向视频专网的网络安全态势指标体系具有一定的参考和借鉴意义。 展开更多
关键词 指标体系 视频专网 态势要素 态势感知 态势评估
在线阅读 下载PDF
基于机器学习的典型社会安全事件发生规律研究及对雄安新区的启示 被引量:9
11
作者 邱凌峰 胡啸峰 +4 位作者 周睿 顾海硕 唐正 郑超慧 张学军 《中国安全生产科学技术》 CAS CSCD 北大核心 2018年第10期11-17,共7页
针对雄安新区建设和发展过程中对社会安全事件的防控需求,以盗窃作为典型社会安全事件,提出基于机器学习模型的社会安全事件分析预测方法,并以A市2012—2016年的实际盗窃犯罪数据为基础,提取发案时间、发案地点、实施手段和损失金额作... 针对雄安新区建设和发展过程中对社会安全事件的防控需求,以盗窃作为典型社会安全事件,提出基于机器学习模型的社会安全事件分析预测方法,并以A市2012—2016年的实际盗窃犯罪数据为基础,提取发案时间、发案地点、实施手段和损失金额作为分类特征,通过比较多种机器学习算法,研究盗窃前科人员的预测方法,并根据预测结果挖掘盗窃前科人员的作案规律。研究结果表明:随机森林算法表现最优,查准率、查全率和F1均达到了0.85以上;对于盗窃这一典型社会安全事件,其前科人员倾向于选择下午时段和人流量大的地区实施,盗窃金额明显高于初犯和惯犯。最后,基于前述研究,提出构建数据驱动的社会安全事件预测预警和综合研判系统,并针对该系统的前期建设和后期使用,给出"制定统一的数据格式"、"实现数据实时接入"的建议。相关研究成果可为雄安新区社会安全事件预测预警以及治安防控工作的开展提供参考和借鉴。 展开更多
关键词 雄安新区 社会安全 机器学习 分类预测 社会治安防控
在线阅读 下载PDF
面向前端防范的网络威胁情报细粒度本体研究 被引量:4
12
作者 胡勉宁 李欣 +1 位作者 李明锋 朱容辰 《情报杂志》 CSSCI 北大核心 2023年第9期135-140,148,共7页
[研究目的]随着网络威胁情报的功能从共享演化为赋能、从辅助后端治理转变为支撑前端防范,其中本体构建缺乏整体思维、本体粒度限制情报赋能等应用问题日益显现,因此迫切需要一套面向前端防范的细粒度本体模型。[研究方法]采用文献分析... [研究目的]随着网络威胁情报的功能从共享演化为赋能、从辅助后端治理转变为支撑前端防范,其中本体构建缺乏整体思维、本体粒度限制情报赋能等应用问题日益显现,因此迫切需要一套面向前端防范的细粒度本体模型。[研究方法]采用文献分析法深入思考前端防范下网络威胁情报的应用问题,依托博弈论构建网络威胁情报细粒度本体模型,并以贝叶斯网络模型为例对网络威胁情报细粒度本体应用下的前端防范进行模型检验。[研究结论]网络威胁情报细粒度本体模型能有效应用在情报赋能下的前端方法工作,形成了网络威胁情报从理论构建、方法创新到情报应用实践的整套网络安全前端防范探索机制。 展开更多
关键词 网络安全 网络威胁情报 情报赋能 细粒度本体模型 前端防范 博弈论 本体构建
在线阅读 下载PDF
公安专用视频监控系统前端布点研究综述 被引量:6
13
作者 梁烨 洪卫军 张鸿洲 《科学技术与工程》 北大核心 2018年第3期142-152,共11页
现实中由于公安专用视频监控系统本身的一些特性,如覆盖规模大、联网层次复杂、公安业务应用要求高、财政成本和法律法规限制严格等因素,势必造成系统前端点位建设需要运用科学合理的前端布点方法来指导工作,以实现在各方面因素限制下... 现实中由于公安专用视频监控系统本身的一些特性,如覆盖规模大、联网层次复杂、公安业务应用要求高、财政成本和法律法规限制严格等因素,势必造成系统前端点位建设需要运用科学合理的前端布点方法来指导工作,以实现在各方面因素限制下部署有限的点位达到系统最佳的效能的目的。对国内外与系统前端布点相关的研究文献进行了广泛深入的调研。通过全面性分析影响前端布点的几个因素;得知除了公安业务需求之外,单摄像机物理特性与多摄像机相互关系是影响系统前端布点最重要的影响因素。其中在业界研究中,单摄像机物理特性通常由传感覆盖问题所体现,多摄像机相互关系则主要涉及区域点位密度问题与点位部署/规划问题两个方面。经过调研发现,当前业界对于公安专用视频监控系统前端布点工作的专门性研究较少,集中在具体单个问题的研究。因此该项工作的开展,需要将上述三个问题相关的研究综合起来,并结合公安业务需求来进行综合考虑。 展开更多
关键词 公安专用视频监控系统 前端布点方法 摄像机覆盖模型 点位密度 点位规划
在线阅读 下载PDF
基于RSAR的随机森林网络安全态势要素提取 被引量:11
14
作者 段詠程 王雨晴 +1 位作者 李欣 杨乐 《信息网络安全》 CSCD 北大核心 2019年第7期75-81,共7页
网络安全态势要素提取是开展网络安全态势感知的前提性基础工作,同时也是直接影响网络安全态势感知系统性能的关键性工作之一。文章针对在复杂异构的网络环境下网络安全态势要素难以提取的问题,提出了一种基于粗糙集属性约简(Rough Set ... 网络安全态势要素提取是开展网络安全态势感知的前提性基础工作,同时也是直接影响网络安全态势感知系统性能的关键性工作之一。文章针对在复杂异构的网络环境下网络安全态势要素难以提取的问题,提出了一种基于粗糙集属性约简(Rough Set Attribute Reduction, RSAR )的随机森林网络安全态势要素提取方法。在该提取方法中,首先通过粗糙集理论确定数据集中每个属性的重要性,对重要程度低的属性进行约简,删除冗余属性;然后,使用随机森林分类器对约简后的数据集进行分类训练。为验证提出方法的有效性,文章使用入侵检测数据集对提出方法进行实验测试,实验结果表明,通过与传统提取方法相比,该方法有效地提高了态势要素提取的准确性,实现了高效提取网络安全态势要素。 展开更多
关键词 态势感知 态势要素提取 随机森林 粗糙集
在线阅读 下载PDF
基于机器学习的户外作业警务人员热应激预测模型 被引量:1
15
作者 胡啸峰 黄玲 《中国安全科学学报》 CAS CSCD 北大核心 2024年第11期220-228,共9页
为解决高温环境下户外作业警务人员热应激风险预测问题,构建不同环境工况、劳动强度和服装等条件下的警务人员核心温度监测试验数据集,提取身高、体质量、年龄、性别、体脂率、身体活动比率(PAR)、服装热阻(CI)、环境温度、相对湿度为特... 为解决高温环境下户外作业警务人员热应激风险预测问题,构建不同环境工况、劳动强度和服装等条件下的警务人员核心温度监测试验数据集,提取身高、体质量、年龄、性别、体脂率、身体活动比率(PAR)、服装热阻(CI)、环境温度、相对湿度为特征,基于K近邻(KNN)、随机森林(RF)、梯度提升决策树(GBDT)等多种机器学习方法,建立户外作业警务人员核心温度及热应激风险预测模型,并进行验证。结果表明:对于高温环境下户外作业警务人员的核心温度预测模型,KNN、RF和GBDT的拟合优度R^(2)均超过0.9,在误差方面,KNN模型的预测误差最小,均方根误差(RMSE)为0.053℃;对于高温环境下户外作业警务人员热应激预测模型,RF、GBDT和KNN模型的预测性能明显优于其他模型。 展开更多
关键词 机器学习 户外作业 警务人员 热应激 核心温度 高温环境
在线阅读 下载PDF
多源异构数据渐进式融合的虚假新闻检测
16
作者 于泳欣 纪科 +3 位作者 高源 陈贞翔 马坤 赵晓凡 《计算机科学》 CSCD 北大核心 2024年第11期30-38,共9页
社交媒体平台上充斥着大量未经验证的信息,这些信息大多为不同来源的异构数据,其传播范围之广、速度之快,对个人和社会造成了严重危害。因此,有效检测和防范虚假新闻至关重要。针对当前虚假新闻检测模型局限于从单一数据来源获取新闻文... 社交媒体平台上充斥着大量未经验证的信息,这些信息大多为不同来源的异构数据,其传播范围之广、速度之快,对个人和社会造成了严重危害。因此,有效检测和防范虚假新闻至关重要。针对当前虚假新闻检测模型局限于从单一数据来源获取新闻文本及视觉信息,导致新闻报道主观性较强、数据覆盖不全面的问题,提出了一种多源异构数据渐进式融合的虚假新闻检测模型。首先,进行多源异构数据的收集、筛选和清洗,由此构建了一个多源多模态数据集,其中包含关于每个事件的多个不同角度的报道;接着,通过将文本特征提取器和视觉特征提取器获取的特征输入多源融合模块,实现了不同来源特征之间的渐进式融合;同时,引入文本的情感特征和图像的频域特征,以实现多层次的特征提取;最后,采用软注意力机制进行特征集成。实验结果和分析表明,与已有的流行方法相比,所提模型有较好的检测效果,为大数据时代的虚假新闻检测提供了一种有效的解决方案。 展开更多
关键词 虚假新闻检测 数据扩增 多源异构数据 特征融合 情感特征 频域特征
在线阅读 下载PDF
遗忘学习前置的反后门学习方法研究
17
作者 王晗旭 李欣 +1 位作者 许文韬 斯彬洲 《计算机工程与应用》 CSCD 北大核心 2024年第19期259-267,共9页
反后门学习方法(anti-backdoor learning,ABL)在利用中毒数据集进行模型训练过程中能实时检测并抑制后门生成,最终得到良性模型。但反后门学习方法存在后门样本和良性样本无法有效隔离、后门消除效率不高的问题。为此,提出遗忘学习前置... 反后门学习方法(anti-backdoor learning,ABL)在利用中毒数据集进行模型训练过程中能实时检测并抑制后门生成,最终得到良性模型。但反后门学习方法存在后门样本和良性样本无法有效隔离、后门消除效率不高的问题。为此,提出遗忘学习前置的反后门学习方法(anti-backdoor learning method based on preposed unlearning,ABLPU),在隔离阶段对训练样本增加提纯操作,达到有效隔离良性样本的目标,在消除阶段采用后门遗忘-模型再训练的范式,并引入遗忘系数,实现后门的高效消除。在CIFAR-10数据集上针对后门攻击方法BadNets,遗忘学习前置的反后门学习方法较反后门学习方法(基线方法)良性准确率提高1.21个百分点,攻击成功率下降1.38个百分点。 展开更多
关键词 后门攻击 反后门学习 数据提纯 遗忘学习前置 遗忘系数
在线阅读 下载PDF
基于大语言模型的PTCR外部知识型视觉问答框架
18
作者 薛迪 李欣 刘明帅 《计算机科学与探索》 CSCD 北大核心 2024年第11期2912-2924,共13页
针对外部知识型视觉问答(VQA)模型输入信息不足、推理性能差的问题,构建了一种基于大语言模型(LLM)的PTCR外部知识型VQA框架。该框架由答案候选生成、针对性图像描述、自主式思维链构建、提示LLM推理四部分构成。PTCR框架使用LLM指导多... 针对外部知识型视觉问答(VQA)模型输入信息不足、推理性能差的问题,构建了一种基于大语言模型(LLM)的PTCR外部知识型VQA框架。该框架由答案候选生成、针对性图像描述、自主式思维链构建、提示LLM推理四部分构成。PTCR框架使用LLM指导多模态大模型生成针对性的图像描述,解决了以往图像标题覆盖不全面的问题;通过LLM自主生成思维链,并在推理过程中提供相似问题的思考过程,提高了模型的推理能力;在推理过程引入选项重排技术消除LLM的选择位置偏见,通过多数投票的方式降低了推理的随机性误差。实验结果表明,经PTCR框架增强的CogVLM模型,其准确率在OK-VQA、A-OKVQA数据集上分别提升了16.7个百分点、13.3个百分点。同时,与Prophet相比,PTCR框架在OK-VQA、A-OKVQA数据集上准确率分别提升了3.4个百分点、5.0个百分点。消融实验的结果证明,所使用的针对性图像描述、自主式思维链等方法对准确率均有提升效果。可见PTCR框架在改进外部知识型VQA任务性能方面有所提升。 展开更多
关键词 视觉问答 提示工程 大语言模型 跨模态
在线阅读 下载PDF
引入主题节点的异构图舆情摘要方法
19
作者 宝日彤 曾淼瑞 孙海春 《科学技术与工程》 北大核心 2024年第23期9965-9972,共8页
微博等社交软件承载着网民对社会舆论事件的不同观点,如何在海量主题评论中识别出有价值的信息已经成为重要课题。提出了一种基于异构图的舆情摘要方法,有效提取热点事件的主流观点,便于引导化解互联网舆情危机。针对多文档摘要任务中... 微博等社交软件承载着网民对社会舆论事件的不同观点,如何在海量主题评论中识别出有价值的信息已经成为重要课题。提出了一种基于异构图的舆情摘要方法,有效提取热点事件的主流观点,便于引导化解互联网舆情危机。针对多文档摘要任务中难以捕捉跨文档语义关系的难点问题,将主题节点引入评论句子图从而挖掘出输入文档间的潜在语义关联。具体地,抽取评论的主题并构建包含主题节点的异构图模型,利用图注意力机制进行不同粒度节点语义信息的交互,最后结合最大边界相关算法进行候选摘要句子的抽取。实验结果显示,改进模型在英文通用Multi-News数据集上Rouge1、Rouge2、,RougeL分数分别提升了0.46%、0.46%、0.48%;与已有Textrank、Sumpip等热点模型对比,在自制微博评论数据集上该模型性能达到最好。 展开更多
关键词 多文档摘要 舆情摘要 主题节点 图注意力机制 微博评论摘要
在线阅读 下载PDF
融合跨模态Transformer的外部知识型VQA
20
作者 王虞 李明锋 孙海春 《科学技术与工程》 北大核心 2024年第20期8577-8586,共10页
针对外部知识型的视觉问答(visual question answering,VQA)任务性能效果不佳的问题,构建一种融合跨模态Transformer的外部知识型VQA模型框架,通过在VQA模型外引入外接知识库来提高VQA模型在外部知识型任务上的推理能力。进一步地,模型... 针对外部知识型的视觉问答(visual question answering,VQA)任务性能效果不佳的问题,构建一种融合跨模态Transformer的外部知识型VQA模型框架,通过在VQA模型外引入外接知识库来提高VQA模型在外部知识型任务上的推理能力。进一步地,模型借助双向交叉注意力机制提升文本问题、图像、外接知识的语义交互融合能力,用于优化VQA模型在面对外部知识时普遍存在的推理能力不足的问题。结果表明:与基线模型LXMERT相比,在OK VQA数据集上,本文模型整体性能指标overall提升了15.01%。同时,与已有最新模型相比,在OK VQA数据集上,本文模型整体性能指标overall提升了4.46%。可见本文模型在改进外部知识型VQA任务性能方面有所提升。 展开更多
关键词 视觉问答(VQA) 外部知识 跨模态 知识图谱
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部