期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于脑电的快速序列视觉呈现脑-机接口系统研究进展综述
1
作者 魏玮 邱爽 +3 位作者 李叙锦 毛嘉宇 王妍紫 何晖光 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期443-455,共13页
脑-机接口(BCI)系统建立大脑与外部设备之间的直接交流通路,结合快速序列视觉呈现(RSVP)范式能够实现利用人类视觉系统进行高流通量图像目标检索。近些年来,RSVP-BCI系统在范式编码、脑电(EEG)解码和系统应用方面的研究取得了长足的进... 脑-机接口(BCI)系统建立大脑与外部设备之间的直接交流通路,结合快速序列视觉呈现(RSVP)范式能够实现利用人类视觉系统进行高流通量图像目标检索。近些年来,RSVP-BCI系统在范式编码、脑电(EEG)解码和系统应用方面的研究取得了长足的进步。对范式编码的研究揭示不同范式参数对系统性能的影响,促进提升系统性能;脑电解码的研究在提升算法分类性能的同时推动少训练、零训练样本、多模态等场景下的应用;对RSVP-BCI系统应用的研究实现推动系统走向实际应用并拓宽了应用领域。同时,系统仍面临着迈向实际时可应用领域范围窄、脑电跨域解码难题以及计算机视觉飞速进步带来的挑战。该文对RSVP-BCI近年来的相关研究进展进行了回顾与总结,并对未来的发展方向进行了展望。 展开更多
关键词 脑-机接口 快速序列视觉呈现 脑电
在线阅读 下载PDF
机器人类脑智能研究综述 被引量:5
2
作者 王瑞东 王睿 +1 位作者 张天栋 王硕 《自动化学报》 EI CAS CSCD 北大核心 2024年第8期1485-1501,共17页
传统机器人经过长时间的研究和发展,已经在生产和生活的多个领域得到了广泛的应用,但在复杂多变的环境中依然缺乏与真实生物类似的灵活性、稳定性和适应能力.类脑智能作为一种新型的机器智能,使用计算建模的方法模拟生物神经系统的各类... 传统机器人经过长时间的研究和发展,已经在生产和生活的多个领域得到了广泛的应用,但在复杂多变的环境中依然缺乏与真实生物类似的灵活性、稳定性和适应能力.类脑智能作为一种新型的机器智能,使用计算建模的方法模拟生物神经系统的各类特性,进而实现对各类信息的推理和决策,近年来受到了学术界的广泛关注.鉴于此,综述了国内外面向机器人系统的类脑智能研究现状,并对类脑智能方法在机器人感知、决策和控制三个研究方向的成果进行了整理、归纳和分析,最后从软硬件层面分别指出了机器人类脑智能目前存在的主要问题和未来的发展方向. 展开更多
关键词 机器人 类脑机器人 类脑智能 脉冲神经网络
在线阅读 下载PDF
模态间关系促进的行人检索方法
3
作者 李博 张飞飞 徐常胜 《软件学报》 EI CSCD 北大核心 2024年第10期4766-4780,共15页
基于文本描述的行人检索是一个新兴的跨模态检索子任务,由传统行人重识别任务衍生而来,对公共安全以及人员追踪具有重要意义.相比于单模态图像检索的行人重识别任务,基于文本描述的行人检索解决了实际应用中缺少查询图像的问题,其主要... 基于文本描述的行人检索是一个新兴的跨模态检索子任务,由传统行人重识别任务衍生而来,对公共安全以及人员追踪具有重要意义.相比于单模态图像检索的行人重识别任务,基于文本描述的行人检索解决了实际应用中缺少查询图像的问题,其主要挑战在于该任务结合了视觉内容和文本描述两种不同模态的数据,要求模型同时具有图像理解能力和文本语义学习能力.为了缩小行人图像和文本描述的模态间语义鸿沟,传统的基于文本描述的行人检索方法多是对提取的图像和文本特征进行机械地分割,只关注于跨模态信息的语义对齐,忽略了图像和文本模态内部的潜在联系,导致模态间细粒度匹配的不准确.为了解决上述问题,提出模态间关系促进的行人检索方法,首先利用注意力机制分别构建模态内自注意力矩阵和跨模态注意力矩阵,并将注意力矩阵看作不同特征序列间的响应值分布.然后,分别使用两种不同的矩阵构建方法重构模态内自注意力矩阵和跨模态注意力矩阵.其中自注意力矩阵的重构利用模态内逐元素重构的方式可以很好地挖掘模态内部的潜在联系,而跨模态注意力矩阵的重构用模态间整体重构矩阵的方法,以跨模态信息为桥梁,可充分挖掘模态间的潜在信息,缩小语义鸿沟.最后,用基于任务的跨模态投影匹配损失和KL散度损失联合约束模型优化,达到模态间信息相互促进的效果.在基于文本描述的行人检索公开数据库CUHK-PEDES上进行了定量以及检索结果的可视化,均表明所提方法可取得目前最优的效果. 展开更多
关键词 行人检索 跨模态任务 文本语义学习 关系对齐 注意力机制
在线阅读 下载PDF
基于多模态双协同Gather Transformer网络的虚假信息检测方法
4
作者 向旺 王金光 +1 位作者 王一飞 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第12期242-249,共8页
社交媒体网站是人们在日常生活中分享信息、表达和交换意见的便捷平台。随着用户数量的不断增加,社交媒体网站上出现了大量的信息数据。然而,由于用户没有检查共享信息的可靠性,这些信息的真实性难以保证,从而导致大量虚假信息在社交媒... 社交媒体网站是人们在日常生活中分享信息、表达和交换意见的便捷平台。随着用户数量的不断增加,社交媒体网站上出现了大量的信息数据。然而,由于用户没有检查共享信息的可靠性,这些信息的真实性难以保证,从而导致大量虚假信息在社交媒体上广泛传播。然而,现有方法大多存在以下局限性:1)大多数方法通过简单提取文本与视觉特征,将其拼接后得到多模态特征来进行虚假信息判断,忽略了模态间和模态内细粒度内在联系,缺乏对关键信息的检索和筛选;2)多模态信息间缺乏指导性的特征提取,文本和视觉等特征之间缺乏交互增强,对多模态信息的理解不足。为了应对这些挑战,提出了一种新颖的基于多模态双协同Gather Transformer网络(Multimodal Dual-Collaborative Gather Transformer Network,MDCGTN)的虚假信息检测方法。在MDCGTN模型中,通过文本-视觉编码网络对文本和视觉信息的特征表示进行提取,将获得的视觉和文本特征表示输入多模态Gather Transformer网络进行多模态信息融合,使用Gather机制提取关键信息,充分捕捉和融合模态内和模态间细粒度关系。此外,设计了一个双协同机制对社交媒体帖子的多模态信息进行整合,以实现模态之间信息的交互和增强。在两个公开可用的基准数据集上进行了大量实验,结果表明,与现有的先进基准方法相比,所提方法准确率明显提升,证明了其对于虚假信息检测的优越性能。 展开更多
关键词 多模态 虚假信息检测 社交媒体 Gather Transformer网络
在线阅读 下载PDF
中国大模型密集开源的原因及可能影响
5
作者 郑晓龙 《人民论坛》 北大核心 2025年第11期64-67,共4页
当开源精神的火种点燃人工智能的星辰大海,人类正见证一场关乎数智文明重构的认知革命。开源大模型不仅重构技术生态,而且重塑人类对知识生产与再分配的传统认知范式。当前,这场看似温和的大模型开源技术运动,实质上是中国科技企业突破... 当开源精神的火种点燃人工智能的星辰大海,人类正见证一场关乎数智文明重构的认知革命。开源大模型不仅重构技术生态,而且重塑人类对知识生产与再分配的传统认知范式。当前,这场看似温和的大模型开源技术运动,实质上是中国科技企业突破算力封锁、实现产业转型与生态博弈共同催生的战略选择,其行动早已超越单纯的技术选择,直指知识与技术的垄断与解放。 展开更多
关键词 人工智能 大模型 DeepSeek 开源 重构
在线阅读 下载PDF
融合大规模医学事实的跨语言双层知识图谱 被引量:5
6
作者 王楚童 李明达 +5 位作者 孙孟轩 王静 杨雪冰 牛景昊 贺志阳 张文生 《软件学报》 北大核心 2025年第3期1240-1253,共14页
得益于信息化技术的快速发展和医疗信息系统的普及,医学数据库中积淀了海量的医学事实,如患者临床诊疗事件以及医学专家共识等.如何从医学事实中提炼出知识,进而对其管理和合理利用,是推进诊疗自动化和智能化的关键.知识图谱作为一种新... 得益于信息化技术的快速发展和医疗信息系统的普及,医学数据库中积淀了海量的医学事实,如患者临床诊疗事件以及医学专家共识等.如何从医学事实中提炼出知识,进而对其管理和合理利用,是推进诊疗自动化和智能化的关键.知识图谱作为一种新型的知识表示工具,能够有效地挖掘和组织大规模医学事实中的信息,受到医疗领域从业人员的广泛关注.然而,现有医疗知识图谱普遍存在规模小、限制多、可扩展性差等问题,面向医学事实的知识表达能力有限.为此,提出一种双层医疗知识图谱架构,通过对英文患者诊疗事件和中文专家共识进行信息抽取,构建得到一个跨语言、多模态、动态更新、可拓展性强的10亿级医疗知识图谱,可提供更加精准的智能医疗服务. 展开更多
关键词 医学事实 医疗知识图谱 双层知识表示 信息抽取 知识融合
在线阅读 下载PDF
从RAG到SAGE:现状与展望 被引量:1
7
作者 田永林 王雨桐 +9 位作者 王兴霞 杨静 沈甜雨 王建功 范丽丽 郭超 王寿文 赵勇 武万森 王飞跃 《自动化学报》 北大核心 2025年第6期1145-1169,共25页
大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,... 大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,为大模型掌握实时型、行业型及私有型知识提供有力支撑,进而促进大模型技术向多样场景的快速推广和实施.围绕RAG,阐述其基本原理、发展现状及典型应用,并分析其优势和面临的挑战.在RAG的基础上,通过结合搜索模块和多级缓存管理模块,提出RAG的拓展框架SAGE,以建立更加灵活和高效的大模型知识外挂工具链. 展开更多
关键词 大模型 检索增强生成 基础智能 知识自动化
在线阅读 下载PDF
基于Transformer的状态−动作−奖赏预测表征学习 被引量:1
8
作者 刘民颂 朱圆恒 赵冬斌 《自动化学报》 北大核心 2025年第1期117-132,共16页
为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率,提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework,TSAR).具体来说,TSA... 为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率,提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework,TSAR).具体来说,TSAR提出一种基于Transformer的融合状态−动作−奖赏信息的序列预测任务.该预测任务采用随机掩码技术对序列数据进行预处理,通过最大化掩码序列的预测状态特征与实际目标状态特征间的互信息,同时学习状态与动作表征.为进一步强化状态和动作表征与强化学习(Reinforcement learning,RL)策略的相关性,TSAR引入动作预测学习和奖赏预测学习作为附加的学习约束以指导状态和动作表征学习.TSAR同时将状态表征和动作表征显式地纳入到强化学习策略的优化中,显著提高了表征对策略学习的促进作用.实验结果表明,在DMControl的9个具有挑战性的困难环境中,TSAR的性能和样本效率超越了现有最先进的方法. 展开更多
关键词 深度强化学习 表征学习 自监督对比学习 TRANSFORMER
在线阅读 下载PDF
基于高效特征提取和大感受野的无人机航拍图像目标检测
9
作者 沈朕宇 朱凤华 +2 位作者 王知学 沈震 熊刚 《智能系统学报》 北大核心 2025年第4期813-821,共9页
针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融... 针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融合新的构建模块以提升特征提取效率;引入内容感知特征重组模块和大型选择性核网络,增强颈部网络对遮挡目标的上下文感知能力;采用Wise-IoU损失函数优化边界框回归稳定性。在VisDrone2019数据集上的实验结果表明,EFLF-Net较基准模型在平均精度上提高了5.2%。与已有代表性的目标检测算法相比,该方法对存在小目标、目标相互遮挡和复杂背景的无人机航拍图像有更好的检测效果。 展开更多
关键词 无人机航拍图像 小目标检测 特征提取 多尺度变化 YOLOv8 上下文信息 感受野 损失函数
在线阅读 下载PDF
用于激光雷达目标检测的单阶段无锚框优化网络
10
作者 朱望江 郭建伟 +2 位作者 张吉光 孟维亮 张晓鹏 《计算机辅助设计与图形学学报》 北大核心 2025年第3期457-464,共8页
激光雷达目标检测近年来开始借鉴图像目标检测的网络设计,但依然存在计算低效无法满足实时应用以及网络结构简单导致性能不足的问题.为此,提出的网络采用了单阶段无锚框的简洁设计;优化了激光点云体素化表达,在提升计算效率的同时保留... 激光雷达目标检测近年来开始借鉴图像目标检测的网络设计,但依然存在计算低效无法满足实时应用以及网络结构简单导致性能不足的问题.为此,提出的网络采用了单阶段无锚框的简洁设计;优化了激光点云体素化表达,在提升计算效率的同时保留了一部分点云高程特征;基于残差网络的思想,设计了更深的主干网络结构用于提取深度特征;引入特征金字塔来提升小目标的检测效果.在公开数据集KITTI上,所提网络的mAP指标在各类别目标的检测中均取得了领先的性能(提高了1%~3%).在自动驾驶计算平台上的运行时间测试表明,所提网络能够达到43 ms/帧的处理速度,满足实时性需求. 展开更多
关键词 目标检测 激光雷达 自动驾驶 单阶段
在线阅读 下载PDF
结合多尺度大核卷积的红外图像人体检测算法
11
作者 邵煜潇 鲁涛 +2 位作者 王震宇 彭勇杰 姚巍 《智能系统学报》 北大核心 2025年第4期787-799,共13页
针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(... 针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(re-parameterization multi-scale large kernel convolution)。该网络通过空间和通道重构注意力模块,将注意值集中到对检测任务更重要的区域。通过Sobel算子强化边缘特征,提高对不同姿态人体的检测能力。RML-YOLO的有效性在自制数据集上得到验证。在只有1.8×10~6可学习参数的情况下,模型的AP50和AP50-75分别达到了91.2%和87.3%,与参数量相近的YOLOv8-n相比分别提高了4.4%和5.3%。结果表明,RML-YOLO显著提高了利用红外图像进行废墟环境下人体检测的精度。 展开更多
关键词 红外图像 目标检测 重构注意力 多尺度特征 大核卷积 卷积神经网络 特征提取 重参数化
在线阅读 下载PDF
基于双路单目视觉的多轴孔机器人快速精密装配
12
作者 李福东 蒋彬 +3 位作者 杨月全 陈欣钰 曹志强 蒋远雷 《控制工程》 北大核心 2025年第6期969-976,1007,共9页
针对直插件多轴孔并行装配时引脚一致性差,装配成功率低的问题,设计开发了一种结合稳定精确轴孔视觉定位算法和高效机器人视觉引导插装技术的直插式元件多轴孔精密装配系统。首先,离线标定轴心与孔心定位相机,并确定其与机器人之间的位... 针对直插件多轴孔并行装配时引脚一致性差,装配成功率低的问题,设计开发了一种结合稳定精确轴孔视觉定位算法和高效机器人视觉引导插装技术的直插式元件多轴孔精密装配系统。首先,离线标定轴心与孔心定位相机,并确定其与机器人之间的位姿关系;其次,结合CAD模型采用基于约束的随机抽样一致(random sample consensus, RANSAC)椭圆拟合算法精确定位轴孔中心;然后,开发了以多轴孔中心为定位锚点,以多轴孔平均角度偏差为旋转依据的插装引导算法,通过预测多轴孔装配间隙指导调配,提高插装成功率。最后,以图像差分算法检测装配结果,把控装配质量。实验数据表明,系统具备定位装配精度高、速度快、装配成功率高的优点,可实现单元件总体检测时间小于100 ms,单轴最终装配误差小于±0.3 mm,装配成功率大于98%的目标。 展开更多
关键词 机器人 精密装配 视觉定位 单目视觉
在线阅读 下载PDF
梯度引导的JPEG压缩图像超分辨率重建
13
作者 曹坪 林树冉 +2 位作者 张淳杰 郑晓龙 赵耀 《自动化学报》 北大核心 2025年第6期1261-1276,共16页
在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPE... 在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络.该网络以超分辨率分支为主导,融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征,实现了高质量图像重建.JPEG压缩伪影去除分支专注于压缩伪影抑制,缓解了主导分支的重建负担.梯度引导分支则精准估计图像梯度,引导主导分支恢复更多细节与纹理.实验结果表明,该方法提升了低分辨率JPEG压缩图像的重建质量. 展开更多
关键词 JPEG压缩 超分辨率 图像重建 梯度先验
在线阅读 下载PDF
新颖的曲面手掌视触觉传感器
14
作者 胡静怡 崔少伟 +1 位作者 张少林 王硕 《浙江大学学报(工学版)》 北大核心 2025年第6期1103-1109,1129,共8页
大多数现有的机器人视触觉传感器由于采用平面式感知结构,在复杂三维环境和精细操作任务中面临接触信息缺失、深度感知不足的局限性.为此,提出曲面手掌视触觉传感器,其创新性曲面结构设计将有效感知区域扩展至三维空间,显著地提升触觉... 大多数现有的机器人视触觉传感器由于采用平面式感知结构,在复杂三维环境和精细操作任务中面临接触信息缺失、深度感知不足的局限性.为此,提出曲面手掌视触觉传感器,其创新性曲面结构设计将有效感知区域扩展至三维空间,显著地提升触觉感知深度和接触信息完整性.建立基于双目立体视觉折射光线追踪模型的点云重建框架,用于生成高精度的三维触觉点云数据.为了提高数据处理效率和准确性,提出高效的点云显著性检测算法,以实现关键接触区域的智能识别与实时点云提取.实验结果表明,所提传感器的结构设计和点云重建框架具有良好的鲁棒性,三维触觉点云感知精度达到0.20 mm,点云重建帧率达到30帧/s,最大按压深度为10 mm.该传感器能够精准实时地提取显著接触点云,为机器人在复杂环境中的精细操作提供了有力支持. 展开更多
关键词 机器人触觉感知 触觉传感器 视触觉传感器 三维触觉点云 点云显著性检测
在线阅读 下载PDF
两团队零和博弈下熵引导的极小极大值分解强化学习方法
15
作者 胡光政 朱圆恒 赵冬斌 《自动化学报》 北大核心 2025年第4期875-889,共15页
在两团队零和马尔科夫博弈中,一组玩家通过合作与另一组玩家进行对抗.由于对手行为的不确定性和复杂的团队内部合作关系,在高采样成本的任务中快速识别优势的分布式策略仍然具有挑战性.鉴于此,提出一种熵引导的极小极大值分解(Entropy-g... 在两团队零和马尔科夫博弈中,一组玩家通过合作与另一组玩家进行对抗.由于对手行为的不确定性和复杂的团队内部合作关系,在高采样成本的任务中快速识别优势的分布式策略仍然具有挑战性.鉴于此,提出一种熵引导的极小极大值分解(Entropy-guided minimax factorization,EGMF)强化学习方法,在线学习队内合作和队间对抗的策略.首先,提出基于极小极大值分解的多智能体执行器−评估器框架,在高采样成本的、不限动作空间的任务中,提升优化效率和博弈性能;其次,引入最大熵使智能体可以更充分地探索状态空间,避免在线学习过程收敛到局部最优;此外,策略在时间域累加的熵值用于评估策略的熵,并将其与分解的个体独立Q函数结合用于策略改进;最后,在多种博弈仿真场景和一个实体机器人任务平台上进行方法验证,并与其他基线方法进行比较.结果显示EGMF可以在更少样本下学到更具有对抗性能的两团队博弈策略. 展开更多
关键词 多智能体深度强化学习 两团队零和马尔科夫博弈 最大熵 值分解
在线阅读 下载PDF
基于对手池的两人格斗游戏深度强化学习
16
作者 梁荣钦 朱圆恒 赵冬斌 《控制理论与应用》 北大核心 2025年第2期226-234,共9页
双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,... 双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,并将阶段策略梯度算法应用于对抗策略的学习.为了尽可能学到纳什均衡策略实现战胜任意对手的目标,本文设计了基于历年参赛的智能体构造对手池用于智能体训练,并探索对手选择机制对于训练过程的影响.最后在固定对手池的基础上,设计了自增长对手池算法,以提升对手策略的完备性和训练智能体的鲁棒性.为了提高环境采样速度,本文从传统并行框架出发,设计了可用于双人游戏的多服务器分布式并行采样框架.通过实验对比发现,基于自增长对手池方法所学的智能体能以96.6%的胜率击败固定对手池中的智能体,并且在与3个仅用于测试的智能体对战时,也表现出了72.2%的胜率. 展开更多
关键词 实时格斗游戏 深度强化学习 两人零和博弈 对手策略池
在线阅读 下载PDF
一种基于多状态颜色一致性约束的激光-惯性-视觉里程计
17
作者 刘春明 于光远 +3 位作者 李琮 施鹏程 孙世颖 徐勇军 《电讯技术》 北大核心 2025年第1期119-126,共8页
基于视觉、激光等单一传感器的定位方法难以适应多样化的环境,围绕激光雷达、惯性测量单元和相机3种模态的传感器信息源,针对激光雷达(Light Detection and Ranging,LiDAR)与视觉测量没有充分关联的问题,提出了一种基于多状态颜色一致... 基于视觉、激光等单一传感器的定位方法难以适应多样化的环境,围绕激光雷达、惯性测量单元和相机3种模态的传感器信息源,针对激光雷达(Light Detection and Ranging,LiDAR)与视觉测量没有充分关联的问题,提出了一种基于多状态颜色一致性约束的激光雷达-惯性-视觉里程计方法,以提高系统的鲁棒性和定位精度。该方法紧耦合了激光雷达-惯性里程计(LiDAR-Inertial Odometry,LIO)和视觉-惯性里程计(Visual-Inertial Odometry,VIO)两个子系统,并定义了带有颜色信息的全局地图表示形式。LIO子系统中点云经过运动补偿后,直接用于构建点到面的残差。VIO子系统利用全局地图中点的深度信息,根据滑动窗口中多个相机状态观测到同一地图点颜色的一致性,构建光度误差约束,并通过不变扩展卡尔曼滤波(Extended Kalman Filter,EKF)状态估计器进行系统状态更新。在南洋理工大学发布的公共数据集上进行了实验,所提方法在该数据集不同序列上的绝对轨迹误差平均值为0.402 m。 展开更多
关键词 多传感器融合定位 状态估计 视觉-惯性里程计 激光-惯性里程计
在线阅读 下载PDF
面向半监督归纳式学习的自训练增强图模型
18
作者 杨瀚轩 余昭昕 +2 位作者 李子乾 徐会芳 孔庆超 《计算机学报》 北大核心 2025年第10期2263-2277,共15页
图表示学习是图数据分析的一个基础研究问题,在多种应用领域中均具有重要的研究价值。不同于一般的直推式学习,归纳式图表示学习要求对训练过程中不可见的未知节点进行推理和分类,因此具有更大的研究挑战。现有归纳式学习方法主要采用... 图表示学习是图数据分析的一个基础研究问题,在多种应用领域中均具有重要的研究价值。不同于一般的直推式学习,归纳式图表示学习要求对训练过程中不可见的未知节点进行推理和分类,因此具有更大的研究挑战。现有归纳式学习方法主要采用建立在全监督学习下的图神经网络,这些方法依赖于大量带标注的数据进行训练,因而在面对可见结构中节点标注稀缺的半监督归纳式学习问题时可能存在模型过拟合问题。本文首次提出半监督归纳式图表示学习问题,并建立了一种自训练增强的归纳式图(Self-Training Augmented Inductive Graph,STAIG)模型,该模型由一个使用图神经网络学习节点向量表示的编码器和一个通过重构节点标签和属性特征训练模型的解码器组成。针对半监督归纳式图学习问题,所提出的模型采用自训练增强方法,并在编码器中提出一种基于随机游走的节点掩码方法提高预测未知节点的泛化性。在此基础上,为了进一步应对标注稀缺问题,该模型使用解码器生成节点伪标签来增强标注信息,并通过置信度过滤机制提高伪标签的可靠性。基于基准归纳式学习图数据集的实验验证了本文提出的STAIG模型在半监督节点分类任务上取得了优于对比方法的结果,且在标注数据比例低于10%的弱监督学习设置下具有显著优势。 展开更多
关键词 归纳式图表示学习 半监督节点分类 变分图自编码 自训练增强
在线阅读 下载PDF
基于扰动响应的自适应集成黑盒对抗攻击算法
19
作者 冯卫栋 余东 +1 位作者 张淳杰 郑晓龙 《自动化学报》 北大核心 2025年第8期1788-1799,共12页
模型集成对抗攻击通过整合多个替代模型的梯度信息,能够显著增强对抗样本的跨模型迁移能力,是当前黑盒攻击中最具潜力的策略之一.然而,现有集成方法在动态加权过程中通常依赖扰动引起的预测误差作为权重依据,未能有效区分扰动作用与模... 模型集成对抗攻击通过整合多个替代模型的梯度信息,能够显著增强对抗样本的跨模型迁移能力,是当前黑盒攻击中最具潜力的策略之一.然而,现有集成方法在动态加权过程中通常依赖扰动引起的预测误差作为权重依据,未能有效区分扰动作用与模型自身固有误差.由此可能高估低质量模型对扰动优化的贡献,干扰攻击方向,进而削弱对抗样本的实际迁移效果.鉴于此,提出基于扰动响应的自适应集成黑盒对抗攻击算法.首先,提出扰动响应感知的权重分配策略,通过引入KL散度与集成相似度指标来衡量扰动对模型输出的真实影响,避免低质量模型对集成过程的干扰;其次,提出梯度协同扰动缩放策略,结合像素级梯度一致性度量,动态调整扰动幅度,缓解集成过程中的局部过拟合现象,增强对抗样本在多模型间的泛化能力;最后,在多个黑盒攻击任务中进行综合评估,实验结果表明所提出的基于扰动响应的自适应集成黑盒对抗攻击算法在迁移性能、攻击成功率与扰动效率方面均显著优于现有方法. 展开更多
关键词 对抗样本 集成攻击 梯度 黑盒模型
在线阅读 下载PDF
基于带毒分类器的自监督后门攻击防御方法
20
作者 王一飞 张胜杰 +1 位作者 薛迪展 钱胜胜 《计算机科学》 北大核心 2025年第4期336-342,共7页
近年来,自监督学习网络(Self-Supervised Learning,SSL)在深度学习领域迅速崛起,成为该领域发展的主要动力,特别是预训练图像模型和大规模语言模型(Large Language Model,LLM)的出现,引起了全球范围内的广泛关注。但是最近的研究发现,... 近年来,自监督学习网络(Self-Supervised Learning,SSL)在深度学习领域迅速崛起,成为该领域发展的主要动力,特别是预训练图像模型和大规模语言模型(Large Language Model,LLM)的出现,引起了全球范围内的广泛关注。但是最近的研究发现,自监督学习网络容易受到后门攻击的影响。攻击者可以通过在训练数据集中加入少量带有恶意后门的样本,来操控预训练模型在下游任务中的表现。为了防御这种SSL后门攻击,提出了一种基于带毒分类器的自监督后门攻击防御方法,称为DPC(Defending by Poisoned Classifier)。通过获取在被污染数据集上训练的威胁模型,所提方法可以准确地检测出有毒样本。实验结果显示,假设屏蔽后门触发器可以有效地改变下游聚类模型的激活状态,DPC防御方法在实验中达到了91.5%的后门触发器检测召回率以及27.4%的精准率,超过了原来的SOTA方法。这表明该方法在检测潜在威胁方面具有出色的性能,为自监督学习网络的安全性提供了有效的保障。 展开更多
关键词 自监督网络 人工智能防御 后门攻击 图像分类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部