期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于脑电的快速序列视觉呈现脑-机接口系统研究进展综述
1
作者 魏玮 邱爽 +3 位作者 李叙锦 毛嘉宇 王妍紫 何晖光 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期443-455,共13页
脑-机接口(BCI)系统建立大脑与外部设备之间的直接交流通路,结合快速序列视觉呈现(RSVP)范式能够实现利用人类视觉系统进行高流通量图像目标检索。近些年来,RSVP-BCI系统在范式编码、脑电(EEG)解码和系统应用方面的研究取得了长足的进... 脑-机接口(BCI)系统建立大脑与外部设备之间的直接交流通路,结合快速序列视觉呈现(RSVP)范式能够实现利用人类视觉系统进行高流通量图像目标检索。近些年来,RSVP-BCI系统在范式编码、脑电(EEG)解码和系统应用方面的研究取得了长足的进步。对范式编码的研究揭示不同范式参数对系统性能的影响,促进提升系统性能;脑电解码的研究在提升算法分类性能的同时推动少训练、零训练样本、多模态等场景下的应用;对RSVP-BCI系统应用的研究实现推动系统走向实际应用并拓宽了应用领域。同时,系统仍面临着迈向实际时可应用领域范围窄、脑电跨域解码难题以及计算机视觉飞速进步带来的挑战。该文对RSVP-BCI近年来的相关研究进展进行了回顾与总结,并对未来的发展方向进行了展望。 展开更多
关键词 脑-机接口 快速序列视觉呈现 脑电
在线阅读 下载PDF
机器人类脑智能研究综述 被引量:5
2
作者 王瑞东 王睿 +1 位作者 张天栋 王硕 《自动化学报》 EI CAS CSCD 北大核心 2024年第8期1485-1501,共17页
传统机器人经过长时间的研究和发展,已经在生产和生活的多个领域得到了广泛的应用,但在复杂多变的环境中依然缺乏与真实生物类似的灵活性、稳定性和适应能力.类脑智能作为一种新型的机器智能,使用计算建模的方法模拟生物神经系统的各类... 传统机器人经过长时间的研究和发展,已经在生产和生活的多个领域得到了广泛的应用,但在复杂多变的环境中依然缺乏与真实生物类似的灵活性、稳定性和适应能力.类脑智能作为一种新型的机器智能,使用计算建模的方法模拟生物神经系统的各类特性,进而实现对各类信息的推理和决策,近年来受到了学术界的广泛关注.鉴于此,综述了国内外面向机器人系统的类脑智能研究现状,并对类脑智能方法在机器人感知、决策和控制三个研究方向的成果进行了整理、归纳和分析,最后从软硬件层面分别指出了机器人类脑智能目前存在的主要问题和未来的发展方向. 展开更多
关键词 机器人 类脑机器人 类脑智能 脉冲神经网络
在线阅读 下载PDF
中国大模型密集开源的原因及可能影响
3
作者 郑晓龙 《人民论坛》 北大核心 2025年第11期64-67,共4页
当开源精神的火种点燃人工智能的星辰大海,人类正见证一场关乎数智文明重构的认知革命。开源大模型不仅重构技术生态,而且重塑人类对知识生产与再分配的传统认知范式。当前,这场看似温和的大模型开源技术运动,实质上是中国科技企业突破... 当开源精神的火种点燃人工智能的星辰大海,人类正见证一场关乎数智文明重构的认知革命。开源大模型不仅重构技术生态,而且重塑人类对知识生产与再分配的传统认知范式。当前,这场看似温和的大模型开源技术运动,实质上是中国科技企业突破算力封锁、实现产业转型与生态博弈共同催生的战略选择,其行动早已超越单纯的技术选择,直指知识与技术的垄断与解放。 展开更多
关键词 人工智能 大模型 DeepSeek 开源 重构
在线阅读 下载PDF
基于持续事件知识网络的持续社会事件分类研究
4
作者 张袁 张胜杰 +1 位作者 刘利龙 钱胜胜 《计算机科学》 北大核心 2025年第8期268-276,共9页
随着互联网的快速发展和社交媒体规模的不断扩大,社会事件分类(Social Event Classification,SEC)越来越受到人们的关注。现有的社会事件分类研究侧重于识别一组固定的社会事件。然而,在现实世界中,社交媒体上会不断出现新的社会事件,... 随着互联网的快速发展和社交媒体规模的不断扩大,社会事件分类(Social Event Classification,SEC)越来越受到人们的关注。现有的社会事件分类研究侧重于识别一组固定的社会事件。然而,在现实世界中,社交媒体上会不断出现新的社会事件,这就需要一种实用的SEC模型能够迅速适应社会事件不断发展的环境。因此,研究了一个新的关键问题,即持续社会事件分类(C-SEC),在持续收集的社会数据中会不断出现新事件;提出了一种新颖的持续事件知识网络(Continual Event Knowledge Network,CEKNet),用于持续学习持续事件知识,以实现具有持续增量事件的C-SEC分类。所提出的持续学习框架由两个部分组成:当前事件知识学习和过去事件知识重放。首先,进行当前事件知识学习,学习当前输入数据中新出现事件的分类。其次,设计了具有知识自蒸馏功能的过去事件知识重放,以巩固所学到的过去事件知识,防止灾难性遗忘。在真实世界的社会事件数据集上进行的综合实验表明,与先进的方法相比,为C-SEC而提出的CEKNet更具优势。 展开更多
关键词 社会事件分类 类递增持续学习 持续事件知识
在线阅读 下载PDF
基于深度学习的群组推荐方法研究综述 被引量:1
5
作者 郑楠 章颂 +2 位作者 刘玉桥 王雨桐 王飞跃 《自动化学报》 EI CAS CSCD 北大核心 2024年第12期2301-2324,共24页
群组推荐在信息检索与数据挖掘领域近年来备受关注,其旨在从海量候选集中挑选出一组用户可能感兴趣的项目.随着深度学习技术的不断发展,基于深度学习的群组推荐方法大量涌现.鉴于此,首先介绍群组推荐问题的背景知识,然后系统综述数据获... 群组推荐在信息检索与数据挖掘领域近年来备受关注,其旨在从海量候选集中挑选出一组用户可能感兴趣的项目.随着深度学习技术的不断发展,基于深度学习的群组推荐方法大量涌现.鉴于此,首先介绍群组推荐问题的背景知识,然后系统综述数据获取方法,全面评述近年来基于深度学习的群组推荐算法,并进行系统分类与深入分析.此外,还归纳了适用于深度学习方法的群组推荐数据集和评价方法,对各类推荐算法进行对比实验分析与讨论.最后,针对本领域的研究难点进行深入探讨,并提出未来有待深入研究的方向. 展开更多
关键词 群组推荐 推荐系统综述 深度学习 群组表示学习
在线阅读 下载PDF
针对身份证文本识别的黑盒攻击算法研究 被引量:1
6
作者 徐昌凯 冯卫栋 +3 位作者 张淳杰 郑晓龙 张辉 王飞跃 《自动化学报》 EI CAS CSCD 北大核心 2024年第1期103-120,共18页
身份证认证场景多采用文本识别模型对身份证图片的字段进行提取、识别和身份认证,存在很大的隐私泄露隐患.并且,当前基于文本识别模型的对抗攻击算法大多只考虑简单背景的数据(如印刷体)和白盒条件,很难在物理世界达到理想的攻击效果,... 身份证认证场景多采用文本识别模型对身份证图片的字段进行提取、识别和身份认证,存在很大的隐私泄露隐患.并且,当前基于文本识别模型的对抗攻击算法大多只考虑简单背景的数据(如印刷体)和白盒条件,很难在物理世界达到理想的攻击效果,不适用于复杂背景、数据及黑盒条件.为缓解上述问题,本文提出针对身份证文本识别模型的黑盒攻击算法,考虑较为复杂的图像背景、更严苛的黑盒条件以及物理世界的攻击效果.本算法在基于迁移的黑盒攻击算法的基础上引入二值化掩码和空间变换,在保证攻击成功率的前提下提升了对抗样本的视觉效果和物理世界中的鲁棒性.通过探索不同范数限制下基于迁移的黑盒攻击算法的性能上限和关键超参数的影响,本算法在百度身份证识别模型上实现了100%的攻击成功率.身份证数据集后续将开源. 展开更多
关键词 对抗样本 黑盒攻击 身份证文本识别 物理世界 二值化掩码
在线阅读 下载PDF
基于超分辨成像增强对拟南芥内质网动态变化的研究
7
作者 张以恒 刘家正 +6 位作者 王雪晨 孙政哲 薛雅郡 汪沛 韩华 郑宏伟 李晓娟 《生物技术通报》 CAS CSCD 北大核心 2024年第4期67-76,共10页
【目的】为了解决在植物细胞内质网的研究中,成像速度与成像分辨率难以同时满足准确识别精细结构和动态变化的瓶颈问题。【方法】使用结构光照明显微成像技术,对拟南芥活体材料中的内质网进行超分辨实时成像,并优化了自监督去噪框架(Bli... 【目的】为了解决在植物细胞内质网的研究中,成像速度与成像分辨率难以同时满足准确识别精细结构和动态变化的瓶颈问题。【方法】使用结构光照明显微成像技术,对拟南芥活体材料中的内质网进行超分辨实时成像,并优化了自监督去噪框架(Blind2Unblind),以进一步提升快速显微成像的信噪比。【结果】建立了对时间序列成像中内质网结构进行定量分析的方法,并通过对环境胁迫下内质网结构动态变化的追踪进一步验证了方法的有效性。此外,各类参数的相关性分析显示管状内质网的面积和长度与生长端和三叉点的数量显著正相关,而内质网池和整体流的面积与管的面积和长度显著负相关。【结论】优化的自监督去噪框架提升了植物活细胞中结构光照明显微图像的信噪比,实现了管状内质网、内质网池、整体流、生长端和节点等复杂结构和动态的量化,各结构间存在复杂相关性。 展开更多
关键词 拟南芥 内质网 动态 超分辨率成像 成像增强 量化分析
在线阅读 下载PDF
基于多模态双协同Gather Transformer网络的虚假信息检测方法
8
作者 向旺 王金光 +1 位作者 王一飞 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第12期242-249,共8页
社交媒体网站是人们在日常生活中分享信息、表达和交换意见的便捷平台。随着用户数量的不断增加,社交媒体网站上出现了大量的信息数据。然而,由于用户没有检查共享信息的可靠性,这些信息的真实性难以保证,从而导致大量虚假信息在社交媒... 社交媒体网站是人们在日常生活中分享信息、表达和交换意见的便捷平台。随着用户数量的不断增加,社交媒体网站上出现了大量的信息数据。然而,由于用户没有检查共享信息的可靠性,这些信息的真实性难以保证,从而导致大量虚假信息在社交媒体上广泛传播。然而,现有方法大多存在以下局限性:1)大多数方法通过简单提取文本与视觉特征,将其拼接后得到多模态特征来进行虚假信息判断,忽略了模态间和模态内细粒度内在联系,缺乏对关键信息的检索和筛选;2)多模态信息间缺乏指导性的特征提取,文本和视觉等特征之间缺乏交互增强,对多模态信息的理解不足。为了应对这些挑战,提出了一种新颖的基于多模态双协同Gather Transformer网络(Multimodal Dual-Collaborative Gather Transformer Network,MDCGTN)的虚假信息检测方法。在MDCGTN模型中,通过文本-视觉编码网络对文本和视觉信息的特征表示进行提取,将获得的视觉和文本特征表示输入多模态Gather Transformer网络进行多模态信息融合,使用Gather机制提取关键信息,充分捕捉和融合模态内和模态间细粒度关系。此外,设计了一个双协同机制对社交媒体帖子的多模态信息进行整合,以实现模态之间信息的交互和增强。在两个公开可用的基准数据集上进行了大量实验,结果表明,与现有的先进基准方法相比,所提方法准确率明显提升,证明了其对于虚假信息检测的优越性能。 展开更多
关键词 多模态 虚假信息检测 社交媒体 Gather Transformer网络
在线阅读 下载PDF
从RAG到SAGE:现状与展望 被引量:1
9
作者 田永林 王雨桐 +9 位作者 王兴霞 杨静 沈甜雨 王建功 范丽丽 郭超 王寿文 赵勇 武万森 王飞跃 《自动化学报》 北大核心 2025年第6期1145-1169,共25页
大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,... 大模型技术的兴起显著提升了人们获取和利用知识的效率,但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等挑战,阻碍了可信可靠人工智能系统的构建.检索增强生成(RAG)通过利用外接知识库和查询关联的检索有效增强大模型的能力水平,为大模型掌握实时型、行业型及私有型知识提供有力支撑,进而促进大模型技术向多样场景的快速推广和实施.围绕RAG,阐述其基本原理、发展现状及典型应用,并分析其优势和面临的挑战.在RAG的基础上,通过结合搜索模块和多级缓存管理模块,提出RAG的拓展框架SAGE,以建立更加灵活和高效的大模型知识外挂工具链. 展开更多
关键词 大模型 检索增强生成 基础智能 知识自动化
在线阅读 下载PDF
基于Transformer的状态−动作−奖赏预测表征学习 被引量:1
10
作者 刘民颂 朱圆恒 赵冬斌 《自动化学报》 北大核心 2025年第1期117-132,共16页
为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率,提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework,TSAR).具体来说,TSA... 为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率,提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework,TSAR).具体来说,TSAR提出一种基于Transformer的融合状态−动作−奖赏信息的序列预测任务.该预测任务采用随机掩码技术对序列数据进行预处理,通过最大化掩码序列的预测状态特征与实际目标状态特征间的互信息,同时学习状态与动作表征.为进一步强化状态和动作表征与强化学习(Reinforcement learning,RL)策略的相关性,TSAR引入动作预测学习和奖赏预测学习作为附加的学习约束以指导状态和动作表征学习.TSAR同时将状态表征和动作表征显式地纳入到强化学习策略的优化中,显著提高了表征对策略学习的促进作用.实验结果表明,在DMControl的9个具有挑战性的困难环境中,TSAR的性能和样本效率超越了现有最先进的方法. 展开更多
关键词 深度强化学习 表征学习 自监督对比学习 TRANSFORMER
在线阅读 下载PDF
基于高效特征提取和大感受野的无人机航拍图像目标检测
11
作者 沈朕宇 朱凤华 +2 位作者 王知学 沈震 熊刚 《智能系统学报》 北大核心 2025年第4期813-821,共9页
针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融... 针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融合新的构建模块以提升特征提取效率;引入内容感知特征重组模块和大型选择性核网络,增强颈部网络对遮挡目标的上下文感知能力;采用Wise-IoU损失函数优化边界框回归稳定性。在VisDrone2019数据集上的实验结果表明,EFLF-Net较基准模型在平均精度上提高了5.2%。与已有代表性的目标检测算法相比,该方法对存在小目标、目标相互遮挡和复杂背景的无人机航拍图像有更好的检测效果。 展开更多
关键词 无人机航拍图像 小目标检测 特征提取 多尺度变化 YOLOv8 上下文信息 感受野 损失函数
在线阅读 下载PDF
用于激光雷达目标检测的单阶段无锚框优化网络
12
作者 朱望江 郭建伟 +2 位作者 张吉光 孟维亮 张晓鹏 《计算机辅助设计与图形学学报》 北大核心 2025年第3期457-464,共8页
激光雷达目标检测近年来开始借鉴图像目标检测的网络设计,但依然存在计算低效无法满足实时应用以及网络结构简单导致性能不足的问题.为此,提出的网络采用了单阶段无锚框的简洁设计;优化了激光点云体素化表达,在提升计算效率的同时保留... 激光雷达目标检测近年来开始借鉴图像目标检测的网络设计,但依然存在计算低效无法满足实时应用以及网络结构简单导致性能不足的问题.为此,提出的网络采用了单阶段无锚框的简洁设计;优化了激光点云体素化表达,在提升计算效率的同时保留了一部分点云高程特征;基于残差网络的思想,设计了更深的主干网络结构用于提取深度特征;引入特征金字塔来提升小目标的检测效果.在公开数据集KITTI上,所提网络的mAP指标在各类别目标的检测中均取得了领先的性能(提高了1%~3%).在自动驾驶计算平台上的运行时间测试表明,所提网络能够达到43 ms/帧的处理速度,满足实时性需求. 展开更多
关键词 目标检测 激光雷达 自动驾驶 单阶段
在线阅读 下载PDF
结合多尺度大核卷积的红外图像人体检测算法
13
作者 邵煜潇 鲁涛 +2 位作者 王震宇 彭勇杰 姚巍 《智能系统学报》 北大核心 2025年第4期787-799,共13页
针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(... 针对废墟环境下红外图像人体检测任务中存在的图像分辨率低且人体特征不明显的问题,基于YOLO框架设计了一种包含重参数化(re-parameterization)和多尺度大核卷积(multi-scale large kernel convolution)的红外图像人体检测网络RML-YOLO(re-parameterization multi-scale large kernel convolution)。该网络通过空间和通道重构注意力模块,将注意值集中到对检测任务更重要的区域。通过Sobel算子强化边缘特征,提高对不同姿态人体的检测能力。RML-YOLO的有效性在自制数据集上得到验证。在只有1.8×10~6可学习参数的情况下,模型的AP50和AP50-75分别达到了91.2%和87.3%,与参数量相近的YOLOv8-n相比分别提高了4.4%和5.3%。结果表明,RML-YOLO显著提高了利用红外图像进行废墟环境下人体检测的精度。 展开更多
关键词 红外图像 目标检测 重构注意力 多尺度特征 大核卷积 卷积神经网络 特征提取 重参数化
在线阅读 下载PDF
类别增量学习研究进展和性能评价 被引量:15
14
作者 朱飞 张煦尧 刘成林 《自动化学报》 EI CAS CSCD 北大核心 2023年第3期635-660,共26页
机器学习技术成功地应用于计算机视觉、自然语言处理和语音识别等众多领域.然而,现有的大多数机器学习模型在部署后类别和参数是固定的,只能泛化到训练集中出现的类别,无法增量式地学习新类别.在实际应用中,新的类别或任务会源源不断地... 机器学习技术成功地应用于计算机视觉、自然语言处理和语音识别等众多领域.然而,现有的大多数机器学习模型在部署后类别和参数是固定的,只能泛化到训练集中出现的类别,无法增量式地学习新类别.在实际应用中,新的类别或任务会源源不断地出现,这要求模型能够像人类一样在较好地保持已有类别知识的基础上持续地学习新类别知识.近年来新兴的类别增量学习研究方向,旨在使得模型能够在开放、动态的环境中持续学习新类别的同时保持对旧类别的判别能力(防止“灾难性遗忘”).本文对类别增量学习(Class-incremental learning,CIL)方法进行了详细综述.根据克服遗忘的技术思路,将现有方法分为基于参数正则化、基于知识蒸馏、基于数据回放、基于特征回放和基于网络结构的五类方法,对每类方法的优缺点进行了总结.此外,本文在常用数据集上对代表性方法进行了实验评估,并通过实验结果对现有算法的性能进行了比较分析.最后,对类别增量学习的研究趋势进行展望. 展开更多
关键词 增量学习 持续学习 灾难性遗忘 机器学习 深度学习
在线阅读 下载PDF
基于双路单目视觉的多轴孔机器人快速精密装配
15
作者 李福东 蒋彬 +3 位作者 杨月全 陈欣钰 曹志强 蒋远雷 《控制工程》 北大核心 2025年第6期969-976,1007,共9页
针对直插件多轴孔并行装配时引脚一致性差,装配成功率低的问题,设计开发了一种结合稳定精确轴孔视觉定位算法和高效机器人视觉引导插装技术的直插式元件多轴孔精密装配系统。首先,离线标定轴心与孔心定位相机,并确定其与机器人之间的位... 针对直插件多轴孔并行装配时引脚一致性差,装配成功率低的问题,设计开发了一种结合稳定精确轴孔视觉定位算法和高效机器人视觉引导插装技术的直插式元件多轴孔精密装配系统。首先,离线标定轴心与孔心定位相机,并确定其与机器人之间的位姿关系;其次,结合CAD模型采用基于约束的随机抽样一致(random sample consensus, RANSAC)椭圆拟合算法精确定位轴孔中心;然后,开发了以多轴孔中心为定位锚点,以多轴孔平均角度偏差为旋转依据的插装引导算法,通过预测多轴孔装配间隙指导调配,提高插装成功率。最后,以图像差分算法检测装配结果,把控装配质量。实验数据表明,系统具备定位装配精度高、速度快、装配成功率高的优点,可实现单元件总体检测时间小于100 ms,单轴最终装配误差小于±0.3 mm,装配成功率大于98%的目标。 展开更多
关键词 机器人 精密装配 视觉定位 单目视觉
在线阅读 下载PDF
梯度引导的JPEG压缩图像超分辨率重建
16
作者 曹坪 林树冉 +2 位作者 张淳杰 郑晓龙 赵耀 《自动化学报》 北大核心 2025年第6期1261-1276,共16页
在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPE... 在真实场景中,图像往往同时遭受低分辨率、压缩失真及噪声等多种退化因素影响.现有方法通常聚焦于单一退化类型,难以应对复杂的复合退化情况.为解决真实场景中普遍存在的低分辨率与JPEG压缩伪影复合退化问题,提出一种梯度引导的联合JPEG压缩伪影去除和超分辨率重建网络.该网络以超分辨率分支为主导,融合JPEG压缩伪影去除分支与梯度引导分支的非对称特征,实现了高质量图像重建.JPEG压缩伪影去除分支专注于压缩伪影抑制,缓解了主导分支的重建负担.梯度引导分支则精准估计图像梯度,引导主导分支恢复更多细节与纹理.实验结果表明,该方法提升了低分辨率JPEG压缩图像的重建质量. 展开更多
关键词 JPEG压缩 超分辨率 图像重建 梯度先验
在线阅读 下载PDF
新颖的曲面手掌视触觉传感器
17
作者 胡静怡 崔少伟 +1 位作者 张少林 王硕 《浙江大学学报(工学版)》 北大核心 2025年第6期1103-1109,1129,共8页
大多数现有的机器人视触觉传感器由于采用平面式感知结构,在复杂三维环境和精细操作任务中面临接触信息缺失、深度感知不足的局限性.为此,提出曲面手掌视触觉传感器,其创新性曲面结构设计将有效感知区域扩展至三维空间,显著地提升触觉... 大多数现有的机器人视触觉传感器由于采用平面式感知结构,在复杂三维环境和精细操作任务中面临接触信息缺失、深度感知不足的局限性.为此,提出曲面手掌视触觉传感器,其创新性曲面结构设计将有效感知区域扩展至三维空间,显著地提升触觉感知深度和接触信息完整性.建立基于双目立体视觉折射光线追踪模型的点云重建框架,用于生成高精度的三维触觉点云数据.为了提高数据处理效率和准确性,提出高效的点云显著性检测算法,以实现关键接触区域的智能识别与实时点云提取.实验结果表明,所提传感器的结构设计和点云重建框架具有良好的鲁棒性,三维触觉点云感知精度达到0.20 mm,点云重建帧率达到30帧/s,最大按压深度为10 mm.该传感器能够精准实时地提取显著接触点云,为机器人在复杂环境中的精细操作提供了有力支持. 展开更多
关键词 机器人触觉感知 触觉传感器 视触觉传感器 三维触觉点云 点云显著性检测
在线阅读 下载PDF
两团队零和博弈下熵引导的极小极大值分解强化学习方法
18
作者 胡光政 朱圆恒 赵冬斌 《自动化学报》 北大核心 2025年第4期875-889,共15页
在两团队零和马尔科夫博弈中,一组玩家通过合作与另一组玩家进行对抗.由于对手行为的不确定性和复杂的团队内部合作关系,在高采样成本的任务中快速识别优势的分布式策略仍然具有挑战性.鉴于此,提出一种熵引导的极小极大值分解(Entropy-g... 在两团队零和马尔科夫博弈中,一组玩家通过合作与另一组玩家进行对抗.由于对手行为的不确定性和复杂的团队内部合作关系,在高采样成本的任务中快速识别优势的分布式策略仍然具有挑战性.鉴于此,提出一种熵引导的极小极大值分解(Entropy-guided minimax factorization,EGMF)强化学习方法,在线学习队内合作和队间对抗的策略.首先,提出基于极小极大值分解的多智能体执行器−评估器框架,在高采样成本的、不限动作空间的任务中,提升优化效率和博弈性能;其次,引入最大熵使智能体可以更充分地探索状态空间,避免在线学习过程收敛到局部最优;此外,策略在时间域累加的熵值用于评估策略的熵,并将其与分解的个体独立Q函数结合用于策略改进;最后,在多种博弈仿真场景和一个实体机器人任务平台上进行方法验证,并与其他基线方法进行比较.结果显示EGMF可以在更少样本下学到更具有对抗性能的两团队博弈策略. 展开更多
关键词 多智能体深度强化学习 两团队零和马尔科夫博弈 最大熵 值分解
在线阅读 下载PDF
面向半监督归纳式学习的自训练增强图模型
19
作者 杨瀚轩 余昭昕 +2 位作者 李子乾 徐会芳 孔庆超 《计算机学报》 北大核心 2025年第10期2263-2277,共15页
图表示学习是图数据分析的一个基础研究问题,在多种应用领域中均具有重要的研究价值。不同于一般的直推式学习,归纳式图表示学习要求对训练过程中不可见的未知节点进行推理和分类,因此具有更大的研究挑战。现有归纳式学习方法主要采用... 图表示学习是图数据分析的一个基础研究问题,在多种应用领域中均具有重要的研究价值。不同于一般的直推式学习,归纳式图表示学习要求对训练过程中不可见的未知节点进行推理和分类,因此具有更大的研究挑战。现有归纳式学习方法主要采用建立在全监督学习下的图神经网络,这些方法依赖于大量带标注的数据进行训练,因而在面对可见结构中节点标注稀缺的半监督归纳式学习问题时可能存在模型过拟合问题。本文首次提出半监督归纳式图表示学习问题,并建立了一种自训练增强的归纳式图(Self-Training Augmented Inductive Graph,STAIG)模型,该模型由一个使用图神经网络学习节点向量表示的编码器和一个通过重构节点标签和属性特征训练模型的解码器组成。针对半监督归纳式图学习问题,所提出的模型采用自训练增强方法,并在编码器中提出一种基于随机游走的节点掩码方法提高预测未知节点的泛化性。在此基础上,为了进一步应对标注稀缺问题,该模型使用解码器生成节点伪标签来增强标注信息,并通过置信度过滤机制提高伪标签的可靠性。基于基准归纳式学习图数据集的实验验证了本文提出的STAIG模型在半监督节点分类任务上取得了优于对比方法的结果,且在标注数据比例低于10%的弱监督学习设置下具有显著优势。 展开更多
关键词 归纳式图表示学习 半监督节点分类 变分图自编码 自训练增强
在线阅读 下载PDF
基于对手池的两人格斗游戏深度强化学习
20
作者 梁荣钦 朱圆恒 赵冬斌 《控制理论与应用》 北大核心 2025年第2期226-234,共9页
双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,... 双人游戏在游戏人工智能领域是一个基本且重要的问题,其中一对一零和格斗游戏是最为典型的双人游戏之一.本文基于深度强化学习对格斗游戏博弈对抗策略进行研究.首先建模格斗游戏环境,设计可用于格斗游戏决策的状态、动作以及奖赏函数,并将阶段策略梯度算法应用于对抗策略的学习.为了尽可能学到纳什均衡策略实现战胜任意对手的目标,本文设计了基于历年参赛的智能体构造对手池用于智能体训练,并探索对手选择机制对于训练过程的影响.最后在固定对手池的基础上,设计了自增长对手池算法,以提升对手策略的完备性和训练智能体的鲁棒性.为了提高环境采样速度,本文从传统并行框架出发,设计了可用于双人游戏的多服务器分布式并行采样框架.通过实验对比发现,基于自增长对手池方法所学的智能体能以96.6%的胜率击败固定对手池中的智能体,并且在与3个仅用于测试的智能体对战时,也表现出了72.2%的胜率. 展开更多
关键词 实时格斗游戏 深度强化学习 两人零和博弈 对手策略池
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部