期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
隐式情绪导向的语音驱动仿生机器人说话方法
1
作者 徐康 袁野 +3 位作者 付军秀 傅柯婷 任钦泽 刘娜 《计算机应用研究》 北大核心 2025年第8期2297-2303,共7页
提出了一种创新的隐式情绪导向语音驱动方法,用于仿生机器人的面部表情与头部姿态生成。该方法基于深度学习,通过引入颈部舵机控制系数,突破了传统方法仅依赖预编程随机动作序列的局限,实现了音频信号到自然表情的精确映射。此外,提出... 提出了一种创新的隐式情绪导向语音驱动方法,用于仿生机器人的面部表情与头部姿态生成。该方法基于深度学习,通过引入颈部舵机控制系数,突破了传统方法仅依赖预编程随机动作序列的局限,实现了音频信号到自然表情的精确映射。此外,提出了一种隐式情绪导向特征融合自编码器框架,无须显式输入情绪参数,即可从音频中隐含地推断情绪特征,并生成丰富的面部表情和颈部运动。实验表明,该方法在多个数据集上显著优于现有技术,并且通过轻量化设计,能够高效适应资源有限的移动设备。 展开更多
关键词 仿生机器人 音频驱动 情绪导向 卷积长短时记忆网络
在线阅读 下载PDF
SignBot:一种基于轻量深度神经网络的人形手语机器人
2
作者 李新潮 袁野 刘娜 《小型微型计算机系统》 北大核心 2025年第9期2193-2200,共8页
人形机器人凭借高度逼真的人类外观与灵活稳定的运动能力,能够深度参与到人类社会活动场景;人机交互是人形机器人进入现实世界,成为人们生活、学习和工作中的伴侣的必要能力.然而,现有机器人交互技术主要面向正常人群,缺乏适用于听力或... 人形机器人凭借高度逼真的人类外观与灵活稳定的运动能力,能够深度参与到人类社会活动场景;人机交互是人形机器人进入现实世界,成为人们生活、学习和工作中的伴侣的必要能力.然而,现有机器人交互技术主要面向正常人群,缺乏适用于听力或者语言障碍人士的人机交互方案.为此,设计了一种轻量级的手语识别深度网络(SignNet),该模型能够快速集成到机器人硬件平台,使其具备手语识别能力.此外,本文将手语识别模型与现有表情控制算法、语音合成算法联合,使机器人能够识别手语,并通过表情和语音反馈进行交互.实验结果表明,SignNet在多个手语数据集(WLASL、CSL、SLR500)上识别准确率最高达到98.2%,进一步测试显示,该机器人能精准识别手语并提供适当反馈,为听力或语言障碍人士提供了有效的人机交互途径. 展开更多
关键词 人形机器人 人机交互 轻量级网络 手语识别
在线阅读 下载PDF
伸缩腿双足机器人强化学习步态生成方法
3
作者 崔文杰 唐俊 +1 位作者 侯运锋 李清都 《控制工程》 北大核心 2025年第2期280-289,共10页
近年来,相关研究已经证明能够通过强化学习生成稳健的双足机器人行走步态。然而,传统机器人的结构能效较低。针对这一问题,基于一种能效更高的伸缩腿结构的机器人,提出一种运用周期函数来交替奖励与惩罚双足触地的方法,来改进传统训练... 近年来,相关研究已经证明能够通过强化学习生成稳健的双足机器人行走步态。然而,传统机器人的结构能效较低。针对这一问题,基于一种能效更高的伸缩腿结构的机器人,提出一种运用周期函数来交替奖励与惩罚双足触地的方法,来改进传统训练学习方法生成步态不规律的现象,鼓励智能体生成对称步态。实验证明,通过简单运用周期函数设计稠密奖励函数,可以有效指导伸缩腿机器人生成高效的运动模式,能够有效提高机器人的能效,且具有较高的鲁棒性。 展开更多
关键词 强化学习 伸缩腿 双足机器人 步态生成
在线阅读 下载PDF
基于力控的紧凑型夹爪设计与控制研究
4
作者 赵广凯 杨芳艳 +2 位作者 李清都 胡华英 李扬 《农业装备与车辆工程》 2025年第3期92-98,共7页
设计了一种基于力控反馈的紧凑型机器人夹爪,该夹爪采用直流无刷电机、滚珠丝杠与连杆配合的结构。与传统的夹爪结构相比,减少了夹爪本身传动结构体积和质量,适用于人形机器人操作空间受限的应用场景。夹爪的力控系统采用电机磁场矢量控... 设计了一种基于力控反馈的紧凑型机器人夹爪,该夹爪采用直流无刷电机、滚珠丝杠与连杆配合的结构。与传统的夹爪结构相比,减少了夹爪本身传动结构体积和质量,适用于人形机器人操作空间受限的应用场景。夹爪的力控系统采用电机磁场矢量控制(FOC)的闭环控制方式,通过调整电机的定子电流来提供平滑的转矩输出,确保夹取过程中的精确性与动态响应性能。试验结果表明,所设计的力控夹爪比传统夹爪质量减轻55.7%~61.8%,力控最大可以提供30 N的夹持力,在抓取不同尺寸和材料的物体时,能够完成稳定的夹取任务。 展开更多
关键词 力控反馈 夹爪结构 磁场矢量控制
在线阅读 下载PDF
相邻无信号交叉口车辆协同调度方法研究
5
作者 潘志纯 侯运锋 李清都 《控制工程》 CSCD 北大核心 2024年第6期1018-1026,共9页
随着车辆拥堵现象日益严重,如何提高交叉口的通行效率已经得到学术界的广泛关注。为充分地利用交叉口有限的物理空间资源,提出了一种相邻无信号交叉口车辆协同调度方法。首先,将交叉口划分为互不相交的物理空间资源,进而把交叉口车辆通... 随着车辆拥堵现象日益严重,如何提高交叉口的通行效率已经得到学术界的广泛关注。为充分地利用交叉口有限的物理空间资源,提出了一种相邻无信号交叉口车辆协同调度方法。首先,将交叉口划分为互不相交的物理空间资源,进而把交叉口车辆通行控制问题转化成资源调度问题。然后,基于Petri网构建了一个交叉口资源调度模型。为了避免车辆相撞,模型要求同一物理空间资源在同一时刻只能被一辆车占用。实验结果表明:到达率较低时,与采用传统信号灯的控制方式相比,无信号控制方式能有效提高通行效率;到达率较高时,交叉口发生拥堵。但与无协同的控制模式相比,相邻交叉口协同控制模式可以更好地缓解拥堵现象。 展开更多
关键词 无信号交叉口 PETRI网 智能交通 车辆调度
在线阅读 下载PDF
电子皮肤在中医临床诊疗中的应用及发展分析
6
作者 王正 米金鹏 陈国栋 《电子与信息学报》 北大核心 2025年第8期2486-2498,共13页
随着柔性电子技术与智能传感技术的突破,电子皮肤为中医诊疗客观化、精准化提供了创新解决方案。该文系统综述了中医诊疗对柔性电子皮肤的技术需求,从材料创新、多模态感知融合及自供电技术突破等维度,剖析柔性电子皮肤在中医诊疗中的... 随着柔性电子技术与智能传感技术的突破,电子皮肤为中医诊疗客观化、精准化提供了创新解决方案。该文系统综述了中医诊疗对柔性电子皮肤的技术需求,从材料创新、多模态感知融合及自供电技术突破等维度,剖析柔性电子皮肤在中医诊疗中的技术演进路径与前沿发展趋势;最终,通过电子皮肤在中医诊疗中疾病诊断的可行性评估与技术挑战分析,提出适配中医诊疗场景的柔性电子皮肤技术路线,为构建数据驱动的新型中医诊疗范式提供理论依据与创新策略。电子皮肤为中医临床智能化诊疗提供了创新思路。电子皮肤在中医领域的应用极具挑战性,未来需突破材料、多模态数据融合与中医知识图谱等方面多重壁垒,构建中医现代化发展创新思路。 展开更多
关键词 中医诊疗 电子皮肤 多模态感知融合 智能化 数字化
在线阅读 下载PDF
乒乓球机器人视觉系统的实时跟踪 被引量:16
7
作者 季云峰 任杰 施之皓 《上海体育学院学报》 CSSCI 北大核心 2020年第6期70-75,共6页
针对乒乓球机器人视觉系统中的实时跟踪问题,分别在高速和低速2种摄影条件下设计完全不同的算法对乒乓球进行跟踪识别研究。在高速摄影条件下主要利用乒乓球的5大特征信息(圆度、周长、面积、X距和Y距)设置阈值进行识别;在低速摄影条件... 针对乒乓球机器人视觉系统中的实时跟踪问题,分别在高速和低速2种摄影条件下设计完全不同的算法对乒乓球进行跟踪识别研究。在高速摄影条件下主要利用乒乓球的5大特征信息(圆度、周长、面积、X距和Y距)设置阈值进行识别;在低速摄影条件下将机器学习和图像匹配的方法进行代入,实现对带拖影乒乓球的识别。采用基于注意力的图像分割算法对图片进行预处理,可有效解决因环境干扰等造成的像素失真问题。提出规划感兴趣区(ROI)的算法,利用乒乓球的运动特征提前确定下一帧图像中乒乓球的可能位置,从而降低计算量,缩短计算时间,实现跟踪的实时性。 展开更多
关键词 乒乓球机器人 视觉系统 实时跟踪 注意力 图像分割 机器学习
在线阅读 下载PDF
自适应学习图结构的多模态会话情感识别算法
8
作者 董嘉巍 刘娜 +4 位作者 袁野 李磊 胡云鑫 任钦泽 李清都 《小型微型计算机系统》 北大核心 2025年第8期1886-1892,共7页
会话是一种时序性与内部关联性极强的数据类型,不合理的建模方式往往会对会话情感识别任务的效果产生负面影响.由于会话具有天然的图结构,将会话建模为图,并使用图卷积神经网络(GCN)来提取会话信息是一种常用方法,但是天然获得的图结构... 会话是一种时序性与内部关联性极强的数据类型,不合理的建模方式往往会对会话情感识别任务的效果产生负面影响.由于会话具有天然的图结构,将会话建模为图,并使用图卷积神经网络(GCN)来提取会话信息是一种常用方法,但是天然获得的图结构往往存在大量噪声或者有缺失连接的情况,这会损害GCN的学习性能,仅使用GCN也很难处理内部关系丰富的会话信息.针对这些问题,本文提出一种自适应学习图结构学习的多模态情感识别方法.该方法使用添加了邻近稀疏自注意力机制的Transformer编码器结构作为上下文信息提取器,将简单级联的会话音频特征、文本特征、视觉特征作为输入.利用多层感知机设计了一种图结构生成器以生成良好的图结构,同时引入一种自监督去噪任务作为先验信息指导图结构生成器更新参数.其次利用关系图卷积网络和图Transformer作为局部信息提取器,有效地捕捉了会话中存在的复杂依赖关系.在数据集IEMOCAP(4-way/6-way)和MOSEI上与其他基线算法进行了对比实验,实验结果表明该方法在加权F1系数和准确率上都要优于其他基线算法. 展开更多
关键词 多模态 会话情感识别 图结构学习 图神经网络 自注意力机制
在线阅读 下载PDF
永磁同步电机全局积分终端滑模矢量控制
9
作者 李扬 杨芳艳 +1 位作者 李清都 赵广凯 《电力系统及其自动化学报》 北大核心 2025年第4期21-29,共9页
为提高永磁同步电机的速度控制性能,提出一种基于高阶对数滑模扰动观测器的全局积分终端滑模矢量控制策略。首先,设计趋近速度可随状态变量自适应调节的趋近律,并把符号函数替换为可在零点实现平滑过渡的非线性函数;同时,将全局滑模因... 为提高永磁同步电机的速度控制性能,提出一种基于高阶对数滑模扰动观测器的全局积分终端滑模矢量控制策略。首先,设计趋近速度可随状态变量自适应调节的趋近律,并把符号函数替换为可在零点实现平滑过渡的非线性函数;同时,将全局滑模因子项引入改进积分终端滑模面中,构造全局积分终端滑模速度控制器,使控制系统具有全局鲁棒性;然后,将可实现有限时间收敛的对数滑模面与高阶控制律相结合,设计高阶对数滑模扰动观测器,把观测出的系统扰动作为已知量对前端控制器进行补偿,提高控制精度。仿真结果表明该策略能够显著减小转速波动并提高系统稳定性。 展开更多
关键词 永磁同步电机 趋近律 非线性函数 全局积分终端滑模 高阶对数滑模扰动观测器
在线阅读 下载PDF
基于特性分流的多模态对话情绪感知算法
10
作者 任钦泽 袁野 +3 位作者 傅柯婷 付军秀 徐康 刘娜 《计算机应用研究》 北大核心 2025年第6期1641-1647,共7页
在主动健康领域,多模态情绪感知技术对于监测个人健康和提供医疗陪护具有重要意义。然而,当前多模态对话情绪感知技术在融合不同模态信息时面临挑战,尤其是在捕捉模态间的局部关系方面。为此,提出了一种基于特性分流的多模态融合算法ME... 在主动健康领域,多模态情绪感知技术对于监测个人健康和提供医疗陪护具有重要意义。然而,当前多模态对话情绪感知技术在融合不同模态信息时面临挑战,尤其是在捕捉模态间的局部关系方面。为此,提出了一种基于特性分流的多模态融合算法MEPAD。该算法利用图神经网络捕捉对话的全局信息,并引入超复数数系和成对特征融合机制,分别提取多模态数据的同质性与特异性特征。实验结果表明,MEPAD在IEMOCAP和MOSEI数据集上的多模态对话情绪感知任务中显著优于现有方法,证明了其在处理复杂情感数据方面的有效性和潜力。该研究为多模态情绪感知技术在主动健康领域的应用提供了新的思路。 展开更多
关键词 多模态情绪感知 图神经网络 超复数数系 成对特征融合 对话情绪感知
在线阅读 下载PDF
乒乓球精确旋转、速度及落点数据的人工神经网络模型研究 被引量:7
11
作者 季云峰 黄睿 +1 位作者 施之皓 任杰 《上海体育学院学报》 CSSCI 北大核心 2018年第6期98-103,共6页
旋转是乒乓球最核心的致胜因素,研究乒乓球的运动轨迹一定应考虑旋转因素。基于此,设计实验获得乒乓球精确的初始位置坐标、初始速度及方向、旋转速度及方向;将这9个初始数据作为神经网络的输入信息,将精确的落点坐标作为输出信息,利用... 旋转是乒乓球最核心的致胜因素,研究乒乓球的运动轨迹一定应考虑旋转因素。基于此,设计实验获得乒乓球精确的初始位置坐标、初始速度及方向、旋转速度及方向;将这9个初始数据作为神经网络的输入信息,将精确的落点坐标作为输出信息,利用人工神经网络算法探讨输入、输出信息间的相关性。实验结果显示:初始速度、旋转速度、初始位置坐标与球落点坐标之间存在相关性。 展开更多
关键词 乒乓球 旋转 速度 落点坐标 轨迹预测 神经网络
在线阅读 下载PDF
特种机器人关节模组设计及辐射防护 被引量:2
12
作者 苏康佳 杨芳艳 陈媛媛 《农业装备与车辆工程》 2023年第9期56-61,共6页
随着核工业的快速发展以及核安全要求的日益提高,特种机器人的需求也持续增大。关节模组作为特种机器人的动力来源,是其最核心的集成部件。设计了一种可应用于核环境下的特种机器人关节模组结构模型,针对核环境中的γ射线辐射问题,采用... 随着核工业的快速发展以及核安全要求的日益提高,特种机器人的需求也持续增大。关节模组作为特种机器人的动力来源,是其最核心的集成部件。设计了一种可应用于核环境下的特种机器人关节模组结构模型,针对核环境中的γ射线辐射问题,采用主动与被动的方式对关节模组进行辐照加固,筛选耐辐射电子器件设计驱动器,一体化紧密式排布安装驱动器与电机等部件,提高空间利用率和整体耐辐射性能。基于蒙特卡罗方法MCNP程序模拟研究了铅、钨等重金属及合金对γ射线的屏蔽性能,选出合适屏蔽材料对关节模组驱动器屏蔽加固。对关节模组进行辐射实验,结果表明,经辐射加固后的关节模组在承受600 Gy的辐射剂量后仍然能正常运行,提高了关节模组耐辐射能力,对研制核环境下特种机器人具有重要意义。 展开更多
关键词 特种机器人 关节模组 辐射防护 MNCP模拟 屏蔽体
在线阅读 下载PDF
输入幅值及其变化率受限下的机械臂预设性能控制
13
作者 王勇 王刚 王朝立 《小型微型计算机系统》 CSCD 北大核心 2024年第12期2923-2928,共6页
针对输入幅值以及输入变化率受限的机械臂轨迹跟踪控制问题,设计了一种新的鲁棒自适应预设性能控制方案.相关控制策略采用嵌套平滑饱和函数约束系统状态以确保闭环系统满足预设的瞬态和稳态性能指标,同时考虑系统控制信号的幅度及其变... 针对输入幅值以及输入变化率受限的机械臂轨迹跟踪控制问题,设计了一种新的鲁棒自适应预设性能控制方案.相关控制策略采用嵌套平滑饱和函数约束系统状态以确保闭环系统满足预设的瞬态和稳态性能指标,同时考虑系统控制信号的幅度及其变化率的限制,避免系统因控制信号发生突变对系统稳定性产生影响.此外,由于无需对不确定动力学进行估计或者补偿,所提出的控制算法复杂度低,增益选择简单,易于在机械臂系统中实现.最后,通过对机械臂模型进行仿真验证所提出方法的有效性和可行性. 展开更多
关键词 输入饱和 输入变化率受限 预设性能控制 自适应控制
在线阅读 下载PDF
基于改进双树RRT^(*)算法的冗余机械臂末端路径规划 被引量:2
14
作者 吴剑雄 毕卓然 +1 位作者 李宗道 李清都 《计算机应用研究》 CSCD 北大核心 2024年第2期459-465,共7页
针对冗余机械臂的冗余特性与相关RRT^(*)算法在规划机械臂末端路径的应用中存在的搜索效率较低、收敛性不稳定以及没有充分考虑到机械臂末端几何构型与自身运动特性对路径规划影响的问题,提出一种改进策略。首先,引入一种基于根尾节点... 针对冗余机械臂的冗余特性与相关RRT^(*)算法在规划机械臂末端路径的应用中存在的搜索效率较低、收敛性不稳定以及没有充分考虑到机械臂末端几何构型与自身运动特性对路径规划影响的问题,提出一种改进策略。首先,引入一种基于根尾节点连线夹角的采样点选择方式,并设置目标逼近区域。根据连续采样成功次数动态选择改进采样与随机采样。接着,将双树扩展策略与上述方法相结合。最后,将初始可行路径进行二次重连得到最终的优化路径。通过验证,改进双树RRT^(*)方法能够有效地提升搜索效率、收敛性以及路径的优越性。虚拟碰撞体与胶囊碰撞体的引入也能较好地应对机械臂末端结构与运动特性带来的影响。使用Mujoco物理仿真引擎进行机械臂运动验证,证明该策略可以为冗余机械臂末端规划出一条较优的可行路径。 展开更多
关键词 冗余机械臂 RRT^(*) 末端路径 根尾节点 目标逼近区域 双树扩展 虚拟碰撞体 胶囊碰撞体 Mujoco
在线阅读 下载PDF
基于自适应重加权和正则化的集成元学习算法 被引量:2
15
作者 王佳琦 袁野 +2 位作者 朱永同 李清都 刘娜 《计算机应用研究》 CSCD 北大核心 2024年第6期1749-1755,共7页
在训练集存在噪声标签或类别不平衡分布的情况下,深度神经网络具有过度拟合这种有偏差的训练数据的不良趋势。通过设计适当的样本权重,使用重加权策略是解决此问题的常用方法,但不适当的重加权方案会给网络学习引入额外的开销和偏差,仅... 在训练集存在噪声标签或类别不平衡分布的情况下,深度神经网络具有过度拟合这种有偏差的训练数据的不良趋势。通过设计适当的样本权重,使用重加权策略是解决此问题的常用方法,但不适当的重加权方案会给网络学习引入额外的开销和偏差,仅使用重加权方法很难解决有偏差分布下网络的过拟合问题。为此,建议将标签平滑正则化和类裕度正则化与重加权结合使用,并提出了一种基于自适应重加权和正则化的元学习方法(ensemble meta net,EMN),模型框架包括用于分类的基本网络和用于超参数估计的集成元网。该方法首先通过基本网络获得样本损失;然后使用三个元学习器基于损失值以集成的方式估计自适应重加权和正则化的超参数;最终利用三个超参数计算最终的集成元损失更新基本网络,进而提高基本网络在有偏分布数据集上的性能。实验结果表明,EMN在CIFAR和OCTMNIST数据集上的准确率高于其他方法,并通过策略关联性分析证明了不同策略的有效性。 展开更多
关键词 噪声标签 不平衡 元学习 重加权 正则化
在线阅读 下载PDF
基于改进天牛须算法的永磁电机过载转矩分析 被引量:2
16
作者 杨芳艳 刘广浩 李清都 《机床与液压》 北大核心 2024年第18期76-84,共9页
定子铁心饱和以及电枢反应等因素极大地影响永磁无刷直流电机(BLDC)的过载能力,无法满足足式机器人运动时的转矩需求。因此,设计一台具有高过载能力的减速电机。从电机关键结构参数出发,分析极槽配合、齿槽宽度以及磁钢厚度对BLDC过载... 定子铁心饱和以及电枢反应等因素极大地影响永磁无刷直流电机(BLDC)的过载能力,无法满足足式机器人运动时的转矩需求。因此,设计一台具有高过载能力的减速电机。从电机关键结构参数出发,分析极槽配合、齿槽宽度以及磁钢厚度对BLDC过载转矩的影响;进一步利用有限元及响应面法构建过载转矩和转矩波动的优化模型,并采用改进天牛须算法进行多目标优化设计;对比优化前、后电机的电磁性能和过载输出转矩,并分析行星减速器结构对电机影响。最后,根据电磁设计进行样机研制,并进行转矩转速试验。结果表明:优化后平均过载转矩从1.99 N·m增加到2.05 N·m,转矩脉动从6.78%降低到6.34%,减小了0.44%,电机过载输出性能更好,且样机实验与仿真结果相接近,验证了所提方法的合理性。 展开更多
关键词 行星减速器电机 多目标优化 天牛须算法 响应面法 过载能力
在线阅读 下载PDF
基于可学习图像滤波器的雾天驾驶场景图像语义分割 被引量:1
17
作者 徐欣 李若诗 +1 位作者 袁野 刘娜 《计算机工程与科学》 CSCD 北大核心 2024年第11期2027-2034,共8页
尽管基于深度学习的图像语义分割方法在传统的驾驶数据集上取得了很好的效果,但针对雾天条件下的低质量图像的语义分割仍然具有挑战性。针对此问题,提出了可学习图像滤波器LIF模块,旨在利用不同雾浓度下驾驶场景图像的内在特征,改进雾... 尽管基于深度学习的图像语义分割方法在传统的驾驶数据集上取得了很好的效果,但针对雾天条件下的低质量图像的语义分割仍然具有挑战性。针对此问题,提出了可学习图像滤波器LIF模块,旨在利用不同雾浓度下驾驶场景图像的内在特征,改进雾天驾驶条件下的图像语义分割。LIF模块由超参数预测模块HPM和图像滤波模块IFM组成,IFM中滤波器的超参数由HPM预测得到。以端到端的方式联合学习HPM和语义分割网络,确保了HPM可以学习适当的IFM参数,以弱监督的方式增强图像以进行分割。分别以DeepLabV3+、PSPNet和RefineNet作为基线模型,并在Cityscapes和Foggy Cityscapes的混合数据集上进行实验,基线模型加可学习的图像滤波器模块的MIoU分别为63.14%,60.45%和61.41%,相比基线模型的MIoU分别提升了3.03%,1.52%和1.69%,实验结果表明了该模型的有效性与通用性。 展开更多
关键词 雾天图像 图像语义分割 图像滤波器 卷积神经网络 图像处理
在线阅读 下载PDF
针对中文分词的带标签注意力的成词记忆网络 被引量:3
18
作者 韩士洋 马致远 +2 位作者 杨芳艳 李想 汪伟 《计算机应用研究》 CSCD 北大核心 2022年第6期1651-1655,共5页
成词信息是一种对中文分词任务十分重要的文本特征。最新中文分词模型之一的WMSEG就是通过引入成词信息来获得最顶尖的分词性能。然而这类模型在建模时并未考虑标签之间的依赖关系,导致其分词性能特别是对未登录词的识别有所欠缺。针对... 成词信息是一种对中文分词任务十分重要的文本特征。最新中文分词模型之一的WMSEG就是通过引入成词信息来获得最顶尖的分词性能。然而这类模型在建模时并未考虑标签之间的依赖关系,导致其分词性能特别是对未登录词的识别有所欠缺。针对这一问题,通过在学习过程中引入标签嵌入的注意力机制,提出了一种带标签注意力的成词记忆网络来增强标签之间的依赖关系以及标签和字符之间的相关性。实验结果表明,该模型在四个常用数据集上都取得了不弱于WMSEG的分词性能,同时提高了对未登录词的识别能力。 展开更多
关键词 成词信息 中文分词 标签嵌入 注意力机制 未登录词
在线阅读 下载PDF
弱监督与少样本学习场景下视频行为识别综述 被引量:4
19
作者 包震伟 刘丹 米金鹏 《计算机应用研究》 CSCD 北大核心 2023年第6期1629-1635,共7页
近年来各类人体行为识别算法利用大量标记数据进行训练,取得了良好的识别精度。但在实际应用中,数据的获取以及标注过程都是非常耗时耗力的,这限制了算法的实际落地。针对弱监督及少样本场景下的视频行为识别深度学习方法进行综述。首先... 近年来各类人体行为识别算法利用大量标记数据进行训练,取得了良好的识别精度。但在实际应用中,数据的获取以及标注过程都是非常耗时耗力的,这限制了算法的实际落地。针对弱监督及少样本场景下的视频行为识别深度学习方法进行综述。首先,在弱监督情况下,分类总结了半监督行为识别方法和无监督领域自适应下的视频行为识别方法;然后,对少样本场景下的视频行为识别算法进行详细综述;接着,总结了当前相关的人体行为识别数据集,并在该数据集上对各相关视频行为识别算法性能进行分析比较;最后,进行概括总结,并展望人体行为识别的未来发展方向。 展开更多
关键词 人体行为识别 深度学习 弱监督 少样本学习
在线阅读 下载PDF
结合新颖的互注意力和门控机制的图像标题生成
20
作者 胡卫兵 米金鹏 +2 位作者 吴旭明 刘丹 杨芳艳 《小型微型计算机系统》 CSCD 北大核心 2023年第8期1785-1791,共7页
图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句... 图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句子,而没有引入外部知识作为辅助信息.针对上述两点,提出一种互注意力和门控机制的方法.在MSCOCO2014数据集上和Flickr30k数据集上分别进行实验,结果在各项指标上相较于主流模型均有一定的提升,表明该方法对图像内容的理解更加全面且生成的句子更加丰富. 展开更多
关键词 图像标题生成 外部知识 互注意力 门控机制
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部