期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
潜在空间中的策略搜索强化学习方法 被引量:1
1
作者 赵婷婷 王莹 +3 位作者 孙威 陈亚瑞 王嫄 杨巨成 《计算机科学与探索》 CSCD 北大核心 2024年第4期1032-1046,共15页
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的... 策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的变化。为了解决上述问题,提出了一种基于潜在空间的策略搜索强化学习方法。将学习状态表示的思想拓展到动作表示上,即在动作表示的潜在空间中学习策略,再将动作表示映射到真实动作空间中。通过表示学习模型的引入,摒弃端到端的训练方式,将整个强化学习任务划分成大规模的表示模型部分和小规模的策略模型部分,使用无监督的学习方法来学习表示模型,使用策略搜索强化学习方法学习小规模的策略模型。大规模的表示模型能保留应有的泛化性和表达能力,小规模的策略模型有助于减轻策略学习的负担,从而在一定程度上缓解深度强化学习领域中样本利用率低、学习效率低和动作选择泛化性弱的问题。最后,在智能控制任务CarRacing和Cheetah中验证了引入潜在空间中的状态表示和动作表示的有效性。 展开更多
关键词 无模型强化学习 策略模型 状态表示 动作表示 连续动作空间 策略搜索强化学习方法
在线阅读 下载PDF
基于标签交互Seq2Seq模型的多标签文本分类方法 被引量:1
2
作者 王嫄 胡鹏 +3 位作者 鄢艳玲 王佳帅 赵婷婷 杨巨成 《传感器与微系统》 CSCD 北大核心 2024年第8期155-159,共5页
多标签文本分类任务可被建模为文本序列到标签序列的映射任务。然而,现有的序列到序列(Seq2Seq)模型仅从嘈杂文本中提取粗粒度的文本级表示,忽略了标签与单词之间细粒度的交互线索,导致类别理解偏差。对此,提出基于编码器—解码器结构... 多标签文本分类任务可被建模为文本序列到标签序列的映射任务。然而,现有的序列到序列(Seq2Seq)模型仅从嘈杂文本中提取粗粒度的文本级表示,忽略了标签与单词之间细粒度的交互线索,导致类别理解偏差。对此,提出基于编码器—解码器结构的标签语义交互Seq2Seq模型。在文本语义提取阶段,使用门控机制融合粗粒度的文本级表示和细粒度的交互线索,最终得到类别理解纠正的文本表示。在2个标准数据集上,与LEAM,LSAN,SGM等6个算法进行对比实验,结果表明,本文模型在2个主要评价指标上均得到显著提升。 展开更多
关键词 多标签文本分类 序列到序列 自适应门 多头注意力 标签嵌入
在线阅读 下载PDF
基于加权紧凑局部图结构的人脸识别算法 被引量:2
3
作者 杨巨成 王洁 +4 位作者 王嫄 毛磊 代翔子 刘建征 吴超 《计算机应用研究》 CSCD 北大核心 2021年第1期311-315,共5页
针对局部图结构算法(local graph structure,LGS)构建图结构时用到的像素点距离中心像素太远,以及在图结构形成后分配权重时没有结合周围像素点到中心像素的距离因素问题,提出加权紧凑局部图结构(weighted compact local graph structur... 针对局部图结构算法(local graph structure,LGS)构建图结构时用到的像素点距离中心像素太远,以及在图结构形成后分配权重时没有结合周围像素点到中心像素的距离因素问题,提出加权紧凑局部图结构(weighted compact local graph structure,WCLGS)算法。该算法定义了一种混合特征提取策略,从四个方向为中心像素点构建图结构,分别在垂直方向和对角线方向捕获对称和非对称信息,并且在图结构形成后对距中心像素点近的边赋较大的权重,对距中心像素点远的边赋较小的权重。WCLGS通过提取更近的像素点信息和合理的加权策略,密切关注中心像素点的近邻元素的差异,使得中心点两侧的信息提取更加均匀充分。实验证明,与现有的一些局部图结构算法相比,WCLGS在ORL(Olivetti Research Laboratory)、AR(active record)和HD(high definition)热红外人脸数据库上有更好的识别率和性能。 展开更多
关键词 局部图结构 加权紧凑局部图结构 权重 特征提取 人脸识别
在线阅读 下载PDF
基于知识蒸馏与目标区域选取的细粒度图像分类方法 被引量:4
4
作者 赵婷婷 高欢 +3 位作者 常玉广 陈亚瑞 王嫄 杨巨成 《计算机应用研究》 CSCD 北大核心 2023年第9期2863-2868,共6页
细粒度图像分类任务由于自身存在的细微的类间差别和巨大的类内差别使其极具挑战性,为了更好地学习细粒度图像的潜在特征,该算法将知识蒸馏引入到细粒度图像分类任务中,提出基于知识蒸馏与目标区域选取的细粒度图像分类方法(TRS-DeiT),... 细粒度图像分类任务由于自身存在的细微的类间差别和巨大的类内差别使其极具挑战性,为了更好地学习细粒度图像的潜在特征,该算法将知识蒸馏引入到细粒度图像分类任务中,提出基于知识蒸馏与目标区域选取的细粒度图像分类方法(TRS-DeiT),能使其兼具CNN模型和Transformer模型的各自优点。此外,TRS-DeiT的新型目标区域选取模块能够获取最具区分性的区域;为了区分任务中的易混淆类,引入对抗损失函数计算不同类别图像间的相似度。最终,在三个经典细粒度数据集CUB-200-2011、Stanford Cars和Stanford Dogs上进行训练测试,分别达到90.8%、95.0%、95.1%的准确率。实验结果表明,该算法相较于传统模型具有更高的准确性,通过可视化结果进一步证实该算法的注意力主要集中在识别对象,从而使其更擅长处理细粒度图像分类任务。 展开更多
关键词 细粒度图像分类 知识蒸馏 TRANSFORMER 深度学习
在线阅读 下载PDF
概率生成模型变分推理方法综述 被引量:3
5
作者 陈亚瑞 杨巨成 +2 位作者 史艳翠 王嫄 赵婷婷 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期617-632,共16页
概率生成模型是知识表示的重要方法,在该模型上计算似然函数的概率推理问题一般是难解的.变分推理是重要的确定性近似推理方法,具有较快的收敛速度、坚实的理论基础.尤其随着大数据时代的到来,概率生成模型变分推理方法受到工业界和学... 概率生成模型是知识表示的重要方法,在该模型上计算似然函数的概率推理问题一般是难解的.变分推理是重要的确定性近似推理方法,具有较快的收敛速度、坚实的理论基础.尤其随着大数据时代的到来,概率生成模型变分推理方法受到工业界和学术界的极大关注.综述了多种概率生成模型变分推理框架及最新进展,具体包括:首先综述了概率生成模型变分推理一般框架及基于变分推理的生成模型参数学习过程;然后对于条件共轭指数族分布,给出了具有解析优化式的变分推理框架及该框架下可扩展的随机化变分推理;进一步,对于一般概率分布,给出了基于随机梯度的黑盒变分推理框架,并简述了该框架下多种变分推理算法的具体实现;最后分析了结构化变分推理,通过不同方式丰富变分分布提高推理精度并改善近似推理一致性.此外,展望了概率生成模型变分推理的发展趋势. 展开更多
关键词 概率生成模型 变分推理 条件共轭指数族 黑盒变分推理 结构化变分推理
在线阅读 下载PDF
混合变分自编码 被引量:4
6
作者 陈亚瑞 蒋硕然 +2 位作者 杨巨成 赵婷婷 张传雷 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期136-144,共9页
变分自编码(variational autoencoder,VAE)是一种基于连续隐向量的生成模型,通过变分近似构建目标函数,其中的生成模型及变分推理模型均采用神经网络结构.传统变分自编码模型中的变分识别模型假设多维隐变量之间是相互独立的,这种假设... 变分自编码(variational autoencoder,VAE)是一种基于连续隐向量的生成模型,通过变分近似构建目标函数,其中的生成模型及变分推理模型均采用神经网络结构.传统变分自编码模型中的变分识别模型假设多维隐变量之间是相互独立的,这种假设简化了推理过程,但是这使得变分下界过于松弛,同时限制了隐向量空间的表示能力.提出混合变分自编码(mixture of variational autoencoder,MVAE)模型,它通过多个变分自编码组件生成样本数据,丰富了变分识别模型结构,同时扩展了隐向量表示空间.该模型以连续型隐向量作为模型的隐层表示,其先验分布为高斯分布;以离散型隐向量作为各组件的指示向量,其先验分布为多项式分布.对于MVAE模型的变分优化目标,采用重参策略和折棍参数化策略处理目标函数,并用随机梯度下降方法求解模型参数.MVAE采用混合组件的方法可以增强隐变量空间的表示能力,提高近似推理精度,重参策略和折棍参数化策略可以有效求解对应的优化问题.最后在MNIST和OMNIGLOT数据集上设计了对比实验,验证了MVAE模型较高的推理精度及较强的隐变量空间表示能力. 展开更多
关键词 变分自编码 混合模型 变分推理 折棍参数化 生成模型
在线阅读 下载PDF
基于互信息最大化的意图强化学习方法的研究 被引量:2
7
作者 赵婷婷 吴帅 +3 位作者 杨梦楠 陈亚瑞 王嫄 杨巨成 《计算机应用研究》 CSCD 北大核心 2022年第11期3327-3332,3364,共7页
强化学习主要研究智能体如何根据环境作出较好的决策,其核心是学习策略。基于传统策略模型的动作选择主要依赖于状态感知、历史记忆及模型参数等,其智能体行为很难受到控制。然而,当人类智能体完成任务时,通常会根据自身的意愿或动机选... 强化学习主要研究智能体如何根据环境作出较好的决策,其核心是学习策略。基于传统策略模型的动作选择主要依赖于状态感知、历史记忆及模型参数等,其智能体行为很难受到控制。然而,当人类智能体完成任务时,通常会根据自身的意愿或动机选择相应的行为。受人类决策机制的启发,为了让强化学习中的行为选择可控,使智能体能够根据意图选择动作,将意图变量加入到策略模型中,提出了一种基于意图控制的强化学习策略学习方法。具体地,通过意图变量与动作的互信息最大化使两者产生高相关性,使得策略能够根据给定意图变量选择相关动作,从而达到对智能体的控制。最终,通过复杂的机器人控制仿真任务Mujoco验证了所提方法能够有效地通过意图变量控制机器人的移动速度和移动角度。 展开更多
关键词 强化学习 互信息 意图控制 近端策略优化算法
在线阅读 下载PDF
基于值函数估计的参数探索策略梯度算法 被引量:1
8
作者 赵婷婷 杨梦楠 +2 位作者 陈亚瑞 王嫄 杨巨成 《计算机应用研究》 CSCD 北大核心 2023年第8期2404-2410,共7页
策略梯度估计方差大是策略梯度算法存在的普遍问题,基于参数探索的策略梯度算法(PGPE)通过使用确定性策略有效缓解了这一问题。然而,PGPE算法基于蒙特卡罗方法进行策略梯度的估计,需要大量学习样本才能保证梯度估计相对稳定,因此,梯度... 策略梯度估计方差大是策略梯度算法存在的普遍问题,基于参数探索的策略梯度算法(PGPE)通过使用确定性策略有效缓解了这一问题。然而,PGPE算法基于蒙特卡罗方法进行策略梯度的估计,需要大量学习样本才能保证梯度估计相对稳定,因此,梯度估计方差大阻碍了其在现实问题中的实际应用。为进一步减小PGPE算法策略梯度估计的方差,提出了基于值函数估计的参数探索策略梯度算法(PGPE-FA),该算法在PGPE算法中引入Actor-Critic框架。具体地,提出的方法使用价值函数估计策略梯度,代替了PGPE方法使用轨迹样本估计策略梯度的方式,从而减小了梯度估计方差。最后,通过实验验证了所提算法能够减小梯度估计的方差。 展开更多
关键词 强化学习 值函数 参数探索策略梯度 梯度估计方差
在线阅读 下载PDF
基于自适应GOP的三维提升小波视频编码技术
9
作者 方志军 罗桂华 +2 位作者 伍世虔 杨寿渊 杨巨成 《计算机工程与设计》 CSCD 北大核心 2012年第5期1913-1917,共5页
在三维提升视频编码框架中,视频运动场景切换时相邻视频帧之间的时间相关性将显著减弱,使得解码视频图像在场景切换处质量急剧下降。针对这一问题,提出了一种新的基于视频亮度分量的场景切换检测方法,并根据场景切换自适应分配图像组(gr... 在三维提升视频编码框架中,视频运动场景切换时相邻视频帧之间的时间相关性将显著减弱,使得解码视频图像在场景切换处质量急剧下降。针对这一问题,提出了一种新的基于视频亮度分量的场景切换检测方法,并根据场景切换自适应分配图像组(group of picture GOP)大小。实验结果表明,该自适应分配GOP策略有效提高了三维提升小波视频图像的编解码质量,降低了场景切换对视频编码的影响。 展开更多
关键词 自适应 图像组 提升小波 视频 场景切换
在线阅读 下载PDF
潜在空间中深度强化学习方法研究综述
10
作者 赵婷婷 孙威 +2 位作者 陈亚瑞 王嫄 杨巨成 《计算机科学与探索》 CSCD 北大核心 2023年第9期2047-2074,共28页
深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在... 深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在空间的深度强化学习成为该领域的主流方法。系统地综述了基于潜在空间的表示学习在深度强化学习中的研究进展,分析并总结了现有基于潜在空间的深度强化学习的方法,将其分为潜在空间中的状态表示、动作表示以及动力学模型进行详细阐述。其中,潜在空间中的状态表示又被分为基于重构方式的状态表示方法、基于互模拟等价的状态表示方法及其他状态表示方法。最后,列举了现有基于潜在空间的强化学习在游戏领域、智能控制领域、推荐领域及其他领域的成功应用,并浅谈了该领域的未来发展趋势。 展开更多
关键词 强化学习 深度学习 潜在空间 状态表示 动作表示
在线阅读 下载PDF
基于KS检验的高斯混合模型分裂与合并算法 被引量:7
11
作者 蒋硕然 陈亚瑞 +1 位作者 秦智飞 杨巨成 《中国科学技术大学学报》 CAS CSCD 北大核心 2018年第6期477-485,共9页
高斯混合模型是有限个独立高斯模型的线性组合,估计其子模型个数是一个重要的研究问题.一类典型的算法是以最短描述长度为目标函数,在迭代过程中通过对子模型进行分裂与合并操作确定子模型个数.这类方法一般采用熵比、KL散度和模型相似... 高斯混合模型是有限个独立高斯模型的线性组合,估计其子模型个数是一个重要的研究问题.一类典型的算法是以最短描述长度为目标函数,在迭代过程中通过对子模型进行分裂与合并操作确定子模型个数.这类方法一般采用熵比、KL散度和模型相似度作为分裂和合并的判别准则.但是熵比或KL散度准则对稀疏子模型和凹形子模型过于敏感导致过度分裂,模型相似度准则不能反映合并后模型的高斯拟合优度导致过度合并.在算法的迭代过程中,这些过度分裂与合并操作产生振荡现象.针对估计子模型个数时出现的过度分裂与合并问题,基于KS检验的高斯混合模型的分裂与合并算法选择熵比与KS检验作为分裂的判别准则,模型相似度和KS检验作为合并的判别准则.最后在六个数据集上进行了实验证明算法的有效性. 展开更多
关键词 高斯混合模型 最短描述长度 熵比 KS检验
在线阅读 下载PDF
基于多模态图卷积神经网络的行人重识别方法 被引量:2
12
作者 何嘉明 杨巨成 +2 位作者 吴超 闫潇宁 许能华 《计算机应用》 CSCD 北大核心 2023年第7期2182-2189,共8页
针对行人重识别中行人文本属性信息未被充分利用以及文本属性之间语义联系未被挖掘的问题,提出一种基于多模态的图卷积神经网络(GCN)行人重识别方法。首先使用深度卷积神经网络(DCNN)学习行人文本属性与行人图像特征;然后借助GCN有效的... 针对行人重识别中行人文本属性信息未被充分利用以及文本属性之间语义联系未被挖掘的问题,提出一种基于多模态的图卷积神经网络(GCN)行人重识别方法。首先使用深度卷积神经网络(DCNN)学习行人文本属性与行人图像特征;然后借助GCN有效的关系挖掘能力,将文本属性特征与图像特征作为GCN的输入,通过图卷积运算来传递文本属性节点间的语义信息,从而学习文本属性间隐含的语义联系信息,并将该语义信息融入图像特征中;最后GCN输出鲁棒的行人特征。该多模态的行人重识别方法在Market-1501数据集上获得了87.6%的平均精度均值(mAP)和95.1%的Rank-1准确度;在DukeMTMC-reID数据集上获得了77.3%的mAP和88.4%的Rank-1准确度,验证了所提方法的有效性。 展开更多
关键词 行人重识别 多模态 图卷积神经网络 行人文本属性 隐含语义联系
在线阅读 下载PDF
熵正则化下的变分深度生成聚类模型
13
作者 张志远 陈亚瑞 +2 位作者 杨剑宁 丁文强 杨巨成 《计算机科学与探索》 CSCD 北大核心 2023年第2期376-384,共9页
基于深度学习的聚类方法可以自动学习到数据的隐层特征表示,并可方便应用于高维大规模数据集上。传统深度聚类方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分析,同时缺... 基于深度学习的聚类方法可以自动学习到数据的隐层特征表示,并可方便应用于高维大规模数据集上。传统深度聚类方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分析,同时缺乏对施加约束后的离散隐向量分布的分析。提出熵正则化下的变分深度生成聚类模型(VDGC-ER),以变分自编码为基础框架,对连续向量进行高斯混合先验建模,并以高斯混合中的离散隐向量作为类别向量。通过对离散隐向量引入样本熵正则化项增强预测聚类类别的区分度,同时对离散隐向量定义聚合样本熵正则化项以降低聚类不平衡,避免局部最优,并提升生成数据多样性。之后,采用蒙特卡洛采样及重参策略估计VDGC-ER模型的优化目标,并利用随机梯度下降法求解模型参数。最后在MNIST数据集、REUTERS数据集、REUTERS-10K数据集和HHAR数据集上设计了对比实验,验证了VDGCER模型不仅可以生成高质量的样本,而且可以显著提升聚类精度。 展开更多
关键词 变分自编码 概率生成模型 变分推理 熵正则化 聚类
在线阅读 下载PDF
面向短文本语义分析的标签条件神经主题模型
14
作者 王嫄 鄢艳玲 +3 位作者 徐茂玲 胡鹏 赵婷婷 杨巨成 《计算机工程与应用》 CSCD 北大核心 2023年第11期80-87,共8页
无监督机器学习方法中的神经主题模型已被广泛用于自动挖掘文本潜在语义。然而,短文本篇幅有限,文中可用于推断的信息匮乏,模型难以在上下文不充分的情况下正确识别歧义词。为此,提出了一种面向短文本语义分析的标签条件神经主题模型,... 无监督机器学习方法中的神经主题模型已被广泛用于自动挖掘文本潜在语义。然而,短文本篇幅有限,文中可用于推断的信息匮乏,模型难以在上下文不充分的情况下正确识别歧义词。为此,提出了一种面向短文本语义分析的标签条件神经主题模型,模型采用变分自编码器架构,在编码器输出的主题分布上引入文本的标签信息,作为主题类别级的语义标识符指导模型过滤与当前主题语义不相关的词、凝练语义并辨识歧义词在主题语境下的准确词义,引导模型推断离散一致的主题。针对短文本应用过程中主题语义分布统计显著有偏的数据特点,在模型训练过程中引入泰勒损失,通过调整泰勒多项式系数建模短文本类别分布不平衡。实验结果表明,该模型不仅能够极大提高短文本主题建模的质量,生成连贯且多样的主题,而且能有效提升下游任务性能。 展开更多
关键词 神经主题模型 短文本 泰勒损失
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部