期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于深度Q网络的平衡杆优化控制实验教学案例设计
1
作者 钟珊 杜鑫 +2 位作者 司亚利 刘井莲 严卫 《实验室研究与探索》 北大核心 2025年第1期146-152,190,共8页
为了使学生更深入地掌握采用强化学习求解任务最优策略的方法,基于深度Q网络设计了平衡杆的控制优化实验。将平衡杆实验环境建模为马尔可夫决策模型,从深度Q网络结构、探索策略、奖励函数、经验回放池更新和目标Q网络更新等角度进行了... 为了使学生更深入地掌握采用强化学习求解任务最优策略的方法,基于深度Q网络设计了平衡杆的控制优化实验。将平衡杆实验环境建模为马尔可夫决策模型,从深度Q网络结构、探索策略、奖励函数、经验回放池更新和目标Q网络更新等角度进行了实验方案的设计。实验评估综合考虑了算法有效性、Q值估计的准确性、样本效率和Q网络的损失估计。在此基础上,将其与基准算法Q学习算法在累计奖赏和学习效率上进行了对比。该实验不仅可以帮助学生学会综合应用强化学习知识,也能帮助其掌握采用深度Q网络算法来求解离散动作空间任务的最优策略。 展开更多
关键词 强化学习 深度Q网络 Q学习 平衡杆 实验设计
在线阅读 下载PDF
知识整合力、人才聚合力、品牌传播力:AI时代的智库“三力”建设
2
作者 徐宁 何亮 《智库理论与实践》 北大核心 2025年第4期42-45,共4页
[目的/意义]当前,人工智能技术正深刻重塑着信息处理、知识生产和决策咨询模式,对中国特色新型智库的建设和发展提出了新要求。本文旨在探讨AI时代下,智库如何从传统模式向平台化、智能化转型,以提升其咨政建言水平和更高维度能力。[方... [目的/意义]当前,人工智能技术正深刻重塑着信息处理、知识生产和决策咨询模式,对中国特色新型智库的建设和发展提出了新要求。本文旨在探讨AI时代下,智库如何从传统模式向平台化、智能化转型,以提升其咨政建言水平和更高维度能力。[方法/过程]本文立足智库研究与运营的实践场景,聚焦知识整合力、人才聚合力、品牌传播力这三大核心能力,系统性探讨了人工智能如何通过人机协同、技术应用、场景赋能等方式,助力智库“三力”建设。[结果/结论]研究发现,AI能显著扩展智库在知识获取与加工方面的范围、效率与维度;助力人才从“被动匹配”转向“智能协同”,实现精准画像与供需对接;并在政府、社会和国际层面,构建智能、交互、精准的全域传播体系。这为中国特色新型智库探索下一个十年的创新发展提供了新路径。 展开更多
关键词 人工智能 智库 知识整合 人才聚合 品牌传播
在线阅读 下载PDF
面向车联网的轻量级认证密钥协商协议
3
作者 刘亚丽 庞小辉 +2 位作者 陈东东 王鹏超 周毅 《通信学报》 北大核心 2025年第8期152-164,共13页
针对张等提出的面向车联网通勤的双阶段认证密钥协商协议进行分析,发现其不能抵抗秘密泄露攻击、中间人攻击等多种攻击。为解决协议面临的安全隐患问题,提出一种面向车联网的轻量级认证密钥协商(LAKA)协议。首先,通过异或和对称加密算... 针对张等提出的面向车联网通勤的双阶段认证密钥协商协议进行分析,发现其不能抵抗秘密泄露攻击、中间人攻击等多种攻击。为解决协议面临的安全隐患问题,提出一种面向车联网的轻量级认证密钥协商(LAKA)协议。首先,通过异或和对称加密算法对私密值加密,保证私密值的隐私性;其次,利用车辆和路边单元的私密值生成认证请求,确保协议的安全性;再次,性能分析表明,与同类方案相比,在计算代价上具有明显优势;最后,利用BAN逻辑和ProVerif工具进行形式化分析与验证,证明其具有更强的安全性和隐私保护性。 展开更多
关键词 车联网 轻量级 认证协议 密钥协商 隐私保护
在线阅读 下载PDF
开放世界下带有分布内和分布外噪声的长尾学习
4
作者 郑金鹏 李绍园 +3 位作者 朱晓林 黄圣君 陈松灿 王康侃 《南京航空航天大学学报(自然科学版)》 北大核心 2025年第5期842-851,共10页
在训练深度神经网络时,实际应用数据常存在长尾类别分布、分布内噪声和分布外噪声等偏差。现有方法多单独解决类别不平衡或含噪声标签问题,很少同时考虑两者,尤其是两种噪声并存时。本文提出不平衡噪声标签校准(Imbalanced noisy label ... 在训练深度神经网络时,实际应用数据常存在长尾类别分布、分布内噪声和分布外噪声等偏差。现有方法多单独解决类别不平衡或含噪声标签问题,很少同时考虑两者,尤其是两种噪声并存时。本文提出不平衡噪声标签校准(Imbalanced noisy label calibration,INLC)方法,用模型一致性预测筛选分布外样本并赋予均匀标签,增强模型对其检测能力;对分布内样本,利用Jensen-Shannon散度区分噪声,减少干净样本误分类,尤其针对尾部类别;引入额外语义分类器,缓解伪标签对多数类的偏向性以应对类别不平衡;采用基于强数据增强的一致性正则化方法提升模型泛化性能。在模拟和真实数据集上的实验表明,INLC显著减轻了标签噪声和类别不平衡的影响,分类准确率较优异基线方法提高2%以上。 展开更多
关键词 长尾学习 开放世界 分布内和分布外噪声 伪标签 不平衡
在线阅读 下载PDF
置信引导的多模态数据测试时适应框架
5
作者 尹小龙 詹德川 姜远 《计算机研究与发展》 北大核心 2025年第9期2166-2182,共17页
测试时适应(test time adaptation, TTA)旨在在模型部署后的测试阶段,通过无标注或少量标注的在线微调策略来动态校正模型,以应对由于分布偏移、传感器噪声、光照变化等引发的性能退化问题,并在自动驾驶、远程医疗、视频监控等对实时性... 测试时适应(test time adaptation, TTA)旨在在模型部署后的测试阶段,通过无标注或少量标注的在线微调策略来动态校正模型,以应对由于分布偏移、传感器噪声、光照变化等引发的性能退化问题,并在自动驾驶、远程医疗、视频监控等对实时性和鲁棒性要求极高的领域展现出广泛应用价值.然而,现有多模态TTA方法往往忽视各视图数据的质量差异,容易因低质量或故障视图引入有害梯度,且缺乏对视图内部动态变化的刻画,难以保持时序特征的一致性和稳定性.为解决上述挑战,提出了一种置信度引导的视图裁剪与时序对比注意力(confidence-guided view pruning and temporal contrastive attention, CVPTA)框架.该框架包含三大模块:首先,基于模型预测分布计算视图不确定性,自适应削弱低置信度视图数据对特征融合的干扰;其次,视图裁剪策略利用Laplacian方差与亮度直方图偏度评估图像质量,丢弃质量分数低于阈值的视图数据,并结合相邻高质量视图重采样,显著降低噪声累积风险;最后,时序对比自监督任务将同一样本的不同视图视为正样本而非同一样本视图视为负样本,通过对比损失强化时序特征一致性.在Kinetics-50-C与VGGSound-C两个公开多模态扰动基准上,沿用先前实验配置进行在线更新评测.结果显示,CVPTA在2组基准上分别将Top-1准确率提升约2.3个百分点和0.7个百分点,在极端噪声场景中依然保持超过0.2%的性能增益;消融研究进一步验证了各模块的独立贡献与协同效应.该方法无需额外标注,可无缝集成现有多模态系统,兼具高效性与鲁棒性,具有重要的理论意义与工程应用前景. 展开更多
关键词 测试时适应 多模态学习 多视图学习 视图裁剪 时序对比学习
在线阅读 下载PDF
空间通信载波多普勒频偏的局部聚类捕获算法
6
作者 张兆维 王帅威 +5 位作者 杜帅 吴同 邱帅博 刘琳 左加阔 潘甦 《数据采集与处理》 北大核心 2025年第1期147-162,共16页
与地面通信不同,空间通信通常涉及相距很远且高速飞行的信号载体。此时,信号传输会面临两个困难:远距离路径损耗导致的低信噪比(Signal-to-noise-ratio,SNR)和高速相对运动引起的高动态多普勒频偏。针对多普勒频偏捕获,低SNR要求一个很... 与地面通信不同,空间通信通常涉及相距很远且高速飞行的信号载体。此时,信号传输会面临两个困难:远距离路径损耗导致的低信噪比(Signal-to-noise-ratio,SNR)和高速相对运动引起的高动态多普勒频偏。针对多普勒频偏捕获,低SNR要求一个很长的累积周期来累积很多个信号。但是,在这个长累积周期内,高动态多普勒频偏扩散所有信号的总能量到一个很宽的频率区间。为解决此能量扩散问题,本文提出一种局部聚类捕获(Local-clustering-acquisition,LCA)算法。该算法首先利用全局范围内最大元素来构造一个局部范围,然后从局部范围内选择若干个较大元素并进行聚类,最后从聚类结果中搜索最大的簇来得到捕获结果。理论分析和仿真验证结果表明,相较于现有算法,LCA算法在提升捕获概率方面展现出显著优势。 展开更多
关键词 空间通信 多普勒捕获 能量扩散 局部范围 聚类
在线阅读 下载PDF
基于路径规划特点的语义目标导航方法 被引量:2
7
作者 高宇 霍静 +3 位作者 李文斌 伍静 来煜坤 高阳 《智能系统学报》 CSCD 北大核心 2024年第1期217-227,共11页
为了解决语义目标导航任务中存在的探索效率低、深度不精准等问题,本文构建了一个解决语义目标导航任务的框架,在语义地图构建模块中引入了深度图边缘处理以及地图纠错机制;在探索模块中引入了覆盖范围最大化算法;在路径规划模块中引入... 为了解决语义目标导航任务中存在的探索效率低、深度不精准等问题,本文构建了一个解决语义目标导航任务的框架,在语义地图构建模块中引入了深度图边缘处理以及地图纠错机制;在探索模块中引入了覆盖范围最大化算法;在路径规划模块中引入了替代点机制。本文在一个3D仿真环境下进行了实验。实验结果表明,本文提出的解决方案明显提升了语义目标导航任务的性能。此外,本文所提方法成功应用到了四足机器人上,从而验证了其在现实场景下的泛化性。 展开更多
关键词 人工智能 视觉导航 语义目标导航 语义感知 语义探索 路径规划 机器学习 语义地图
在线阅读 下载PDF
边缘场景下面向分布式交互应用的服务器分配 被引量:1
8
作者 顾颖程 魏柳 +7 位作者 姜宁 程环宇 刘凯 宋玉 刘梅招 汤雷 陈彧 张胜 《计算机工程与科学》 CSCD 北大核心 2024年第10期1748-1756,共9页
移动边缘计算作为一种极具前瞻性的分布式计算范式,将云计算的计算能力下沉到网络边缘来高效地处理数据。近年来,分布式交互应用的需求激增,移动智能设备数量爆炸性增长,作为移动边缘计算的重要组成部分,边缘服务器可以使交互应用程序... 移动边缘计算作为一种极具前瞻性的分布式计算范式,将云计算的计算能力下沉到网络边缘来高效地处理数据。近年来,分布式交互应用的需求激增,移动智能设备数量爆炸性增长,作为移动边缘计算的重要组成部分,边缘服务器可以使交互应用程序在用户附近执行,从而解决通信和网络开销过大和数据无法即时处理的问题。一个关键的挑战是找到一个合适的边缘服务器分配策略以有效降低交互延迟和平衡服务器工作负载。基于此目标提出了边缘服务器分配算法ESADQN,将问题建模为马尔可夫决策过程,使用强化学习有效地选择边缘服务器部署位置,并将用户分配到相应服务器。与k-means算法相比,ESADQN算法在工作负载标准差相近的情况下,总交互时延平均减少了31%;与Top-K算法相比,ESADQN算法在总交互时延相近的情况下,工作负载标准差平均减少了49%。实验结果表明,ESADQN选择的服务器分配方案能有效降低交互时延和工作负载标准差。 展开更多
关键词 边缘计算 服务器分配 分布式交互应用 马尔可夫决策过程 强化学习
在线阅读 下载PDF
融合语义解释和DeBERTa的极短文本层次分类
9
作者 陈昊飏 张雷 《计算机科学》 CSCD 北大核心 2024年第5期250-257,共8页
文本层次分类在社交评论主题分类、搜索词分类等场景中有重要应用,这些场景的数据往往具有极短文本特征,体现在信息的稀疏性、敏感性等中,这对模型特征表示和分类性能带来了很大挑战,而层次标签空间的复杂性和关联性使得难度进一步加剧... 文本层次分类在社交评论主题分类、搜索词分类等场景中有重要应用,这些场景的数据往往具有极短文本特征,体现在信息的稀疏性、敏感性等中,这对模型特征表示和分类性能带来了很大挑战,而层次标签空间的复杂性和关联性使得难度进一步加剧。基于此,提出了一种融合语义解释和DeBERTa模型的方法,该方法的核心思想在于:引入具体语境下各个字词或词组的语义解释,补充优化模型获取的内容信息;结合DeBERTa模型的注意力解耦机制与增强掩码解码器,以更好地把握位置信息、提高特征提取能力。所提方法首先对训练文本进行语法分词、词性标注,再构造GlossDeBERTa模型进行高准确率的语义消歧,获得语义解释序列;然后利用SimCSE框架使解释序列向量化,以更好地表征解释序列中的句子信息;最后训练文本经过DeBERTa模型神经网络后,得到原始文本的特征向量表示,再与解释序列中的对应特征向量相加,传入多分类器。实验遴选短文本层次分类数据集TREC中的极短文本部分,并进行数据扩充,最终得到的数据集平均长度为12词。多组对比实验表明,所提出的融合语义解释的DeBERTa模型性能最为优秀,在验证集和测试集上的Accuracy值、F1-micro值、F1-macro值相比其他算法模型有较大的提升,能够很好地应对极短文本层次分类任务。 展开更多
关键词 极短文本 层次分类 语义解释 DeBERTa GlossDeBERTa SimCSE
在线阅读 下载PDF
适应梯度变化的普适在线凸优化算法
10
作者 刘朗麒 张利军 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2629-2644,共16页
普适在线凸优化算法能够自动适应多类损失函数并进行优化,这使得用户无须自行判别损失函数的类型,降低了在线凸优化技术的使用门槛.虽然现有的普适算法对于多类损失函数的理论保障均达到极小极大最优,但是它们难以针对一般凸函数获得问... 普适在线凸优化算法能够自动适应多类损失函数并进行优化,这使得用户无须自行判别损失函数的类型,降低了在线凸优化技术的使用门槛.虽然现有的普适算法对于多类损失函数的理论保障均达到极小极大最优,但是它们难以针对一般凸函数获得问题相关的理论保障.为解决该问题,本文提出的UAGV算法不仅能够自动适应一般凸与强凸的损失函数,同时首次在平滑条件下对于一般凸损失函数保障了梯度变化界,即能够在损失函数梯度变化缓慢时取得更好的性能.算法整体采用元算法-专家算法的二层结构,在顶层本文创新性地采用具有乐观项的元算法,并针对梯度变化界的形式设计替代损失函数与乐观项,使得其在结合底层专家算法时能够获得相应保障.在多个数据集上的实验结果表明,UAGV算法对于平滑一般凸函数产生的遗憾整体小于现有普适算法,在部分数据集上遗憾减小的幅度超过14%. 展开更多
关键词 在线凸优化 普适算法 平滑 梯度变化 问题相关界 乐观项
在线阅读 下载PDF
渐进式深度集成架构搜索算法研究
11
作者 朱光辉 祁加豪 +2 位作者 朱振南 袁春风 黄宜华 《计算机学报》 EI CAS CSCD 北大核心 2023年第10期2041-2065,共25页
深度神经网络已在各个领域取得巨大成功.然而,深度学习模型并不只包含深度神经网络.近年来,以深度森林为代表的深度集成学习模型,凭借着无需反向传播训练、计算开销更小、模型复杂度支持自适应确定以及表数据建模任务性能优异等特点,引... 深度神经网络已在各个领域取得巨大成功.然而,深度学习模型并不只包含深度神经网络.近年来,以深度森林为代表的深度集成学习模型,凭借着无需反向传播训练、计算开销更小、模型复杂度支持自适应确定以及表数据建模任务性能优异等特点,引起了学界和业界的广泛关注,并且取得了良好的应用效果.深度森林为探索DNN(Deep Neural Network)之外的深度学习模型打开了另一扇门.然而,现有的深度集成模型主要以深度森林为主,深度集成架构较为单一,基学习器的数量与集成方式较为固定,需要探索除深度森林之外的深度集成学习模型架构.另外,实际应用中,很难存在一种深度集成学习模型架构能够在不同数据集上均取得优异性能,尤其是对于数据特征差异较大的表格型数据集.因此,也需要一种高效的数据自适应的深度集成学习架构设计方法.为此,本文从搜索空间和搜索算法两个层面,研究提出了一种高效的基于代理模型的渐进式深度集成架构搜索方法PMPAS(Proxy Model-based Progressive Architecture Search).首先,通过归纳分析已有深度集成学习模型的特点,给出了深度集成架构的形式化定义.其次,研究提出了两种全新的深度集成架构搜索空间,即基于完全并行的搜索空间和基于有向无环图的搜索空间.然后,在上述两种搜索空间的基础上,研究提出了基于代理模型的渐进式搜索方法与算法,实现从简单到复杂逐步地在搜索空间中进行探索,并采用代理模型作为指导,降低模型评估开销.最后,本文从时间复杂度和空间复杂度两个方面对搜索算法进行分析.在分类、回归等公开的表格型数据集上的大量实验结果表明,通过PMPAS算法搜索得到的深度集成架构,其性能不仅优于已有的集成学习模型、深度学习模型以及以深度森林为代表的深度集成学习模型,而且优于已有的自动化模型选择算法.随着时间预算的不断增加,性能优势更为明显.PMPAS开源地址为:https://github.com/PasaLab/PMPAS. 展开更多
关键词 深度学习 深度集成架构 架构搜索 代理模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部