期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
DNN在位级可组合架构上的数据流优化方法
1
作者 高汉源 宫磊 王腾 《计算机工程与应用》 CSCD 北大核心 2024年第18期147-157,共11页
位级可组合架构用于支持有多种数据位宽类型的神经网络计算。其硬件结构有较多变体,面对不同神经网络模型需额外设计程序调度。过程耗时,阻碍软硬件的快速迭代和部署,效果难以评估。相关的数据流建模工作缺乏位级计算描述和自动化方法... 位级可组合架构用于支持有多种数据位宽类型的神经网络计算。其硬件结构有较多变体,面对不同神经网络模型需额外设计程序调度。过程耗时,阻碍软硬件的快速迭代和部署,效果难以评估。相关的数据流建模工作缺乏位级计算描述和自动化方法。提出了基于数据流建模的自适应位级可组合架构上的数据调度优化方法解决上述问题。引入位级数据流建模,以多种循环原语和张量-索引关系矩阵,描述位级可组合硬件结构的特征和应用的数据调度过程。从建模表达中提取数据访问信息,统计数据复用情况,进行快速评估。构建了设计空间探索框架,针对不同应用和硬件设计约束自适应优化数据调度过程。利用索引匹配方法和循环变换方法进行设计采样,添加贪心规则进行剪枝,以提高探索效率。在多个应用程序和多种硬件结构约束下进行实验。结果表明对比先进的手动设计的加速器和数据调度,获得了更好的性能表现。 展开更多
关键词 神经网络加速器 可变位宽 数据流 设计空间探索
在线阅读 下载PDF
超材料的智能设计研究进展 被引量:1
2
作者 代铁琳 金刘超 +3 位作者 尚宸 翟晓雅 傅孝明 刘利刚 《计算机辅助设计与图形学学报》 北大核心 2025年第1期1-27,共27页
超材料是一种人工合成材料,其结构经过精心设计和精密控制,表现出不同于自然材料的特殊性能,这些具有独特功能的超材料在光学、电磁学、声学、力学等领域具有重要的应用价值.然而,传统的超材料设计通常依赖于人工经验,导致设计周期长,... 超材料是一种人工合成材料,其结构经过精心设计和精密控制,表现出不同于自然材料的特殊性能,这些具有独特功能的超材料在光学、电磁学、声学、力学等领域具有重要的应用价值.然而,传统的超材料设计通常依赖于人工经验,导致设计周期长,缺乏灵活性和可调性,难以实现大规模快速设计与量产.高效设计与性能调控超材料已成为CAD、机械工程和材料科学的重要研究方向.近年来,随着人工智能算法的快速发展,智能算法在超材料设计领域中的应用越来越广泛,展现出高效优化、生成多样性结构、缩短设计周期等优势.文中对超材料的智能设计研究进展进行综述,首先介绍超材料的基本概念和发展历史;然后从实际需求出发,阐述了超材料的应用领域与设计问题;提出了智能算法的核心问题是数据的表示与数据集的构建,针对这2方面进行详细的阐述与对比分析;还介绍了智能优化算法的框架;最后总结超材料设计领域所面临的高质量数据集匮乏、多目标优化难题、高分辨率超材料的高效计算等挑战,并展望了该领域未来的发展趋势即面向多样化功能需求的“可表达”“可编辑”“可分析”“可优化”和“可制造”的研究. 展开更多
关键词 超材料设计 智能算法 几何表示 结构优化 超材料数据集
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
3
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度聚类算法 子簇融合
在线阅读 下载PDF
Drivable generalized NeRF-based head model
4
作者 Yue Wang Yudong Guo 《中国科学技术大学学报》 北大核心 2025年第1期46-57,45,I0001,I0002,共15页
In recent years,the concept of digital human has attracted widespread attention from all walks of life,and the modelling of high-fidelity human bodies,heads,and hands has been intensively studied.This paper focuses on... In recent years,the concept of digital human has attracted widespread attention from all walks of life,and the modelling of high-fidelity human bodies,heads,and hands has been intensively studied.This paper focuses on head modelling and proposes a generic head parametric model based on neural radiance fields.Specifically,we first use face recognition networks and 3D facial expression database FaceWarehouse to parameterize identity and expression semantics,respectively,and use both as conditional inputs to build a neural radiance field for the human head,thereby improving the head model’s representation ability while ensuring editing capabilities for the identity and expression of the rendered results;then,through a combination of volume rendering and neural rendering,the 3D representation of the head is rapidly rendered into the 2D plane,producing a high-fidelity image of the human head.Thanks to the well-designed loss functions and good implicit representation of the neural radiance field,our model can not only edit the identity and expression independently,but also freely modify the virtual camera position of the rendering results.It has excellent multi-view consistency,and has many applications in novel view synthesis,pose driving and more. 展开更多
关键词 neural radiance fields head parametric model semantic disentanglement novel view synthesis
在线阅读 下载PDF
基于行政大数据的失业率估计:以某四百万人口城市为例 被引量:3
5
作者 中国经济大数据研究组 黄冠华 +5 位作者 郑重 杨雨成 杨路 孔京 承孝敏 杨周旺 《统计研究》 CSSCI 北大核心 2021年第12期145-156,共12页
我国城镇登记失业率指标稳定在4%左右,难以较为准确反映就业动态;而劳动力调查样本量有限,城镇调查失业率对省以下各级行政区域代表性不足。本文将针对大数据的机器学习算法与针对传统统计数据的核算思想结合起来,基于某四百万人口城市2... 我国城镇登记失业率指标稳定在4%左右,难以较为准确反映就业动态;而劳动力调查样本量有限,城镇调查失业率对省以下各级行政区域代表性不足。本文将针对大数据的机器学习算法与针对传统统计数据的核算思想结合起来,基于某四百万人口城市2016—2018年的全样本行政大数据,利用机器学习算法,对每个城镇居民每个月的就业状态进行预测,再利用统计核算方法,估计出该城市的失业率。在个人层面,本文的模型在样本外测试集上的准确率达到96.7%。经过统计核算加总,本文估计的当地失业率在合理区间范围内,并表现出明显的周期性特征,对就业形势动态变化的刻画明显优于当地一年发布一次的登记失业率数据。本文基于个人层面的预测结果,进一步探讨了当地失业人口的性别与文化程度特征,以及再就业的时间规律。本文针对如何使用行政大数据辅助经济决策提出了新的范式,对大数据时代如何理解经济与制定政策具有参考意义。 展开更多
关键词 行政大数据 机器学习 统计核算 失业率
在线阅读 下载PDF
右删失数据下多响应AFT模型的两阶段估计 被引量:1
6
作者 刘慧馨 《应用概率统计》 CSCD 北大核心 2023年第1期10-26,共17页
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量... 在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集. 展开更多
关键词 多响应AFT模型 多元右删失数据 逆概率删失加权 SESS算法 生存分析 稀疏降秩回归
在线阅读 下载PDF
推荐系统中物品召回技术的研究进展
7
作者 连德富 谢幸 陈恩红 《南京信息工程大学学报(自然科学版)》 CAS 2019年第3期241-250,共10页
信息技术的快速发展导致信息过载.推荐系统是解决信息过载最有效的方式之一.近年来,深度学习的快速发展也带动了推荐系统的进步,各种深度推荐算法层出不穷.然而由于候选物品数量巨大且用户兴趣动态变化,深度推荐算法的推荐复杂度巨大,... 信息技术的快速发展导致信息过载.推荐系统是解决信息过载最有效的方式之一.近年来,深度学习的快速发展也带动了推荐系统的进步,各种深度推荐算法层出不穷.然而由于候选物品数量巨大且用户兴趣动态变化,深度推荐算法的推荐复杂度巨大,难以在实际系统中单独使用.在深度推荐技术发展的同时,物品召回技术(也称近似搜索技术)也有了较大的发展与进步.本文先介绍基于距离最小化的物品召回的研究进展,再从向量索引、局部敏感哈希、哈希学习、向量量化四个方面来深入探讨基于内积最大化的物品召回技术的研究进展. 展开更多
关键词 最大内积搜索 召回 最近邻搜索 推荐系统 协同过滤 深度推荐
在线阅读 下载PDF
基于通用因果树对观测型数据进行子群因果效应推断
8
作者 张采蔚 郑泽敏 《中国科学技术大学学报》 CAS CSCD 北大核心 2023年第11期12-23,I0002,I0007,共14页
探索因果效应中的异质性在政策评估和决策制定方面具有广泛的应用。近年来学者们开始应用机器学习方法来发掘因果关系,目前流行的方法大多聚焦于估计个体水平上的异质性处理效应。然而在大数据场景下,识别子群水平上的处理效应能更直观... 探索因果效应中的异质性在政策评估和决策制定方面具有广泛的应用。近年来学者们开始应用机器学习方法来发掘因果关系,目前流行的方法大多聚焦于估计个体水平上的异质性处理效应。然而在大数据场景下,识别子群水平上的处理效应能更直观地给决策者展示异质性的形成机制。本文提供一种树类方法,在观测型数据下识别子群异质性处理效应,称为通用因果树。它通过最大化节点之间处理效应的差异来进行树的分裂,并且嵌入了半参数框架改善节点上处理效应估计量的表现。同时,我们借鉴honest估计隔离了树的建立与参数的推断过程,实现子群处理效应的有效推断。模拟实验表明,该方法在子群识别和参数估计的正确性上均有明显优势,并且可以提供有效的统计推断。 展开更多
关键词 因果推断 子群识别 半参数估计 异质性因果效应
在线阅读 下载PDF
基于多模态对比学习的代码表征增强预训练方法 被引量:2
9
作者 杨宏宇 马建辉 +2 位作者 侯旻 沈双宏 陈恩红 《软件学报》 EI CSCD 北大核心 2024年第4期1601-1617,共17页
代码表征旨在融合源代码的特征,以获取其语义向量,在基于深度学习的代码智能中扮演着重要角色.传统基于手工的代码表征依赖领域专家的标注,繁重耗时,且无法灵活地复用于特定下游任务,这与绿色低碳的发展理念极不相符.因此,近年来,许多... 代码表征旨在融合源代码的特征,以获取其语义向量,在基于深度学习的代码智能中扮演着重要角色.传统基于手工的代码表征依赖领域专家的标注,繁重耗时,且无法灵活地复用于特定下游任务,这与绿色低碳的发展理念极不相符.因此,近年来,许多自监督学习的编程语言大规模预训练模型(如CodeBERT)应运而生,为获取通用代码表征提供了有效途径.这些模型通过预训练获得通用的代码表征,然后在具体任务上进行微调,取得了显著成果.但是,要准确表示代码的语义信息,需要融合所有抽象层次的特征(文本级、语义级、功能级和结构级).然而,现有模型将编程语言仅视为类似于自然语言的普通文本序列,忽略了它的功能级和结构级特征.因此,旨在进一步提高代码表征的准确性,提出了基于多模态对比学习的代码表征增强的预训练模型(representation enhanced contrastive multimodal pretraining,REcomp).REcomp设计了新的语义级-结构级特征融合算法,将它用于序列化抽象语法树,并通过多模态对比学习的方法将该复合特征与编程语言的文本级和功能级特征相融合,以实现更精准的语义建模.最后,在3个真实的公开数据集上进行了实验,验证了REcomp在提高代码表征准确性方面的有效性. 展开更多
关键词 代码表征 预训练模型 多模态 对比学习
在线阅读 下载PDF
基于运动引导图卷积网络的人体动作识别 被引量:8
10
作者 李晶晶 黄章进 邹露 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第7期1077-1086,共10页
针对当前基于骨架的人体动作识别方法无法建模关节点之间依赖关系随时间的变化,以及难以实现跨时空信息交互的问题,提出基于运动引导图卷积网络的人体动作识别方法.首先根据骨架序列提取其高级运动特征;然后在时间维度上学习运动相关图... 针对当前基于骨架的人体动作识别方法无法建模关节点之间依赖关系随时间的变化,以及难以实现跨时空信息交互的问题,提出基于运动引导图卷积网络的人体动作识别方法.首先根据骨架序列提取其高级运动特征;然后在时间维度上学习运动相关图,并通过对预定义图和可学习图优化建模不同时期的关节依赖关系,即运动引导拓扑图;再利用运动引导拓扑图进行空间图卷积,将运动信息融合到空间图卷积以实现跨时空信息交互;最后交替使用时空图卷积,实现人体动作识别.在数据集NTU-RGB+D和NTU-RGB+D120上与MS-G3D等图卷积网络进行对比实验的结果表明,所提方法在NTU-RGB+D的跨对象和跨视角上的准确率分别提升到92.3%和96.7%,在NTU-RGB+D 120的跨对象和跨场景上的准确率分别提升到88.8%和90.2%. 展开更多
关键词 动作识别 图卷积 人体骨架 运动引导拓扑图
在线阅读 下载PDF
众数自适应Lasso回归的统计推断 被引量:3
11
作者 叶五一 许寅聪 焦守坤 《应用概率统计》 CSCD 北大核心 2024年第1期107-121,共15页
本文给出了自适应Lasso的众数回归模型,用来对众数回归模型的变量进行选择.对比传统的均值回归模型和中位数回归模型,众数回归在解决重尾、多峰分布问题时更加稳健.众数回归模型的主要估计方法是核估计方法,当自变量的数目较大时,该方... 本文给出了自适应Lasso的众数回归模型,用来对众数回归模型的变量进行选择.对比传统的均值回归模型和中位数回归模型,众数回归在解决重尾、多峰分布问题时更加稳健.众数回归模型的主要估计方法是核估计方法,当自变量的数目较大时,该方法会产生难以忽略的计算误差.本文在核估计方法的众数回归模型基础上添加惩罚项,并通过自适应Lasso方法进行参数估计,有效的剔除了贡献率低的自变量,同时提高了计算的准确性.本文详细阐述了该计算方法,并在一些正则条件下,给出了模型的参数的估计方法和估计值的渐近正态性.模拟实验和实证分析研究了所提方法在有限样本下的性质.对比均值回归模型和传统的众数回归模型,添加自适应Lasso惩罚项的众数回归模型极大地提高了参数估计的准确性. 展开更多
关键词 众数 核函数 EM算法 自适应Lasso回归
在线阅读 下载PDF
基于大语言模型隐含语义增强的细粒度虚假新闻检测方法 被引量:2
12
作者 柯婧 谢哲勇 +3 位作者 徐童 陈宇豪 廖祥文 陈恩红 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1250-1260,共11页
随着生成式人工智能技术的发展,许多领域都得到了帮助与发展,但与此同时虚假信息的构建与传播变得更加简单,虚假信息的检测也随之难度增加.先前的工作主要聚焦于语法问题、内容煽动性等方面的特点,利用深度学习模型对虚假新闻内容进行建... 随着生成式人工智能技术的发展,许多领域都得到了帮助与发展,但与此同时虚假信息的构建与传播变得更加简单,虚假信息的检测也随之难度增加.先前的工作主要聚焦于语法问题、内容煽动性等方面的特点,利用深度学习模型对虚假新闻内容进行建模.这样的方式不仅缺乏对内容本身的判断,还无法回溯模型的判别原因.针对上述问题提出一种基于大语言模型隐含语义增强的细粒度虚假新闻检测方法.该方法充分挖掘并利用了现有的生成式大语言模型所具有的总结与推理能力,按照主干事件、细粒度次要事件和隐含信息推理的顺序进行层级式推导,逐步判别新闻的真实性.通过分解任务的方式,该方法最大程度发挥了模型的能力,提高了对虚假新闻的捕获能力,同时该方法也具有一定的可解释性,能够为检测提供判别依据. 展开更多
关键词 社交媒体 虚假新闻检测 大语言模型 事件抽取 知识增强
在线阅读 下载PDF
基于双模态智能鞋的偏瘫患者下肢肌力定量评估
13
作者 龙华君 李洁 +2 位作者 李瑞 刘新峰 程敬原 《中国科学技术大学学报》 CAS CSCD 北大核心 2024年第1期47-55,46,I0002,共11页
卒中可导致患者下肢运动能力受损和偏瘫。准确评估下肢运动能力对诊断和康复很重要。为了使每次测试都可随时追溯,并避免主观性,我们使用配备有压敏鞋垫和惯性传感单元的双模态智能鞋进行数字化评估,并设计了一个包括左转弯和右转弯的5... 卒中可导致患者下肢运动能力受损和偏瘫。准确评估下肢运动能力对诊断和康复很重要。为了使每次测试都可随时追溯,并避免主观性,我们使用配备有压敏鞋垫和惯性传感单元的双模态智能鞋进行数字化评估,并设计了一个包括左转弯和右转弯的5米步行测试方案。数据收集自23名患者和17名健康受试者。两位医生对所有患者的下肢的运动能力进行了观察,并使用医学研究委员会的五级肌肉检查量表进行了评估。两位医生对同一患者的平均评分被用作真实值。使用我们开发的特征集,在对患者和健康受试者进行分类时达到了100%的准确性。对于患者的肌肉力量,使用我们的特征集和回归方法获得了0.143的平均绝对误差和0.395的最大误差,与每位医生的评分相比(平均绝对误差:0.217,最大误差:0.5),更接近实际情况。因此,我们验证了使用这种智能鞋客观准确地评估中风患者下肢肌肉力量的可能性。 展开更多
关键词 卒中 机器学习 智能鞋 下肢肌力
在线阅读 下载PDF
基于语境与文本结构融合的中文拼写纠错方法
14
作者 刘昌春 张凯 +2 位作者 包美凯 刘烨 刘淇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期451-463,共13页
在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音... 在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音相似度以及微调过的预训练BERT模型,能自动提取句子语义并利用汉字的相似性.具体地,通过对预训练的中文BERT模型进行微调,使之能适应下游的中文拼写纠错任务;同时,利用表意文字描述序列获取汉字的树形结构作为视觉信息,采用汉字的拼音序列作为语音信息;最后,利用编辑距离得出汉字的视觉和语音相似度,并将这些相似度数据与微调过的BERT模型融合,以实现纠错任务.在SIGHAN标准数据集上的测试结果显示,和基准模型相比,提出的ECS方法其F1-score提升巨大,在检错层面上提升2.1%,在纠错层面上提升2.8%,也验证了将汉字的语境信息、视觉信息与语音信息融合用于中文拼写纠错任务的适用性. 展开更多
关键词 中文拼写纠错 BERT 汉字语音相似度 汉字视觉相似度 预训练模型
在线阅读 下载PDF
Predicting the assembly/disassembly order of protein complexes via coarse-grained simulations
15
作者 Yunxiao Lu Xin Liu Zhiyong Zhang 《中国科学技术大学学报》 CSCD 北大核心 2024年第12期7-15,I0002,I0008,共11页
The assembly of a protein complex is very important for its biological function,which can be investigated by determining the order of assembly/disassembly of its protein subunits.Although static structures of many pro... The assembly of a protein complex is very important for its biological function,which can be investigated by determining the order of assembly/disassembly of its protein subunits.Although static structures of many protein com-plexes are available in the protein data bank,their assembly/disassembly orders of subunits are largely unknown.In addition to experimental techniques for studying subcomplexes in the assembly/disassembly of a protein complex,computational methods can be used to predict the assembly/disassembly order.Since sampling is a nontrivial issue in simulating the assembly/disassembly process,coarse-grained simulations are more efficient than atomic simulations are.In this work,we developed computational protocols for predicting the assembly/disassembly orders of protein complexes via coarse-grained simulations.The protocols were illustrated via two protein complexes,and the predicted assembly/disassembly orders were consistent with the available experimental data. 展开更多
关键词 protein complexes assembly/disassembly order coarse-grained simulations native contacts
在线阅读 下载PDF
基于百度指数的传统印染技艺公众关注度分析 被引量:12
16
作者 陈秀芳 胡云鹤 《丝绸》 CAS CSCD 北大核心 2020年第4期40-45,共6页
以扎染技艺、蜡染技艺和蓝印花布印染技艺为研究对象,基于百度搜索指数分析公众对传统印染技艺的关注度。通过Holt-Winters模型进行序列分解,分析公众关注度的变化趋势和周期特点。结果表明:公众对扎染关注度逐年上升,对蜡染关注度在波... 以扎染技艺、蜡染技艺和蓝印花布印染技艺为研究对象,基于百度搜索指数分析公众对传统印染技艺的关注度。通过Holt-Winters模型进行序列分解,分析公众关注度的变化趋势和周期特点。结果表明:公众对扎染关注度逐年上升,对蜡染关注度在波动上升后几乎维持不变,对蓝印花布关注度在缓慢上升后有所下降,三者以年为周期波动的规律明显。SARIMA模型对三个序列的预测结果表明:扎染的公众关注度将持续增长,蜡染关注度将基本维持在原有水平,蓝印花布关注度将略有下降。文章从国家政策、人群分布、工艺特点等方面对两种模型所得结论进行解释分析,并给出合理化建议。 展开更多
关键词 百度指数 Holt-Winters模型 SARIMA模型 扎染 蜡染 蓝印花布
在线阅读 下载PDF
MSML-BERT模型的层级多标签文本分类方法研究 被引量:9
17
作者 黄伟 刘贵全 《计算机工程与应用》 CSCD 北大核心 2022年第15期191-201,共11页
层级多标签文本分类相比普通的多标签文本分类更具有挑战性,因为文本的多个标签组织成树状的层次结构。当前方法使用相同的模型结构来预测不同层级的标签,忽略了它们之间的差异性和多样性。并且没有充分地建模层级依赖关系,造成各层级... 层级多标签文本分类相比普通的多标签文本分类更具有挑战性,因为文本的多个标签组织成树状的层次结构。当前方法使用相同的模型结构来预测不同层级的标签,忽略了它们之间的差异性和多样性。并且没有充分地建模层级依赖关系,造成各层级标签尤其是下层长尾标签的预测性能差,且会导致标签不一致性问题。为了解决以上问题,将多任务学习架构引入,提出了MSML-BERT模型。该模型将标签结构中每一层的标签分类网络视为一个学习任务,通过任务间知识的共享和传递,提高各层级任务的性能。基于此,设计了多尺度特征抽取模块,用于捕捉不同尺度和粒度的特征以形成不同层级需要的各种知识。进一步,设计了多层级信息传播模块,用于充分建模层级依赖,在不同层级之间传递知识,以帮助下层任务。在该模块中,设计了层次化门控机制,为了过滤不同层级任务之间的知识流动。在RCV1-V2、NYT和WOS数据集上进行了充分的实验,结果显示该模型的总体表现尤其是在下层长尾标签上的表现超过了其他主流模型,并且能维持较低的标签不一致比率。 展开更多
关键词 层级多标签文本分类 多任务学习架构 BERT 多尺度特征抽取模块 多层级信息传播模块
在线阅读 下载PDF
融合通用题目表征学习的神经知识追踪方法研究 被引量:5
18
作者 魏思 沈双宏 +4 位作者 黄振亚 刘淇 陈恩红 苏喻 王士进 《中文信息学报》 CSCD 北大核心 2022年第4期146-155,共10页
知识追踪是一项评估学生学习过程中知识状态演变情况的任务。现有大多数方法都致力于探索不同的知识状态评估方法。然而,答题过程中更为基础的题目表征受到的关注相对较少。因此,该文提出了一种融合通用题目表征学习的神经知识追踪框架... 知识追踪是一项评估学生学习过程中知识状态演变情况的任务。现有大多数方法都致力于探索不同的知识状态评估方法。然而,答题过程中更为基础的题目表征受到的关注相对较少。因此,该文提出了一种融合通用题目表征学习的神经知识追踪框架。具体地,该文首先设计了一种通用的题目表征方法,通过知识点、难度和题目独有特征来区分题目。然后,采用现有知识追踪方法同时捕捉知识状态演变并学习题目表征。最后,利用知识状态和待回答题目表征的内积来模拟回答过程。在三个真实数据集上的实验结果表明,该文方法可以在知识追踪过程中学习精确有效的题目表征,并且显著提升了基线知识追踪方法的性能,使其能够超过现有最优方法。 展开更多
关键词 题目表征 知识追踪 深度学习 数据挖掘
在线阅读 下载PDF
基于联邦学习的网络化ICU呼吸机和镇静剂管理方法 被引量:3
19
作者 曹林霄 刘佳 +4 位作者 朱怡飞 周浩泉 龚伟 于卫华 李朝友 《计算机科学》 CSCD 北大核心 2023年第10期165-175,共11页
医疗物联网设备的激增和丰富的医疗数据为智慧医疗提供了新的可能。重症监护室(ICU)的病人依靠众多医疗边缘设备来持续监测管理患者的健康状况。在ICU常见的治疗干预措施中,有创机械通气和镇静剂的注射多用于维持患者的呼吸功能,提高治... 医疗物联网设备的激增和丰富的医疗数据为智慧医疗提供了新的可能。重症监护室(ICU)的病人依靠众多医疗边缘设备来持续监测管理患者的健康状况。在ICU常见的治疗干预措施中,有创机械通气和镇静剂的注射多用于维持患者的呼吸功能,提高治疗质量,而现有的治疗干预措施很大程度上依赖于医生的判断。文中提出了一种基于联邦学习的临床辅助决策方法——MFed,可以基于网络化ICU分布式协作学习最佳干预政策。该方法应用基于差分隐私的联邦学习方法,打破了医疗数据隐私方面的限制以及医疗数据孤岛的窘境;用分布鲁棒优化确保最坏情况下的性能并结合伪孪生网络实现自适应地滤除噪声数据。最后,在现实ICU数据集上的实验表明,与其他最先进的基线相比,所提方法的准确率提高了36.75%。 展开更多
关键词 联邦学习 医疗物联网 分布式鲁棒优化 医疗数据噪声 医疗数据隐私
在线阅读 下载PDF
基于用户重购行为的产品推荐方法 被引量:6
20
作者 耿杰 刘春丽 +4 位作者 魏雪梅 程明月 袁昆 李洋 刘业政 《计算机研究与发展》 EI CSCD 北大核心 2023年第8期1795-1807,共13页
重复购买是消费者日常消费决策中的常见现象,考虑用户重购行为对于提升产品个性化推荐准确性至关重要.然而针对用户重购行为建模和预测的研究工作相对较少,还有很多问题有待解决.已有推荐技术主要通过深度挖掘产品、用户或时间某一层面... 重复购买是消费者日常消费决策中的常见现象,考虑用户重购行为对于提升产品个性化推荐准确性至关重要.然而针对用户重购行为建模和预测的研究工作相对较少,还有很多问题有待解决.已有推荐技术主要通过深度挖掘产品、用户或时间某一层面信息来进行重购产品推荐,忽略了对多层次信息融合建模方法的研究,同时也忽略了重购推荐结果的可解释性需求.因此,融合多层次用户偏好信息,构建了具有双层注意力机制的可解释用户重复消费推荐方法.该方法融合注意力机制和指针生成网络,多层次提取并学习用户重购偏好,同时基于信息处理理论构建S型用户重购动态偏好函数,融合产品流行度信息进行重购产品和新颖产品的混合推荐,提高了模型可解释性和准确性.真实数据集上的实验结果表明,所提方法在多个性能指标上都优于对比方法,且学习出的参数具备较好的可解释性.此外,通过回归分析验证了S型重购动态偏好函数的可信性,进一步增强了理论的可解释性. 展开更多
关键词 产品推荐 重复消费 可解释性 注意力机制 信息处理理论
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部