期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
人工经验+LLMs智能:基于支持策略规划的心理健康支持生成框架
1
作者 陈启 刘德喜 +3 位作者 张丽园 万齐智 刘喜平 赵芸 《中文信息学报》 北大核心 2025年第1期153-166,共14页
心理健康支持旨在帮助求助者应对心理健康问题。使用大语言模型(Large Language Models,LLMs)生成心理健康支持回复,有助于减轻心理咨询师的负担,提高心理健康支持的效率。尽管近期关于思维链(Chain-of-Thought,CoT)Prompting的研究旨... 心理健康支持旨在帮助求助者应对心理健康问题。使用大语言模型(Large Language Models,LLMs)生成心理健康支持回复,有助于减轻心理咨询师的负担,提高心理健康支持的效率。尽管近期关于思维链(Chain-of-Thought,CoT)Prompting的研究旨在指导LLMs自动规划活动,取得了一定的成功,但这些研究没有对以往的经验进行提炼,导致LLMs生成的内容缺乏针对性和共情性,在心理健康支持场景下,这一问题尤为突出。为解决这个问题,该文定义了一种基于支持策略规划的心理健康支持生成框架S2P-MSG。该框架利用小语言模型(Small Language Models,SLMs)学习心理咨询师回复中支持策略规划的“人工经验”,生成多条动态策略链;使用Prompting方法引导LLMs选择最恰当的动态策略链,激发LLMs“智能”;并基于选中的动态策略链引导LLMs生成心理健康支持回复。该文在广泛使用的PsyQA数据集上进行了丰富的实验。实验结果表明,与SLMs模型及常见的Prompting方法相比,S2P-MSG框架生成的回复具有更高的相关性、帮助性和共情性。实验还发现,在应对心理健康风险水平较高和自我披露程度较高的求助帖时,S2P-MSG框架展现出了更为优异的性能。 展开更多
关键词 大语言模型 心理健康支持 支持策略
在线阅读 下载PDF
基于深度学习的篇章级事件抽取综述
2
作者 胡蓉 万常选 +2 位作者 万齐智 刘德喜 刘喜平 《计算机学报》 北大核心 2025年第2期381-406,共26页
篇章级事件抽取是自然语言处理的重要任务且富有挑战,当前涌现了很多优秀的研究成果。尽管国内外存在少量篇章级事件抽取综述,但存在一些局限:(1)按文献采用的具体技术或任务实现步骤对现有研究成果进行分类,未深入分析现有研究成果间... 篇章级事件抽取是自然语言处理的重要任务且富有挑战,当前涌现了很多优秀的研究成果。尽管国内外存在少量篇章级事件抽取综述,但存在一些局限:(1)按文献采用的具体技术或任务实现步骤对现有研究成果进行分类,未深入分析现有研究成果间的关联与区别,未深刻理解现有研究成果分别致力于解决哪些问题;(2)简单介绍现有数据集,未能正确认识每个数据集的特点及带来的任务挑战。由于每个数据集侧重点不同,研究者们致力于解决不同的问题,因此现有梳理方式未能清晰地展示不同数据集下不同研究问题的研究进展。为此,本文重新梳理篇章级事件抽取的2个(子)任务的研究成果。首先,针对2个任务,分别明确任务目标,分析解决任务的基本思路,总结现有研究进展(基于哪些数据集解决了哪些问题)。然后,总结对应数据集的特点,归纳任务面临的挑战,再深入分析具体研究方法,并图示化展示推进情况。最后,结合有待继续攻破的问题,讨论篇章级事件抽取未来发展趋势。 展开更多
关键词 篇章级事件抽取 信息抽取 事件抽取数据集 事件论元抽取 深度学习
在线阅读 下载PDF
融合层注意力机制的多视角图对比学习推荐方法
3
作者 钱忠胜 黄恒 +1 位作者 朱辉 刘金平 《计算机研究与发展》 北大核心 2025年第1期160-178,共19页
图对比学习因其可有效缓解数据稀疏问题被广泛应用在推荐系统中.然而,目前大多数基于图对比学习的推荐算法均采用单一视角进行学习,这极大地限制了模型的泛化能力,且图卷积网络本身存在的过度平滑问题也影响着模型的稳定性.基于此,提出... 图对比学习因其可有效缓解数据稀疏问题被广泛应用在推荐系统中.然而,目前大多数基于图对比学习的推荐算法均采用单一视角进行学习,这极大地限制了模型的泛化能力,且图卷积网络本身存在的过度平滑问题也影响着模型的稳定性.基于此,提出一种融合层注意力机制的多视角图对比学习推荐方法.一方面,该方法提出2种不同视角下的3种对比学习,在视图级视角下,通过对原始图添加随机噪声构建扰动增强视图,利用奇异值分解(singular value decomposition)重组构建SVD增强视图,对这2个增强视图进行视图级对比学习;在节点视角下,利用节点间的语义信息分别进行候选节点和候选结构邻居对比学习,并将3种对比学习辅助任务和推荐任务进行多任务学习优化,以提高节点嵌入的质量,从而提升模型的泛化能力.另一方面,在图卷积网络学习用户和项目的节点嵌入时,采用层注意力机制的方式聚合最终的节点嵌入,提高模型的高阶连通性,以缓解过度平滑问题.在4个公开数据集LastFM,Gowalla,Ifashion,Yelp上与10个经典模型进行对比,结果表明该方法在Recall,Precision,NDCG这3个指标上分别平均提升3.12%,3.22%,4.06%,这说明所提方法是有效的. 展开更多
关键词 层注意力机制 对比学习 图卷积网络 多任务学习 推荐系统
在线阅读 下载PDF
利用伪重叠判定机制的多层循环GCN跨域推荐
4
作者 钱忠胜 王亚惠 +2 位作者 俞情媛 范赋宇 付庭峰 《软件学报》 北大核心 2025年第9期4327-4348,共22页
跨域推荐(cross-domain recommendation,CDR)通过将密集评分辅助域中的用户-项目评分模式迁移到稀疏评分目标域中的评分数据集,以缓解冷启动现象,近年来得到广泛研究.多数CDR算法所采用的基于单域推荐的聚类方法未有效利用重叠信息,无... 跨域推荐(cross-domain recommendation,CDR)通过将密集评分辅助域中的用户-项目评分模式迁移到稀疏评分目标域中的评分数据集,以缓解冷启动现象,近年来得到广泛研究.多数CDR算法所采用的基于单域推荐的聚类方法未有效利用重叠信息,无法充分适应跨域推荐,导致聚类结果不准确.在跨域推荐中,图卷积网络方法(graph convolution network,GCN)可充分利用节点间的关联,提高推荐的准确性.然而,基于GCN的跨域推荐往往使用静态图学习节点嵌入,忽视了用户的偏好会随推荐场景发生变化的情况,导致模型在面对不同的推荐任务时表现不佳,无法有效缓解数据稀疏性.基于此,提出一种利用伪重叠判定机制的多层循环GCN跨域推荐模型.首先,在社区聚类算法Louvain的基础上充分运用重叠数据,设计一个伪重叠判定机制,据此挖掘用户的信任关系以及相似用户社区,从而提高聚类算法在跨域推荐中的适应能力及其准确性.其次,提出一个包含嵌入学习模块和图学习模块的多层循环GCN,学习动态的域共享特征、域特有特征以及动态图结构,并通过两模块的循环增强,获取最新用户偏好,从而缓解数据稀疏问题.最后,采用多层感知器(multi-layer perceptron,MLP)对用户-项目交互建模,得到预测评分,通过与12种相关模型在4组数据域上的对比结果发现,所提方法是高效的,在MRR、NDCG、HR指标上分别平均提高5.47%、3.44%、2.38%. 展开更多
关键词 跨域推荐 伪重叠判定机制 图卷积网络 社区聚类 推荐系统
在线阅读 下载PDF
利用GRU双分支信息协同增强的长尾推荐模型
5
作者 钱忠胜 肖双龙 +2 位作者 朱辉 王晓闻 刘金平 《计算机科学与探索》 北大核心 2025年第2期476-489,共14页
长尾现象在序列推荐系统中长期存在,包括长尾用户和长尾项目两个方面。虽然现有许多研究缓解了序列推荐系统中的长尾问题,但大部分只是单方面地关注长尾用户或长尾项目。然而,长尾用户和长尾项目问题常常同时存在,只考虑其中一方会导致... 长尾现象在序列推荐系统中长期存在,包括长尾用户和长尾项目两个方面。虽然现有许多研究缓解了序列推荐系统中的长尾问题,但大部分只是单方面地关注长尾用户或长尾项目。然而,长尾用户和长尾项目问题常常同时存在,只考虑其中一方会导致另一方性能不佳,且未关注到长尾用户、长尾项目各自的信息匮乏问题。提出一种利用GRU双分支信息协同增强的长尾推荐模型(long-tail recommendation model utilizing gated recurrent unit dualbranch information collaboration enhancement,LT-GRU),从用户与项目两个方面共同缓解长尾问题,并通过协同增强的方式丰富长尾信息。该模型由长尾用户和长尾项目双分支组成,每个分支分别负责各自的信息处理,并相互训练以充实另一方的信息。同时,引入一种偏好机制,通过演算用户与项目的影响因子,以动态调整用户偏好与项目热度,进一步缓解长尾推荐中信息不足问题。在Amazon系列的6个真实数据集上与6种经典模型进行实验对比,相较于长尾推荐模型中最优的结果,所提模型LT-GRU在HR与NDCG两个指标上分别平均提高2.49%、3.80%。这表明,在不牺牲头部用户和热门项目推荐性能的情况下,有效地缓解了长尾用户和长尾项目问题。 展开更多
关键词 推荐系统 长尾推荐 信息协同增强 门控循环单元(GRU)
在线阅读 下载PDF
基于正负例思维链的表格-文本混合金融数据自动问答方法
6
作者 李希 刘喜平 +3 位作者 舒晴 谭钊 万常选 刘德喜 《中文信息学报》 北大核心 2025年第7期102-113,共12页
金融领域表格-文本混合数据的自动问答面临复杂数值推理等挑战。针对这一挑战,该文提出了正负例思维链方法。思维链技术通过选取演示样本,搭配提示指令,能有效提升大语言模型的多步骤推理能力。但思维链的演示样本多为人工制作,费时费力... 金融领域表格-文本混合数据的自动问答面临复杂数值推理等挑战。针对这一挑战,该文提出了正负例思维链方法。思维链技术通过选取演示样本,搭配提示指令,能有效提升大语言模型的多步骤推理能力。但思维链的演示样本多为人工制作,费时费力,且影响大模型推理。受正例和负例对学习效果影响的启发,该文从大模型的推理结果中抽取样本,构建正例样本池和负例样本池。采用静态和动态相结合的策略选取不同类型的演示样本:选择最佳正例能够保障大语言模型输出的准确率,选择相似负例能够指导大语言模型规避错误推理。实验结果显示,该方法在FinQA数据集上的准确率提高了3.6%,在FinQA-fix数据集上的准确率提高了12.73%,显著提升了大模型的数值推理能力。 展开更多
关键词 思维链 正负例 表文混合问答 大语言模型 数值推理
在线阅读 下载PDF
融合词先验知识的MOOCs课程概念抽取
7
作者 聂凡 刘德喜 +3 位作者 张子靖 刘喜平 廖国琼 万常选 《中文信息学报》 北大核心 2025年第1期101-111,120,共12页
针对中文大规模开放在线课程(Massive Open Online Courses,MOOCs)视频字幕中课程概念词性丰富、领域特性显著等特点,该文提出一种融合词性、词性规则和词典等词先验知识(Word Prior Knowledge,WPK)的课程概念抽取模型WPK-MCC。该模型... 针对中文大规模开放在线课程(Massive Open Online Courses,MOOCs)视频字幕中课程概念词性丰富、领域特性显著等特点,该文提出一种融合词性、词性规则和词典等词先验知识(Word Prior Knowledge,WPK)的课程概念抽取模型WPK-MCC。该模型首先通过BERT以及字符嵌入的方式获得包含上下文和词性信息的字符表示,再利用词典匹配当前字符所在窗口的字符串,构建当前字符的4个词汇集群(当前字符在词的开头、中间、结尾,以及当前字符单独成词),并通过词性规则控制每个词的贡献权重。此外,考虑到课程概念在MOOCs中有一定的重复性,WPK-MCC模型利用当前句子所在视频字幕的上下文信息,提升课程概念抽取的效果。在MoocData数据集上的实验结果表明,WPK-MCC模型对课程概念实体抽取的F_(1)值达到89.42%,优于SoftLexicon等先进的模型。消融实验显示,词性、规则和词典等词先验知识以及上下文全局信息对WPK-MCC模型的帮助较大,去除词先验知识和上下文全局信息后,WPK-MCC的F_(1)值下降了1.13%。 展开更多
关键词 课程概念抽取 词先验知识 词汇集群 全局信息
在线阅读 下载PDF
基于知识迁移的情感—原因对抽取
8
作者 赵凤园 刘德喜 +3 位作者 万齐智 刘喜平 廖国琼 万常选 《中文信息学报》 北大核心 2025年第1期121-132,共12页
现有的情感—原因对抽取模型均没有通过加入外部知识来提升情感—原因对的抽取效果。该文提出基于知识迁移的情感—原因对抽取模型(ECPE-KT),采用知识库获取文本的显性知识编码;随后引入外部情感分类语料库迁移得到子句的隐性知识编码;... 现有的情感—原因对抽取模型均没有通过加入外部知识来提升情感—原因对的抽取效果。该文提出基于知识迁移的情感—原因对抽取模型(ECPE-KT),采用知识库获取文本的显性知识编码;随后引入外部情感分类语料库迁移得到子句的隐性知识编码;最后拼接两个知识编码,加入情感(原因)子句预测概率及相对位置,搭配Transformer机制融合上下文,并采用窗口机制优化计算压力,实现情感—原因对抽取。在ECPE数据集上的实验结果表明,该文提出的方法超过当前最先进的模型ECPE-2D。 展开更多
关键词 情感—原因对抽取 知识辅助 相对位置 预测概率
在线阅读 下载PDF
融合外部知识与证据的场景图注意力网络多模态谣言检测
9
作者 黄学坚 马廷淮 +3 位作者 荣欢 王根生 廖国琼 刘德喜 《计算机学报》 北大核心 2025年第9期2159-2180,共22页
社交媒体上谣言的泛滥对社会造成了严重的负面影响。随着多模态内容在社交媒体中的迅速增长,多模态谣言检测受到了越来越多的关注。目前,大多数方法主要聚焦于学习各个模态的特征,并通过特征融合实现不同模态信息的互补。然而,这些方法... 社交媒体上谣言的泛滥对社会造成了严重的负面影响。随着多模态内容在社交媒体中的迅速增长,多模态谣言检测受到了越来越多的关注。目前,大多数方法主要聚焦于学习各个模态的特征,并通过特征融合实现不同模态信息的互补。然而,这些方法存在两个关键问题:(1)不同特征空间之间的跨模态关联难以有效捕捉图文细粒度语义的一致性;(2)单纯依赖图文内容难以识别一些造谣者精心设计的深层语义不匹配的谣言。为此,本文提出了融合证据与知识的场景图注意力网络的多模态谣言检测方法。首先,基于预训练的语言和视觉模型,分别提取文本语义和图像视觉特征,并通过误差级别分析提取图像篡改特征;其次,构建了一种基于反事实推理的无偏场景图生成方法和微调的Flan-T5模型,分别将图像和文本转化为视觉场景图和文本场景图,并利用知识蒸馏从知识库中提取场景图实体的相关知识,以增强模型对场景图的深层语义理解;接着,设计了一种融合场景关系特征的场景图注意力网络,以挖掘图文间的细粒度语义匹配特征;最后,从互联网中筛选与待检验帖子相关的文本和图片证据,并通过交叉注意力机制实现证据与待检验帖子的交互对齐,提升模型对深层语义不匹配谣言的识别能力。实验表明,在Weibo和Twitter两个真实社交网络数据集上,本文提出的方法在宏准确率上比最佳基线方法分别提高了1.6%和2.2%,而在谣言类别的F1值上,分别提高了2.6%和3.0%。实验数据和代码已在GitHub上开源共享(https://github.com/xuejianhuang/SGKE)。 展开更多
关键词 多模态谣言检测 场景图注意力网络 图文语义匹配 多模态证据对齐 知识增强
在线阅读 下载PDF
梯度递归模型优化注入系数的全色锐化算法
10
作者 戴欢 杨勇 +2 位作者 卢航远 黄淑英 陈常杰 《西安电子科技大学学报》 北大核心 2025年第2期143-155,共13页
遥感图像全色锐化是通过将全色PAN图像和多光谱MS图像进行融合得到高空间分辨率的HRMS图像,有助于遥感图像在地物识别、土地监测等领域的应用。现有的基于多分辨率分析的全色锐化方法未考虑图像梯度之间的关系,导致提取源图像的细节特... 遥感图像全色锐化是通过将全色PAN图像和多光谱MS图像进行融合得到高空间分辨率的HRMS图像,有助于遥感图像在地物识别、土地监测等领域的应用。现有的基于多分辨率分析的全色锐化方法未考虑图像梯度之间的关系,导致提取源图像的细节特征不准确和融合结果的空间失真。为了解决上述问题,提出一种基于梯度递归模型优化注入系数的全色锐化方法。该方法首先分析源图像和融合图像的梯度关系,构建全尺度下理想HRMS图像与源图像之间的递归模型;然后设计梯度递归算法对注入系数进行迭代求解;最后利用该注入系数优化经多分辨率分析方法得到细节,并将优化后的细节注入到MS图像中得到最优的HRMS图像。方法在Pléiades、IKONOS和WorldView-3这3个数据集上进行了仿真实验和真实实验,并与8种不同类型的方法进行了对比分析,仿真实验结果表明,方法的ERGAS值相较于性能第二的方法,分别提高了3.59%,4.46%和2.18%;真实实验的QNR值在Pléiades和IKONOS数据集上达到最优,相对于性能第二的方法分别提高了3.83%,1.92%,在WorldView-3数据集上次优。在消融实验中,相较于无梯度域的全色锐化方法,ERGAS值分别提高了11.33%,14.08%和1.95%。实验结果表明,方法在客观指标上均取得了较为满意的效果;主观视觉效果上能够更好地融合MS图像的光谱信息和PAN图像的空间信息,从而显著提升MS图像的全色锐化质量,同时文中方法具有较快的计算效率。 展开更多
关键词 遥感 图像融合 全色锐化 注入系数 梯度 递归 迭代优化
在线阅读 下载PDF
披露主题引导的在线心理健康支持回答生成
11
作者 张丽园 刘德喜 +3 位作者 陈启 彭文忠 万齐智 刘喜平 《小型微型计算机系统》 北大核心 2025年第10期2351-2363,共13页
由于在线平台具有便捷、易获得、支持匿名等特点,人们倾向在平台上披露心理问题并寻求帮助.现有研究发现显式标注支持者支持策略能够提升问答模型自动生成心理健康支持回答的质量,但较少探索求助者披露主题对心理健康支持回答效果的影响... 由于在线平台具有便捷、易获得、支持匿名等特点,人们倾向在平台上披露心理问题并寻求帮助.现有研究发现显式标注支持者支持策略能够提升问答模型自动生成心理健康支持回答的质量,但较少探索求助者披露主题对心理健康支持回答效果的影响.该文认为求助者披露主题与支持者支持策略存在关联,显式标注披露主题有助于引导问答模型选择合适的支持策略,进而提升心理健康支持回答的生成质量.因此,该文首先基于PsyQA数据集,标注了求助者披露主题,构建了首个包含披露主题和支持策略的中文在线心理健康支持问答数据集PtsQA.其次,该文分析了披露主题的词汇特征、分布规律和转换模式,并基于关联规则挖掘验证了披露主题与支持策略之间存在关联关系.最后,为探索披露主题对生成心理健康支持回答效果的影响,该文将披露主题显式地融入问题中作为问答模型的输入,以生成相应的支持策略和回答内容.实验结果表明,披露主题的加入有助于问答模型有效学习并预测合适的支持策略,在线心理健康支持回答的生成效果得到显著提升. 展开更多
关键词 在线心理健康支持 披露主题 支持策略 问答模型
在线阅读 下载PDF
方面级情感分析研究综述
12
作者 徐放 尹伊纯 吴方君 《计算机工程与应用》 北大核心 2025年第19期60-73,共14页
随着情感分析的不断发展,提出了侧重于对评价对象及其属性进行细粒度情感分析的方面级情感分析,受到了研究者越来越多的关注。与传统的情感分析相比,方面级情感分析能够准确地反映评价对象及其意见,帮助企业有针对性地改进,助力企业高... 随着情感分析的不断发展,提出了侧重于对评价对象及其属性进行细粒度情感分析的方面级情感分析,受到了研究者越来越多的关注。与传统的情感分析相比,方面级情感分析能够准确地反映评价对象及其意见,帮助企业有针对性地改进,助力企业高质量发展。根据使用方法的不同,将其划分为基于规则的方法、基于注意力的方法、基于机器阅读理解的方法、基于序列标注的方法以及基于生成的方法,并对现有的文献进行了分析和总结;介绍方面级情感分析的新任务:多模态、隐式和跨领域方面级情感分析;给出了常用数据资源,如SemEval系列、MAMS、ACOS和CMU-MOSEI;对面临的挑战和未来的研究方向进行了探讨,指出需要解决数据量小、领域单一、数据质量难以评估的问题,加强对复杂语句和多模态的方面级情感分析,如何更好地利用预训练语言模型为更深入的研究提供思路。 展开更多
关键词 机器学习 深度学习 方面级情感分析
在线阅读 下载PDF
面向压缩域数据盲提取的多层循环预测可逆隐藏方案
13
作者 温文媖 杨育衡 +2 位作者 罗新宇 张玉书 方玉明 《计算机学报》 北大核心 2025年第4期910-926,共17页
近年来,压缩感知(Compressive Sensing,CS)域的可逆数据隐藏已得到广泛研究。针对现有CS域可逆数据隐藏方案不能同时实现秘密信息盲提取、测量值直接可用问题,借助CS渐进恢复特性和预测误差扩展方法,本文提出一种面向压缩域数据盲提取... 近年来,压缩感知(Compressive Sensing,CS)域的可逆数据隐藏已得到广泛研究。针对现有CS域可逆数据隐藏方案不能同时实现秘密信息盲提取、测量值直接可用问题,借助CS渐进恢复特性和预测误差扩展方法,本文提出一种面向压缩域数据盲提取的多层循环预测可逆隐藏方案。该方案通过构建多层循环预测嵌入,对CS测量值进行预测,利用直方图平移(Histogram Shifting,HS)对测量值嵌入额外信息,在提取信息阶段可实现信息盲提取和测量值无损还原;此外,为提高测量值可用性,本文提出一种冗余块估计方法,优先在冗余块进行信息嵌入,相比排序前,采样率0.5时平均PSNR最高提升2.8%。该方案结合了缩略图保持加密技术,在测量值中自嵌入图像本身的敏感区域保真值,为不同权限的用户提供不同的可见区域,实现多级预览;同时利用CS的鲁棒性,对测量值外嵌入需要隐藏的秘密信息,使得在不提取秘密信息的前提下,载密测量值重建图像与测量值重建图像保持高度相似(随嵌入率提升,平均PSNR为36 dB~48 dB),保证秘密信息的隐蔽性。实验结果表明,与最新方案相比,本文提出方案能够实现大容量嵌入(0 bit~35000 bit)、秘密信息盲提取、测量值直接可用以及多级权限隐私保护。 展开更多
关键词 可逆数据隐藏 压缩感知 循环预测 盲提取 预测误差扩展
在线阅读 下载PDF
基于类别共享与独有信息双向融合的多类别姿态估计
14
作者 陈俊杰 陈卫龙 +2 位作者 方玉明 姜文晖 牛力 《计算机学报》 北大核心 2025年第8期1795-1811,共17页
姿态估计旨在定位物体各关键点的位置,是一项基本的计算机视觉任务,具有广泛的应用场景。现有方法聚焦于估计单一类别物体的姿态(如人体),无法较好地用单个模型为多个类别的物体估计姿态。鉴于分类、检测、分割等模型都可为多类别预测结... 姿态估计旨在定位物体各关键点的位置,是一项基本的计算机视觉任务,具有广泛的应用场景。现有方法聚焦于估计单一类别物体的姿态(如人体),无法较好地用单个模型为多个类别的物体估计姿态。鉴于分类、检测、分割等模型都可为多类别预测结果,从单类别拓宽到多类别是姿态估计领域的必然发展趋势。因此,本文研究多类别姿态估计,其关键问题在于如何融合类别之间的共享信息与独有信息,使得单个模型可较好地兼容多个类别的信息。为此,本文提出基于共享与独有信息双向融合的Transformer模型,其中依据匹配关系对两种信息进行自适应融合。具体地,本模型使用可学习的查询向量来表征各类关键点的共享和独有信息,并用初始和精化两个阶段来逐步估计关键点位置。在初始阶段中,共享查询向量通过Transformer解码器来聚合图像骨干特征图中的共享信息,并预测得到关键点的初始位置和物体的类别。在精化阶段中,本模型依据共享查询向量与该类别关键点的匹配关系,将查询向量与该类别的独有查询向量进行前向融合,并将初始位置精化为准确位置。并且,本模型将更新后的独有查询向量储存到队列中,并依据匹配关系将其反向融合到共享查询向量中,可更有效地提炼共享信息。本文在多类别姿态数据集MP-100上进行了大量实验,其中的定量和定性分析都充分证明了本方法的有效性。 展开更多
关键词 姿态估计 多类别 基于查询的模型 信息解耦 多头注意力模型
在线阅读 下载PDF
融合自注意力机制的多行为图对比学习推荐方法 被引量:1
15
作者 钱忠胜 黄恒 万子珑 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3684-3698,共15页
图卷积网络因其强大的高阶协作信号学习能力被广泛地应用在多行为推荐系统中.然而,目前大多数基于图卷积的多行为推荐方法未能有效建模不同用户/项目节点与各行为间的关系,且目标行为的稀疏性也困扰着多行为推荐算法性能的进一步提升.... 图卷积网络因其强大的高阶协作信号学习能力被广泛地应用在多行为推荐系统中.然而,目前大多数基于图卷积的多行为推荐方法未能有效建模不同用户/项目节点与各行为间的关系,且目标行为的稀疏性也困扰着多行为推荐算法性能的进一步提升.基于此,提出一种融合自注意力机制的多行为图对比学习推荐模型(Multi-Behavior Graph Contrastive Learning recommendation method with Self-Attention mechanism,SA-MBGCL).该方法将用户/项目节点嵌入与行为嵌入相结合,并使用自注意力机制增强嵌入表示,以有效建模不同节点与各行为间的依赖关系.同时,构建一种图对比学习方式,将同一用户的目标行为与辅助行为视为正例对,而不同用户的视为负例对,以强化不同用户的行为差异,达到缓解目标行为稀疏性的目的.将非采样的推荐任务与多行为图对比学习进行多任务联合优化,在Beibei与Taobao这2个公开数据集上,和6个单行为模型与10个多行为模型进行对比,结果表明,所提模型SA-MBGCL在HR(Hit Ratio)和NDCG(Normalize Discounted Cumulative Gain)这2个指标上分别平均提升5.21%和8.30%,说明本文方法是有效的. 展开更多
关键词 自注意力机制 图对比学习 图卷积网络 多任务 多行为 推荐系统
在线阅读 下载PDF
面向研究问题的深度学习事件抽取综述
16
作者 万齐智 万常选 +3 位作者 胡蓉 刘德喜 刘喜平 廖国琼 《自动化学报》 EI CAS CSCD 北大核心 2024年第11期2079-2101,共23页
事件抽取是一个历史悠久且极具挑战的研究任务,近年来取得了大量优异成果.由于事件抽取涉及的研究内容较多,它们的目标和重心各不相同,使得读者难以全面地了解事件抽取包含的研究任务、研究问题和未来热点趋势.为此,面向研究问题,对基... 事件抽取是一个历史悠久且极具挑战的研究任务,近年来取得了大量优异成果.由于事件抽取涉及的研究内容较多,它们的目标和重心各不相同,使得读者难以全面地了解事件抽取包含的研究任务、研究问题和未来热点趋势.为此,面向研究问题,对基于深度学习的事件抽取研究成果进行整理.首先,界定事件相关概念,论述事件抽取的研究任务,明确各研究任务的目标,再总结各任务上的代表性研究成果;接着,总结现有事件抽取成果主要致力于解决哪些方面研究问题,分析为什么会存在这些问题,分析为什么需要解决这些问题;然后,对各方面研究问题进行技术总结,分析各自研究方案和研究推进过程;最后,讨论事件抽取的发展趋势. 展开更多
关键词 事件抽取 研究问题 研究进展及解决方案 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部