期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于标签信息融合与多任务学习的中文命名实体识别 被引量:3
1
作者 廖梦 贾真 李天瑞 《计算机科学》 CSCD 北大核心 2024年第3期198-204,共7页
随着中文命名实体识别研究的不断深入,大多数模型关注融入词汇或字形信息来丰富特征表示,但是却忽略了标签信息。因此文中提出了一种融合标签信息的中文命名实体识别模型。首先,通过预训练模型BERT-wwm得到字符的嵌入表示,并将标签向量... 随着中文命名实体识别研究的不断深入,大多数模型关注融入词汇或字形信息来丰富特征表示,但是却忽略了标签信息。因此文中提出了一种融合标签信息的中文命名实体识别模型。首先,通过预训练模型BERT-wwm得到字符的嵌入表示,并将标签向量化,使用Transformer解码器结构将字符表示与标签表示进行交互学习,捕捉字符与标签的相互依赖关系,丰富字符的特征表示。为了促进标签信息的学习,构建了基于文本句的监督信号,增加了多标签文本分类任务,采用多任务学习的方式进行训练。其中,命名实体识别任务采用条件随机场进行解码预测,多标签文本分类任务采用双仿射机制进行解码预测,两任务共享除解码层以外的所有参数,保证了不同的监督信息反馈到每个子任务。在公开数据集MSRA,Weibo和Resume上进行了多组对比实验,分别获得了95.75%,72.17%,96.23%的F1值。与多个基准模型相比,所提模型的实验效果有一定的提升,证明了该模型的有效性与可行性。 展开更多
关键词 命名实体识别 标签信息 注意力机制 双仿射机制 预训练模型
在线阅读 下载PDF
面向乳腺超声分类的低尺度形态特征重校准方法
2
作者 龚勋 朱丹 +1 位作者 杨子奇 罗俊 《西南交通大学学报》 EI CSCD 北大核心 2024年第3期539-546,563,共9页
针对乳腺超声图像具有类内差异大、类间差异小以及结节形状复杂多变等问题,提出一种形状特征重校准的乳腺超声图像算法,实现乳腺超声的自动化诊断.首先,构建端到端的网络模型,采用渐进训练方式,充分学习图像中更具辨别力的区域,获取更... 针对乳腺超声图像具有类内差异大、类间差异小以及结节形状复杂多变等问题,提出一种形状特征重校准的乳腺超声图像算法,实现乳腺超声的自动化诊断.首先,构建端到端的网络模型,采用渐进训练方式,充分学习图像中更具辨别力的区域,获取更细粒度的特征信息;其次,提出分区打乱机制,降低网络中打乱图像时破坏结节区域所产生的噪声;然后,将模型底层提取的特征与通过掩膜图像获得的形状特征进行重校准,提出低尺度重校准损失函数;最后,构建一个包含1550张乳腺超声图像数据集LSRD(low-scale recalibration database),验证所提方法的有效性.实验结果表明:本文模型在LSRD上准确率94.3%、敏感性91.2%、特异性93.6%、ROC(receiver operator characteristic curve)与坐标围成的面积(area under curve,AUC)为0.941,均优于对比模型;在BUSI(breast ultrasound image)数据集上,相较于对比模型,其分类精度提升3.3%. 展开更多
关键词 形状特征 分区打乱机制 低尺度重校准 乳腺癌分类
在线阅读 下载PDF
基于文本引导下的多模态医学图像分析算法 被引量:6
3
作者 樊琳 龚勋 郑岑洋 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2341-2355,共15页
结合胃镜超声和白光内镜可以更准确地识别胃肠道间质瘤.但是现有的多模态方法往往仅关注于图像特征,忽略了诊断文本信息中所包含的语义信息对于精确理解和诊断医学图像的重要性.为此,本文提出一种新的基于文本引导下的多模态医学图像分... 结合胃镜超声和白光内镜可以更准确地识别胃肠道间质瘤.但是现有的多模态方法往往仅关注于图像特征,忽略了诊断文本信息中所包含的语义信息对于精确理解和诊断医学图像的重要性.为此,本文提出一种新的基于文本引导下的多模态医学图像分析算法框架(Text-guided Multi-modal Medical image analysis framework,TMM-Net).TMM-Net使用多阶段的诊断文本来引导模型学习,以提取图像中的关键诊断信息特征,然后通过交叉模态注意力机制促进多模态特征之间的交互.值得注意的是,TMM-Net通过预测病变属性来模拟临床诊断过程,从而增强了可解释性.验证实验在两个中心包含10 025个模态数据对的数据集上进行.结果表明,该方法相比目前最优的GISTs诊断方法精度提升7.7%,同时获得了最高的(Area Under the Curve,AUC)值:0.927,其可解释性可以更好地适合临床需求. 展开更多
关键词 多模态融合 模型可解释性 图像-文本匹配 胃肠道间质瘤 胃镜超声 白光内镜
在线阅读 下载PDF
基于知识图谱的兴趣捕捉推荐算法 被引量:3
4
作者 金宇 陈红梅 罗川 《计算机科学》 CSCD 北大核心 2024年第1期133-142,共10页
知识图谱作为一种辅助信息,可以为推荐系统提供更多的上下文信息和语义关联信息,从而提高推荐的准确性和可解释性。通过将项目映射到知识图谱中,推荐系统可以将从知识图谱中学习到的外部知识注入到用户和项目的表示中,进而增强用户和项... 知识图谱作为一种辅助信息,可以为推荐系统提供更多的上下文信息和语义关联信息,从而提高推荐的准确性和可解释性。通过将项目映射到知识图谱中,推荐系统可以将从知识图谱中学习到的外部知识注入到用户和项目的表示中,进而增强用户和项目的表示。但在学习用户偏好时,基于图神经网络的知识图谱推荐主要通过项目实体利用知识图谱中的属性信息和关系信息等知识信息。由于用户节点并不与知识图谱直接相连,这就导致不同的关系信息和属性信息在语义上和用户偏好方面是独立的,缺乏关联。这表明,基于知识图谱的推荐难以根据知识图谱中的信息来准确捕获用户的细粒度偏好。因此,针对用户细粒度兴趣难以捕捉的问题,提出了一种基于知识图谱的兴趣捕捉推荐算法。该算法利用知识图谱中的关系和属性信息来学习用户的兴趣,并增强用户和项目的嵌入表示。为了充分利用知识图谱中的关系信息,设计了关系兴趣模块以学习用户对不同关系的细粒度兴趣。该模块将每个兴趣表示为知识图谱中关系向量的组合,并利用图卷积神经网络在用户项目图和知识图谱中传递用户兴趣以学习用户和项目的嵌入表示。此外,还设计了属性兴趣模块以学习用户对不同属性的细粒度兴趣。该模块采用切分嵌入的方法为用户和项目匹配与之相似的属性,并使用与关系兴趣模块中相似的方法进行消息传播。最终,在两个基准数据集上进行实验,实验结果验证了该方法的有效性和可行性。 展开更多
关键词 推荐算法 深度学习 知识图谱 图神经网络
在线阅读 下载PDF
面向方面级情感分析的交互式关系图注意力网络 被引量:1
5
作者 郭磊 贾真 李天瑞 《计算机应用》 CSCD 北大核心 2024年第3期696-701,共6页
方面级情感分析领域主要采用基于注意力机制的神经网络模型,这类模型忽略了方面词与观点词之间的依存关系和方面词与上下文词之间的距离,导致该类模型情感分类结果不够精确。为了解决上述问题,建立一种交互式关系图注意力网络(RI-GAT)... 方面级情感分析领域主要采用基于注意力机制的神经网络模型,这类模型忽略了方面词与观点词之间的依存关系和方面词与上下文词之间的距离,导致该类模型情感分类结果不够精确。为了解决上述问题,建立一种交互式关系图注意力网络(RI-GAT)模型。首先,通过长短期记忆(LSTM)网络学习句子的语义特征;然后,将学习的语义特征结合句子的位置信息生成新的特征;最后,在新的特征中提取各方面词和观点词之间的依存关系,实现对句法依存信息和位置信息的高效利用。在Laptop、Restaurant和Twitter数据集上的实验结果表明,相较于次优的动态多通道图卷积网络(DM-GCN),RI-GAT模型分类准确率(Acc)提高了0.67、1.65和1.36个百分点,说明了RI-GAT模型可以更好地建立方面词和意见词之间的联系,使得情感分类更加精确。 展开更多
关键词 方面级情感分析 图注意力网络 语义特征 观点倾向 网络评论
在线阅读 下载PDF
面向源-目的地流的多元时空数据可视分析 被引量:1
6
作者 周思艺 李天瑞 《计算机应用》 CSCD 北大核心 2024年第2期452-459,共8页
交通智能(IC)卡可以记录居民的移动出行,反映居民的源-目的地(OD)信息;但智能卡记录的OD流数据规模大,直接可视化空间分布容易导致视觉杂乱,并且多元数据类型多,更难以和流数据结合对比分析。首先,针对直接可视化大规模OD数据的空间分... 交通智能(IC)卡可以记录居民的移动出行,反映居民的源-目的地(OD)信息;但智能卡记录的OD流数据规模大,直接可视化空间分布容易导致视觉杂乱,并且多元数据类型多,更难以和流数据结合对比分析。首先,针对直接可视化大规模OD数据的空间分布容易视觉遮挡的问题,提出基于正交非负矩阵分解(ONMF)的流聚类方法。所提方法对源-目的地数据聚类后再可视化,可以减少不必要的遮挡。然后,针对多元时空数据类型多难以结合对比分析的问题,设计了公交站点多元时序数据视图。该可视化方法将公交站点的流量大小和空气质量、空气温度、相对湿度、降雨量这四类多元数据在同一时间序列上编码,提高了视图的空间利用率并且可以对比分析。再次,为了辅助用户探索分析,开发了基于OD流和多元数据的交互式可视分析系统,并设计了多种交互操作提升用户探索效率。最后,基于新加坡交通智能卡数据集,从聚类效果和运行时间对该聚类方法评估。结果显示,在用轮廓系数评估聚类效果上,所提方法比原始方法提升了0.028,比用K均值聚类方法提升了0.253;在运行时间上比聚类效果较好的ONMFS(ONMF through Subspace exploration)方法少了254 s。通过案例分析和系统功能对比验证了系统的有效性。 展开更多
关键词 交通智能卡 源-目的地流 多元数据 时空数据 可视分析
在线阅读 下载PDF
基于元图同构网络的分子毒性预测
7
作者 黄云川 江永全 +1 位作者 黄骏涛 杨燕 《计算机应用》 CSCD 北大核心 2024年第9期2964-2969,共6页
为了获得更准确的分子毒性预测结果,提出基于元图同构网络的分子毒性预测模型Meta-MTP。首先,使用图同构神经网络将原子作为节点、键作为边、分子作为图结构,以获取分子表征;使用预训练模型对图同构网络(GIN)初始化,使它获得更好的参数... 为了获得更准确的分子毒性预测结果,提出基于元图同构网络的分子毒性预测模型Meta-MTP。首先,使用图同构神经网络将原子作为节点、键作为边、分子作为图结构,以获取分子表征;使用预训练模型对图同构网络(GIN)初始化,使它获得更好的参数;引入基于分层注意力和局部增强的前馈Transformer;使用原子类型预测和键预测作为辅助任务提取更多的分子内部信息;通过元学习双层优化策略对模型进行训练;最后使用Tox21和SIDER数据集对模型进行训练。实验结果表明,在Tox21和SIDER数据集上,Meta-MTP具有良好的分子毒性预测能力,当样本数为10时,相较于FSGNNTR(Few-Shot Graph Neural Network-TRansformer)模型,Meta-MTP的曲线下面积(AUC)分别提高了1.4%和5.4%,相较于图同构网络(GIN)、图卷积网络(GCN)和GraphSAGE(Graph Sample and AGgrEgate)3种传统的图神经网络模型,Meta-MTP的AUC提高了18.3%~23.7%和7.3%~22.2%。 展开更多
关键词 深度学习 分子毒性预测 元学习 图同构网络 TRANSFORMER
在线阅读 下载PDF
基于主题声望和动态异构网络的学术影响力排序算法
8
作者 陈潘 陈红梅 罗川 《计算机科学》 CSCD 北大核心 2024年第3期81-89,共9页
有效地挖掘学术大数据,分析论文的学术影响力,有助于科研工作者获取重要的信息。文本内容与学术网络结构的动态变化,会对论文的学术影响力排名结果产生重要的影响。但现有的论文学术影响力排序算法或是缺乏对文本内容的考虑,或是缺乏对... 有效地挖掘学术大数据,分析论文的学术影响力,有助于科研工作者获取重要的信息。文本内容与学术网络结构的动态变化,会对论文的学术影响力排名结果产生重要的影响。但现有的论文学术影响力排序算法或是缺乏对文本内容的考虑,或是缺乏对学术网络结构的动态变化的考虑。针对该问题,提出了一种学术影响力排序算法,称之为基于主题声望和动态异构网络的学术影响力排名(TND-Rank)。TND-Rank衡量了论文主题在某一时间对论文的影响,并将其嵌入考虑时间因素的论文影响力排序算法中。TND-Rank通过考虑影响主题声望水平、期刊、作者、时间等多种因素的综合影响来计算论文的动态学术影响力相关排名。在实验中,对AMiner数据集1936-2014年间发表且信息保存完整的文章进行了分析,将所提算法与近年来的4种相关算法进行了比较,采用Spearman相关系数、归一化折损累积增益(NDCG)和分级平均精度(GAP)对算法性能进行了评估。实验结果验证了TND-Rank算法的可行性和有效性,其可以有效地综合各种信息对论文的学术影响力进行排序。 展开更多
关键词 异构网络 学术影响力 学术大数据 主题声望 论文排序
在线阅读 下载PDF
基于多邻接图与多头注意力机制的短期交通流量预测 被引量:5
9
作者 尹恒 张凡 李天瑞 《计算机科学》 CSCD 北大核心 2023年第4期40-46,共7页
交通流预测在智慧城市系统中占有重要地位,是许多交通方向应用的基石。该任务的难点在于如何有效地建模交通流的时空依赖。现有方法大都使用图卷积网络(Graph Convolution Networks,GCN)建模空间关系,使用卷积神经网络网络(Convolution ... 交通流预测在智慧城市系统中占有重要地位,是许多交通方向应用的基石。该任务的难点在于如何有效地建模交通流的时空依赖。现有方法大都使用图卷积网络(Graph Convolution Networks,GCN)建模空间关系,使用卷积神经网络网络(Convolution Neural Network,CNN)或者循环神经网络(Recurrent Neural Network,RNN)建模时间关系,但在建模空间关系时往往只利用邻接矩阵建模了局部关系而忽略了全局空间信息。而在整个路网中存在一些道路,其周围的路网结构相似,这些道路在路网中承载的作用是相似的,这些相似道路的特征也可以作为流量预测的依据。因此,提出一种基于多邻接图与多头注意力机制的时空网络模型MA-STGCN,包括:1)利用node2vec算法计算路网中道路的向量表示,通过阈值计算出相似矩阵用于图卷积操作,抽取全局空间信息;2)利用多通道自注意力机制深入挖掘模型的时空特征。在公开数据集PEMS04与PEMS08上进行的实验验证了该模型的有效性,其准确率与主流的模型相比均有提高。 展开更多
关键词 交通流预测 空洞卷积 时空网络 注意力机制 节点嵌入
在线阅读 下载PDF
基于深度网络的汽车配件两级备件决策 被引量:4
10
作者 张明蓝 孙林夫 邹益胜 《计算机集成制造系统》 EI CSCD 北大核心 2022年第12期3822-3831,共10页
备件业务是汽车配件售后市场重要组成部分,针对汽车备件决策过程中信息不完备与多样性的问题,提出一种正则化VIT-BiLSTM两级备件决策模型。首先,根据配件类型对数据进行两级划分,以获取其内在联系。然后,利用Vision Transformer(VIT)模... 备件业务是汽车配件售后市场重要组成部分,针对汽车备件决策过程中信息不完备与多样性的问题,提出一种正则化VIT-BiLSTM两级备件决策模型。首先,根据配件类型对数据进行两级划分,以获取其内在联系。然后,利用Vision Transformer(VIT)模型对配件数据进行关键特征的提取。随后,通过双向长短时记忆循环神经网络(BiLSTM)捕捉特征之间的双向长时依赖关系,并在每个序列单元中融入组套索正则化项,进一步提高模型准确率。最后,利用第三方云平台的配件数据进行算例分析。实验结果表明,模型一级与二级的决策准确率分别高达99%、97%,召回率分别为97.3%、96.6%,F值分别为0.977、0.964,说明本模型可以为配件代理商提供实时数据参考,辅助其进行备件决策。 展开更多
关键词 汽车配件 深度网络 两级备件决策 VIT模型 BiLSTM模型 组套索正则化
在线阅读 下载PDF
基于Key-Value关联记忆网络的知识图谱问答方法 被引量:2
11
作者 饶志双 贾真 +1 位作者 张凡 李天瑞 《计算机科学》 CSCD 北大核心 2022年第9期202-207,共6页
基于知识图谱的问答(Question Answering over Knowledge Graph, KG-QA)系统通过对给定的自然语言问题进行语义解析,将问题映射到知识图谱〈主,谓,宾〉三元组,并对三元组进行推理得到问题的答案。由于自然语言具有多样性的特点,一个问... 基于知识图谱的问答(Question Answering over Knowledge Graph, KG-QA)系统通过对给定的自然语言问题进行语义解析,将问题映射到知识图谱〈主,谓,宾〉三元组,并对三元组进行推理得到问题的答案。由于自然语言具有多样性的特点,一个问题可能有多种表述,而三元组知识在知识图谱中却是规范的结构化数据,如何将自然语言问题映射到知识图谱三元组是KG-QA的难点。文中提出了一种新的Key-Value关联记忆网络,从知识图谱的角度出发,关注候选答案知识间的关联关系以及知识图谱中的知识与自然语言问题表征之间的关系。此外,在模型中引入了注意力机制,使其具有更好的可解释性。在WebQuestions数据集上进行实验,结果表明,所提方法的F1值比基于信息抽取的最优方法提高了5.9%,比基于语义分析的最优方法略有提高,验证了该方法的有效性。 展开更多
关键词 知识图谱问答 知识图谱 关联记忆网络 注意力机制 深度学习
在线阅读 下载PDF
基于情感知识的双通道图卷积网络的方面级情感分析 被引量:3
12
作者 阳影 张凡 李天瑞 《计算机科学》 CSCD 北大核心 2023年第5期230-237,共8页
方面级情感分析是一项细粒度情感分析任务,其目标是对句子中给定的方面词进行情感极性分类。当前的情感分类模型大多在依存句法树上构建图神经网络,从依存句法树上学习方面词与上下文之间的信息,缺乏对句子中情感知识的挖掘。针对这个问... 方面级情感分析是一项细粒度情感分析任务,其目标是对句子中给定的方面词进行情感极性分类。当前的情感分类模型大多在依存句法树上构建图神经网络,从依存句法树上学习方面词与上下文之间的信息,缺乏对句子中情感知识的挖掘。针对这个问题,文中提出了一种基于情感知识的双通道图卷积网络的情感分类模型(Dual-channel Graph Convolutional Network with Sentiment Knowledge,SKDGCN)。该模型由情感增强的依存图卷积网络(Sentiment-enhanced Dependency Graph Convolutional Network,SDGCN)和注意力图卷积网络(Attention Graph Convolutional Network,AGCN)组成,两个图卷积网络分别学习方面词与上下文词的句法依赖关系和语义关系。具体地,SDGCN在句法依存树上融合SenticNet中的情感知识以增强句子的依赖关系,使得模型既考虑了上下文词与方面词的句法关系,也考虑了上下文中意见词与方面词的情感信息;AGCN使用注意力机制学习方面词与句子中上下文的语义相关性;最后使两个图卷积网络交互学习各自的信息进行情感分类。实验结果表明,该模型在多个公开数据集上表现优异,并通过消融实验验证了各个模块的有效性。 展开更多
关键词 方面级情感分析 情感知识 依存关系 图卷积网络 注意力机制
在线阅读 下载PDF
基于同源控制点的边缘绑定方法 被引量:1
13
作者 刘梦欣 张凡 李天瑞 《计算机科学》 CSCD 北大核心 2022年第10期96-102,共7页
对含有大量复杂连接关系的节点连接图进行可视化会造成视觉上的严重混乱,边缘绑定是一种有效降低视觉混乱的方法。以往基于空间邻近性进行边缘绑定的方法会导致独立边缘产生模糊性歧义,给予用户错误的认知,而只专注于图的拓扑结构无法... 对含有大量复杂连接关系的节点连接图进行可视化会造成视觉上的严重混乱,边缘绑定是一种有效降低视觉混乱的方法。以往基于空间邻近性进行边缘绑定的方法会导致独立边缘产生模糊性歧义,给予用户错误的认知,而只专注于图的拓扑结构无法有效解决密集连接造成的视觉干扰问题。基于边缘路径的方法能够较好地利用图中原始节点信息对边缘进行控制绑定,从而避免独立边缘产生模糊性歧义,同时展现数据的高级模式。因此,在边缘路径方法的基础上进行了改进,提出了一种基于同源控制点的边缘绑定方法。该方法结合图的拓扑结构信息计算同源控制点,并以此为基础利用最短路径算法选取边缘控制点,然后结合分级思想对边缘聚合程度进行优化,最后通过Bézier曲线对边缘进行平滑处理。将基于同源控制点的边缘绑定方法用于美国迁移数据集和中国铁路线路数据集中,实验结果表明,该方法在改善过度绑定的问题上起到了较好的效果,相比原方法,此方法保留了更多局部数据细节,平衡了整体与局部边缘的绑定程度,可以有效地用于复杂连接图的可视化。 展开更多
关键词 节点连接图 同源控制点 最短路径 边缘绑定 图可视化
在线阅读 下载PDF
结构约束下的生成对抗深度图修复 被引量:2
14
作者 卢奇 龚勋 《数据采集与处理》 CSCD 北大核心 2023年第5期1048-1057,共10页
不同于纹理图像,深度图像中的像素点代表采集设备到场景各点的距离,直接使用通用图像修复方法并不能有效恢复深度图像中缺失区域的场景结构,本文提出一个两阶段编解码结构的生成对抗网络以解决深度图像修复问题。与常见生成对抗网络(Gen... 不同于纹理图像,深度图像中的像素点代表采集设备到场景各点的距离,直接使用通用图像修复方法并不能有效恢复深度图像中缺失区域的场景结构,本文提出一个两阶段编解码结构的生成对抗网络以解决深度图像修复问题。与常见生成对抗网络(Generative adversarial networks,GAN)模型不同,本文的生成器网络包括深度生成G_(1)和深度修复G_(2)两个模块。G_(1)模块从RGB图像得到预测深度,替换待修复深度图像缺失区域,保证修复区域局部结构一致性。G_(2)模块引入RGB图像边缘结构,保证全局结构一致性。针对现有图像修复方法没有考虑到修复区域间的一致性问题,设计结构一致注意力模块(Structure coherent attention,SCA)加入到G_(2)中改善修复效果。本文提出的深度图像修复模型在主流数据集上进行了验证,利用结构约束并经过两阶段的生成器模型和判别器模型的共同作用,有效改善了深度图像修复效果。 展开更多
关键词 深度图像 图像修复 两段式生成对抗网络 边缘结构信息
在线阅读 下载PDF
基于多特征嵌入的中文医学命名实体识别
15
作者 黄健格 贾真 +1 位作者 张凡 李天瑞 《计算机科学》 CSCD 北大核心 2023年第6期243-250,共8页
针对基于字符表示的中文医学命名实体识别模型嵌入信息单一、缺失词边界和结构信息的问题,文中提出了一种融合多特征嵌入的医学命名实体识别模型。首先,将字符映射为固定长度的嵌入表示;其次,引入外部资源构建词汇特征,该特征能够补充... 针对基于字符表示的中文医学命名实体识别模型嵌入信息单一、缺失词边界和结构信息的问题,文中提出了一种融合多特征嵌入的医学命名实体识别模型。首先,将字符映射为固定长度的嵌入表示;其次,引入外部资源构建词汇特征,该特征能够补充字符的潜在词组信息;然后,根据中文的象形文字特点和文本序列特点,分别引入字符结构特征和序列结构特征,使用卷积神经网络对两种结构特征进行编码,得到radical-level词嵌入和sentence-level词嵌入;最后,将得到的多种特征嵌入进行拼接,输入长短期记忆网络编码,并使用条件随机场输出实体预测结果。将自建中文医疗数据和CHIP_2020任务提供的医疗数据作为数据集进行实验,实验结果表明,与基准模型相比,所提模型同时融合了词汇特征和文本结构特征,能够有效识别医学命名实体。 展开更多
关键词 命名实体识别 中文医学文本 词汇信息 文本结构特征 深度学习
在线阅读 下载PDF
面向故障短文本的改进图节点嵌入与聚类方法
16
作者 邱竞雄 孙林夫 韩敏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期4256-4266,共11页
为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下... 为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下不同距离的词汇间关联;其次改进图节点结构特征获取方法,从而体现节点度值差异对嵌入的影响;通过融合节点的结构特征与关系特征,增强具有相似邻居节点的同类节点之间的相似性表现;在聚类阶段设计备选节点数参数以缓解截断距离的敏感性。该方法在公开数据集和真实业务数据上进行了参数分析和性能评估,结果表明该方法可获取精准有效的故障实体节点聚类结果。 展开更多
关键词 故障短文本 图节点嵌入 局部密度 图节点聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部