期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
跨模态文本信息增强的多模态情感分析模型
1
作者 王艺涵 路翀 陈忠源 《计算机应用》 北大核心 2025年第7期2237-2244,共8页
近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重... 近年来,利用文本、视觉和音频数据分析视频中说话者情感的多模态情感分析(MSA)引起了广泛关注。然而,不同模态在情感分析中的贡献大不相同。通常,文本中包含的信息更加直观,因此寻求一种用于增强文本在情感分析中作用的策略显得尤为重要。针对这一问题,提出一种跨模态文本信息增强的多模态情感分析模型(MSAMCTE)。首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取文本特征,并使用双向长短期记忆(Bi-LSTM)网络对预处理后的音频和视频特征进行进一步处理;其次,通过基于文本的交叉注意力机制,将文本信息融入情感相关的非语言表示中,以学习面向文本的成对跨模态映射,从而获得有效的统一多模态表示;最后,使用融合特征进行情感分析。实验结果表明,与最优的基线模型——文本增强Transformer融合网络(TETFN)相比,MSAM-CTE在数据集CMU-MOSI(Carnegie Mellon University Multimodal Opinion Sentiment Intensity)上的平均绝对误差(MAE)和皮尔逊相关系数(Corr)分别降低了2.6%和提高了0.1%;在数据集CMU-MOSEI(Carnegie Mellon University Multimodal Opinion Sentiment and Emotion Intensity)上的两个指标分别降低了3.8%和提高了1.7%,验证了MSAM-CTE在情感分析中的有效性。 展开更多
关键词 多模态情感分析 文本信息增强 交叉注意力机制 双向长短期记忆网络 跨模态信息融合
在线阅读 下载PDF
基于异质信息网络表征学习的微博虚假信息甄别研究
2
作者 王世雄 吴泽政 《情报杂志》 CSSCI 北大核心 2024年第12期152-160,共9页
[研究目的]社会网络的飞速发展与突发公共卫生事件的时有发生,使得大量的、具有迷惑性的虚假信息混杂社交媒体中,甄别此类信息已成为用户信息素养的重要组成部分。[研究方法]以微博上的异质信息网络为研究对象,综合考虑微博文本的语义... [研究目的]社会网络的飞速发展与突发公共卫生事件的时有发生,使得大量的、具有迷惑性的虚假信息混杂社交媒体中,甄别此类信息已成为用户信息素养的重要组成部分。[研究方法]以微博上的异质信息网络为研究对象,综合考虑微博文本的语义特征和用户行为的非语义特征,引入多头注意力机制融合生成集成表示实现虚假信息甄别,并从信息内容、参与用户、用户与信息交互三个维度进行特征挖掘与量化分析。[研究结论]研究表明,基于异质信息网络表征学习的虚假信息甄别方法具有较好的实用性,有助于解构虚假信息的特征,为突发公共卫生健康事件的虚假信息治理及辩症施策提供有益参考。 展开更多
关键词 异质信息网络 表征学习 突发公共卫生事件 虚假信息 用户行为 社交媒体 微博文本
在线阅读 下载PDF
基于词-主题-文本异质网络的短文本分类方法
3
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 短文本分类
在线阅读 下载PDF
基于BERT-Bi-LSTM-CRF模型的机场类中文航行通告要素实体识别 被引量:6
4
作者 郝宽公 董兵 +2 位作者 吴悦 彭自琛 罗创 《科学技术与工程》 北大核心 2024年第10期4182-4188,共7页
航行通告是民用航空情报领域的重要情报资料,针对中文航行通告专业名词较多、格式不统一及语义复杂等问题,提出了一种基于BERT-Bi-LSTM-CRF的实体识别模型,对航行通告E项内容中事件要素实体进行抽取。首先通过BERT(bidirectional encode... 航行通告是民用航空情报领域的重要情报资料,针对中文航行通告专业名词较多、格式不统一及语义复杂等问题,提出了一种基于BERT-Bi-LSTM-CRF的实体识别模型,对航行通告E项内容中事件要素实体进行抽取。首先通过BERT(bidirectional encoder representations from transforms)模型对处理后的向量进行预训练,捕捉丰富的语义特征,然后传送至双向长短期记忆网络(bidirectional long short-term memory,Bi-LSTM)模型对上下文特征进行提取,最后利用条件随机场(conditional random field,CRF)模型对最佳实体标签预测并输出。收集并整理机场类航行通告相关的原始语料,经过文本标注与数据预处理,形成了可用于实体识别实验的训练集、验证集和评价集数据。基于此数据与不同的实体识别模型进行对比实验,BERT-Bi-LSTM-CRF模型的准确率为89.68%、召回率为81.77%、F_(1)为85.54%,其中F 1相比现有模型得到有效提升,结果验证了该模型在机场类航行通告中要素实体识别的有效性。 展开更多
关键词 机场类航行通告 要素实体识别 双向转换编码器 双向长短期记忆网络 文本信息抽取
在线阅读 下载PDF
基于BiLSTM-CNN串行混合模型的文本情感分析 被引量:34
5
作者 赵宏 王乐 王伟杰 《计算机应用》 CSCD 北大核心 2020年第1期16-22,共7页
针对现有文本情感分析方法准确率不高、实时性不强以及特征提取不充分的问题,构建了双向长短时记忆神经网络和卷积神经网络(BiLSTM-CNN)的串行混合模型。首先,利用双向循环长短时记忆(BiLSTM)神经网络提取文本的上下文信息;然后,对已提... 针对现有文本情感分析方法准确率不高、实时性不强以及特征提取不充分的问题,构建了双向长短时记忆神经网络和卷积神经网络(BiLSTM-CNN)的串行混合模型。首先,利用双向循环长短时记忆(BiLSTM)神经网络提取文本的上下文信息;然后,对已提取的上下文特征利用卷积神经网络(CNN)进行局部语义特征提取;最后,使用Softmax得出文本的情感倾向。通过与CNN、长短时记忆神经网络(LSTM)、BiLSTM等单一模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了2.02个百分点、1.18个百分点和0.85个百分点;与长短时记忆神经网络和卷积神经网络(LSTM-CNN)、BiLSTM-CNN并行特征融合等混合模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了1.86个百分点和0.76个百分点。实验结果表明,基于BiLSTM-CNN的串行混合模型在实际应用中具有较大的价值。 展开更多
关键词 文本情感分析 上下文信息 语义特征 长短时记忆神经网络 卷积神经网络
在线阅读 下载PDF
基于异构图卷积网络的小样本短文本分类方法 被引量:11
6
作者 袁自勇 高曙 +1 位作者 曹姣 陈良臣 《计算机工程》 CAS CSCD 北大核心 2021年第12期87-94,共8页
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主... 针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。 展开更多
关键词 小样本短文本分类 异构图卷积网络 短文本异构信息网络 BTM主题模型 过拟合
在线阅读 下载PDF
融合实体信息的图卷积神经网络的短文本分类模型 被引量:7
7
作者 王佳宇 李楹 +2 位作者 马春梅 吴东昊 姜丽芬 《天津师范大学学报(自然科学版)》 CAS 北大核心 2023年第1期67-72,共6页
提出一种融合实体信息的图卷积神经网络模型(ETGCN),用于短文本分类.首先,使用实体链接工具抽取短文本中的实体;然后,利用图卷积神经网络对文档、实体和单词进行建模,丰富文本的潜在语义特征;将学习到的单词节点表示与BERT词嵌入进行拼... 提出一种融合实体信息的图卷积神经网络模型(ETGCN),用于短文本分类.首先,使用实体链接工具抽取短文本中的实体;然后,利用图卷积神经网络对文档、实体和单词进行建模,丰富文本的潜在语义特征;将学习到的单词节点表示与BERT词嵌入进行拼接,通过双向长短期记忆网络,进一步挖掘文本上下文语义特征,再与图神经网络模型得到的文本特征进行融合,用于分类.实验结果表明,该模型在数据集AGNews、R52和MR上的分类准确率分别为88.38%、93.87%和82.87%,优于大部分主流的基线方法. 展开更多
关键词 短文本分类 实体信息 图卷积神经网络
在线阅读 下载PDF
基于异质信息网的短文本特征扩充方法 被引量:2
8
作者 吕晓锋 赵书良 +2 位作者 高恒达 武永亮 张宝奇 《计算机科学》 CSCD 北大核心 2022年第9期92-100,共9页
随着计算机技术深度融入社会生活,越来越多的短文本信息遍布在网络平台上。针对短文本的数据稀疏问题,文中构建了一个鲁棒的异质信息网框架(HTE)来建模短文本,该框架可集成任何类型的附加信息并捕获它们之间的关系,以解决数据稀疏问题... 随着计算机技术深度融入社会生活,越来越多的短文本信息遍布在网络平台上。针对短文本的数据稀疏问题,文中构建了一个鲁棒的异质信息网框架(HTE)来建模短文本,该框架可集成任何类型的附加信息并捕获它们之间的关系,以解决数据稀疏问题。基于该框架利用不同外部知识设计了6种短文本扩充方法,引入Wikipedia知识库和Freebase知识库的实体、实体类别、实体间关系等实体信息和文本主题等文本信息,以丰富短文本特征。最后使用相似性度量结果来验证所提出的短文本特征扩充方法的效果。通过与传统的3种相似性度量方法的6种文本扩充方法以及目前主流的短文本匹配算法在两个短文本数据集上进行比较,结果表明,所提的6种短文本扩充方法均有所提升,最佳方法的相似度度量结果与BERT相比提升了5.97%,证明了所提框架具有鲁棒性,可以包含多种类型的外部知识,能够解决短文本的数据稀疏性问题,以无监督的方式高精度地对短文本进行相似性度量。 展开更多
关键词 异质信息网络 短文本扩充方法 短文本匹配 知识库 元路径
在线阅读 下载PDF
面向新闻领域的中文实体关系抽取 被引量:1
9
作者 王博 王侃 +3 位作者 王成刚 刘然 刘威鹏 黄慧荣 《电讯技术》 北大核心 2021年第1期50-57,共8页
随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求。实体关系抽取是获取关键信息的方法之一,但目前... 随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求。实体关系抽取是获取关键信息的方法之一,但目前关于中文的实体关系抽取工作较少。针对基于长短时记忆网络的中文实体识别模型难于提取长距离的依存关系特征和句法特征问题,提出利用双向树形长短时记忆神经网络提取依存句法树的结构特征。在提取的特征的基础上,使用条件随机场判断实体的类别和边界,并在实体识别模型中加入注意力机制提高模型的性能。在《人民日报》数据集和ACE 2005语料库上训练模型,验证了模型的有效性。 展开更多
关键词 新闻文本信息 实体关系抽取 长短时记忆网络 最短依存路径 条件随机场 注意力机制
在线阅读 下载PDF
结合短文本语义的图查询可视分析系统
10
作者 童宁 徐珊 +1 位作者 汤颖 秦绪佳 《小型微型计算机系统》 CSCD 北大核心 2023年第1期146-154,共9页
异构信息网络中不同类型的节点与边能够形成丰富的语义关系,同时节点的文本属性也会对这些关系模式造成影响.相比于同构网络,异构网络的数据挖掘可以获得更有价值的结果,但是也因为异构网络节点和边的多样性使得异构网络挖掘更具有挑战... 异构信息网络中不同类型的节点与边能够形成丰富的语义关系,同时节点的文本属性也会对这些关系模式造成影响.相比于同构网络,异构网络的数据挖掘可以获得更有价值的结果,但是也因为异构网络节点和边的多样性使得异构网络挖掘更具有挑战性.设计有效的查询技术可以对异构网络进行网络结构和语义的分析.以往的异构网络查询方法通常采用基于元路径的图查询方法,但是如何更好地计算元路径的重要度并结合异构网络的节点文本属性进行准确率更高的查询仍然是一个需要解决的重要问题.此外,如何对查询的多个结果有效展示它们之间的语义关联和特征,对用户快速理解网络的异构关系模式也非常重要.本文受到图查询输入、子图查询和结果分析三个阶段任务的驱动,提出了一种结合短文本语义的图查询方法,并基于该方法实现了一个面向异构网络的图查询可视分析系统.本文首先从查询输入中提取可能的关系模式,使用元路径来表示不同语义的关系模式并结合用户输入的短文本计算重要度;然后本文根据元路径的重要度将多条元路径结合为用于查询的关系模式;再对查询得到的结果子图的特征向量进行降维和聚类,在此基础上对结果子图的结构特征、语义特征和节点属性进行可视化;最后本文设计并实现了Web环境下的异构信息网络图查询可视分析系统.在DBLP数据集上的实验结果表明,短文本对查询结果的约束性提高了查询的准确率;进一步通过豆瓣电影数据的案例分析,说明本文的系统可以基于查询有效分析挖掘异构网络的数据和关系特征. 展开更多
关键词 可视化 可视分析 异构信息网络 图查询 元路径 短文本
在线阅读 下载PDF
融合语料库特征与图注意力网络的短文本分类方法 被引量:8
11
作者 杨世刚 刘勇国 《计算机应用》 CSCD 北大核心 2022年第5期1324-1329,共6页
短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的... 短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的图注意力网络NE-GAT。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点的重要性,并通过节点间的点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,并将节点重要性和边权重融入节点更新过程。实验结果表明,所提模型在测试集上的平均准确率达到了75.48%,优于用于文本分类的图卷积网络(Text-GCN)、TL-GNN、Text-ING等模型;相较原始GAT,所提模型的平均准确率提升了2.32个百分点,验证了其有效性。 展开更多
关键词 短文本分类 图注意力网络 语料库特征 引力模型 点互信息
在线阅读 下载PDF
基于异质信息网络的文本相似性度量方法
12
作者 马秋微 赵书良 赵妍 《中文信息学报》 CSCD 北大核心 2023年第9期108-120,共13页
文本相似性度量对基于文本的分类,聚类以及排序等有着广泛的影响。现有的大部分文本相似性度量方法不仅文本特征粒度单一化,而且忽略了非结构化文本数据中的结构化信息。该文将文本相似性度量问题转化为加权异质信息网络中的节点相似性... 文本相似性度量对基于文本的分类,聚类以及排序等有着广泛的影响。现有的大部分文本相似性度量方法不仅文本特征粒度单一化,而且忽略了非结构化文本数据中的结构化信息。该文将文本相似性度量问题转化为加权异质信息网络中的节点相似性度量问题,利用元路径的结构特性和语义特性度量文本的显式语义相似性,使其度量结果更准确并且更具有可解释性。首先,结合世界知识库,扩大文本特征粒度,构建加权文本异质信息网络,将非结构化文本类型数据表示为结构化的异质信息网络的形式。其次,挖掘元路径,并提出基于元路径的ω-PageRank-Nibble子图划分算法,得到包含给定文本节点集的局部图。根据局部图,计算并存储特定元路径的交换矩阵,为后续相似性度量降低时间及空间成本。最后,提出AllPathSim耦合相似性度量方法,度量文本类型节点的相似性。在图剪枝方面,利用基于元路径的ω-PageRank-Nibble算法划分子图,与处理整张图相比,时间成本和空间成本降低效果显著。在相似性度量方面,与同期最优的相同类型节点度量方法相比,AllPathSim耦合相似性度量方法与度量结果的相关系数在20NG和GCAT数据集上分别提高了6.1%和6.9%。 展开更多
关键词 相似性度量 加权异质信息网络 元路径 文本挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部