期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
BTM-BERT模型在民航机务维修安全隐患自动分类中的应用
1
作者 陈芳 张亚博 《安全与环境学报》 CAS CSCD 北大核心 2024年第11期4366-4373,共8页
为界定民航机务维修安全隐患类别,实现安全隐患数据的自动分类,首先,利用构建的机务维修停用词库对安全隐患记录语料进行预处理。其次,运用词对主题模型(Biterm Topic Model,BTM)提取主题和关键词,确定了“员工未按规定对工作现场进行... 为界定民航机务维修安全隐患类别,实现安全隐患数据的自动分类,首先,利用构建的机务维修停用词库对安全隐患记录语料进行预处理。其次,运用词对主题模型(Biterm Topic Model,BTM)提取主题和关键词,确定了“员工未按规定对工作现场进行监管”等12类安全隐患。最后,根据BTM主题模型标注的数据集对算法进行微调,构建了基于变换器的双向编码(Bidirectional Encoder Representations from Transformers,BERT)算法的机务维修安全隐患记录自动分类模型,并与传统的分类算法进行对比。结果表明:所构建的模型可以实现民航机务维修安全隐患自动分类,其效果远高于传统机器学习支持向量机算法的效果,构建的分类模型的精确率、召回率和F 1较文本卷积神经网络算法分别提升了0.12、0.14和0.14,总体准确率达到了93%。 展开更多
关键词 安全工程 机务维修 词对主题模型(btm) 基于变换器的双向编码(BERT) 安全隐患 文本分类
在线阅读 下载PDF
基于BTM主题挖掘和Kano模型的运动文胸用户需求研究 被引量:6
2
作者 方蕾蕾 吴巧英 +1 位作者 项钰慧 章杨欣 《丝绸》 CAS CSCD 北大核心 2024年第3期106-114,共9页
为了深入挖掘运动文胸的用户需求,文章采用BTM模型对10个运动文胸品牌的16 248条在线评论进行主题挖掘,构成运动文胸用户需求要素,并通过Kano模型分析用户满意度和需求度,确定各项要素的属性归类和优先级排序。研究结果得到,运动文胸用... 为了深入挖掘运动文胸的用户需求,文章采用BTM模型对10个运动文胸品牌的16 248条在线评论进行主题挖掘,构成运动文胸用户需求要素,并通过Kano模型分析用户满意度和需求度,确定各项要素的属性归类和优先级排序。研究结果得到,运动文胸用户需求维度包括功能质量、款式设计、面料材质、颜色外观、服务品质、品牌营销6个方面;在23项需求要素中,舒适度和防震功能是用户满意度建立的首要因素,下围、罩杯、面料手感、胸垫材质是产品优化中的关键因素,客服态度、退换货服务、声誉口碑、商品信息是服务和营销中的重要因素;进而提出优化建议供相关企业参考。 展开更多
关键词 运动文胸 用户需求 btm模型 主题挖掘 KANO模型 在线评论 用户满意度
在线阅读 下载PDF
基于BTM的微博舆情热点发现 被引量:29
3
作者 王亚民 胡悦 《情报杂志》 CSSCI 北大核心 2016年第11期119-124,140,共7页
[目的/意义]作为一种新兴的社交新闻媒体,近年来,微博在许多热点事件的发布和传播中发挥了重要作用。但由于其文本的特殊性,传统方法不能有效地对其进行建模发现热点话题。因此,如何高效、准确地从微博数据中发现并提取有意义的热点信... [目的/意义]作为一种新兴的社交新闻媒体,近年来,微博在许多热点事件的发布和传播中发挥了重要作用。但由于其文本的特殊性,传统方法不能有效地对其进行建模发现热点话题。因此,如何高效、准确地从微博数据中发现并提取有意义的热点信息是一个很有价值的研究课题。[方法/过程]提出一种基于BTM模型的微博舆情热点发现方法。首先,对微博文本采用BTM建模,改进TF-IDF权重计算算法,以适应微博短文本的特征。并将BTM建模结果与改进的TF-IDF权重算法结合对微博文本进行特征提取及相似性度量,然后采用K-means聚类方法发现热点话题。[结果/结论]通过对新浪微博数据集的对比实验及结果分析验证了本方法的有效性。本方法能够有效解决传统模型在文本建模中所面临的高维度和稀疏性问题,显著改善热点话题的发现质量。 展开更多
关键词 词对主题模型 短文本 微博舆情 相似性度量
在线阅读 下载PDF
融合词向量及BTM模型的问题分类方法 被引量:10
4
作者 黄贤英 谢晋 龙姝言 《计算机工程与设计》 北大核心 2019年第2期384-388,共5页
针对传统短文本分类算法对问题分类效果不佳的问题,提出一种融合词向量及BTM模型的问题分类方法。使用Word2vec对问题语料库进行训练得到词向量;对语料进行基于吉布斯采样的BTM主题模型构建,得到文本主题扩展向量;将文本主题扩展向量与... 针对传统短文本分类算法对问题分类效果不佳的问题,提出一种融合词向量及BTM模型的问题分类方法。使用Word2vec对问题语料库进行训练得到词向量;对语料进行基于吉布斯采样的BTM主题模型构建,得到文本主题扩展向量;将文本主题扩展向量与词向量拼接得到新的问句扩展文本,利用SVM进行文本分类。实验结果表明,该方法在准确率、召回率及F值上的表现均有提高。 展开更多
关键词 问答系统 问题分类 词向量 btm主题模型 问句扩展
在线阅读 下载PDF
面向微博子话题检测的BTM模型研究 被引量:4
5
作者 曹春萍 李瑜 《小型微型计算机系统》 CSCD 北大核心 2022年第10期2090-2095,共6页
现今网络舆情传播速度快、影响力大,研究微博网络中舆情信息的话题检测对有关部门舆情治理以及应急处置具有重要意义.针对传统话题检测方法忽略了微博中更细粒度的子话题研究,并且检测的话题缺乏深层次的语义信息问题,本文将attention... 现今网络舆情传播速度快、影响力大,研究微博网络中舆情信息的话题检测对有关部门舆情治理以及应急处置具有重要意义.针对传统话题检测方法忽略了微博中更细粒度的子话题研究,并且检测的话题缺乏深层次的语义信息问题,本文将attention机制与BLSTM融入到BTM模型中,构建词对主题模型ATT-BLSTM-BTM.该模型通过BLSTM训练词与词之间的相互关系,同时,利用attention机制计算特征词注意力概率分布,以降低语料库中无关词汇对建模的影响,从而提高BTM模型检测子话题的精准性.实验结果显示,本文模型与传统的LDA、BTM和NTM模型相比,生成的子话题在KL值与PMI值上都有明显的提升,证明本文所提模型能够生成质量更高的子话题. 展开更多
关键词 子话题检测 btm模型 attention机制 BLSTM模型
在线阅读 下载PDF
基于BTM和加权K-Means的微博话题发现 被引量:2
6
作者 陈凤 蒙祖强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2019年第3期71-78,共8页
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的... 为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。 展开更多
关键词 btm模型 加权K-Means 微博数据 话题发现
在线阅读 下载PDF
基于改进BTM模型的医疗服务质量因素识别 被引量:5
7
作者 高慧颖 公孟秋 于思佳 《北京理工大学学报》 EI CAS CSCD 北大核心 2022年第11期1167-1174,共8页
针对在线医疗评论文本长度短、语义稀疏的特点,提出一种基于词共现分析的在线医疗评论主题挖掘模型。应用于短文本的BTM主题模型在词对的选择过程中缺少对词语语义相关性的考虑,通过引入词共现分析计算语义相关性,设定阈值筛选参与训练... 针对在线医疗评论文本长度短、语义稀疏的特点,提出一种基于词共现分析的在线医疗评论主题挖掘模型。应用于短文本的BTM主题模型在词对的选择过程中缺少对词语语义相关性的考虑,通过引入词共现分析计算语义相关性,设定阈值筛选参与训练的词对,进行医疗评论主题挖掘,基于主题一致性TC值和JS散度对比改进的COA-BTM主题模型与传统的BTM主题模型和LDA主题模型在医疗评论主题挖掘中的效果。实验结果表明改进的COA-BTM模型在主题一致性和主题质量上均具有更好的效果,证明了其在在线医疗评论挖掘领域的有效性。基于改进算法在医疗评论主题挖掘中的应用和SERVQUAL模型,更全面地识别了医疗服务质量影响因素。 展开更多
关键词 主题模型 在线医疗评论 词共现分析 COA-btm模型
在线阅读 下载PDF
基于BTM图卷积网络的短文本分类方法 被引量:5
8
作者 郑诚 董春阳 黄夏炎 《计算机工程与应用》 CSCD 北大核心 2021年第4期155-160,共6页
由于短文本长度较短,在分类时会面临数据稀疏和语义模糊等问题。提出新型图卷积网络BTM_GCN,该网络利用双项主题模型(Biterm Topic Model,BTM)在短文本数据集上训练出固定数量的文档级潜在主题,并作为一种节点嵌入到文本异构图中,再与... 由于短文本长度较短,在分类时会面临数据稀疏和语义模糊等问题。提出新型图卷积网络BTM_GCN,该网络利用双项主题模型(Biterm Topic Model,BTM)在短文本数据集上训练出固定数量的文档级潜在主题,并作为一种节点嵌入到文本异构图中,再与异构图中的文档节点进行连接,最后利用图卷积网络来捕获文档、词与主题节点之间的高阶邻域信息,从而丰富文档节点的语义信息,缓解短文本语义模糊的问题。在三个英文短文本数据集上的实验结果表明,该方法相比基准模型具有较优的分类效果。 展开更多
关键词 短文本分类 图卷积网络 btm主题模型
在线阅读 下载PDF
400km/h及以上高速铁路应答器报文译码失败概率研究
9
作者 徐宁 王瑞 +1 位作者 刘佳 何之煜 《中国铁路》 北大核心 2025年第6期102-108,共7页
应答器传输模块(BTM)进行应答器报文译码失败的概率是表征BTM接收应答器信号质量的重要指标,为了研究应答器传输模块在速度400km/h及以上高速铁路中的适用性,以BTM进行应答器报文译码失败的概率为研究对象,构建带吸收壁的马尔可夫过程模... 应答器传输模块(BTM)进行应答器报文译码失败的概率是表征BTM接收应答器信号质量的重要指标,为了研究应答器传输模块在速度400km/h及以上高速铁路中的适用性,以BTM进行应答器报文译码失败的概率为研究对象,构建带吸收壁的马尔可夫过程模型;在此基础上深入分析应答器报文译码失败概率与不同车速和不同应答器作用范围的关系。通过仿真理论计算得出,当列车速度达到400km/h时,应答器报文译码失败概率较目前速度为350 km/h的情况下上升约24倍;若应答器作用范围加大到0.8 m,当速度为400km/h时,应答器报文译码失败概率与目前速度为300 km/h的情况基本相当。 展开更多
关键词 400km/h高速铁路 应答器 应答器传输模块(btm) 带吸收壁的马尔可夫过程模型 译码失败概率 报文
在线阅读 下载PDF
融合BTM和图论的微博检索模型 被引量:2
10
作者 蔡晨 罗可 《计算机工程与科学》 CSCD 北大核心 2019年第8期1512-1518,共7页
微博数据量庞大且微博文本的字符数少、特征稀疏,为提高检索精度,提出一种融合BTM和图论的微博检索模型,通过词汇语义相关度计算微博文本中带有标签的特征相关度,构建bi-term主题模型,用JSD距离计算映射到该模型中短文本的词对相关度,抽... 微博数据量庞大且微博文本的字符数少、特征稀疏,为提高检索精度,提出一种融合BTM和图论的微博检索模型,通过词汇语义相关度计算微博文本中带有标签的特征相关度,构建bi-term主题模型,用JSD距离计算映射到该模型中短文本的词对相关度,抽取CN-DBpedia中实体及图结构,再使用SimRank算法计算图结构中实体间的相关度。综上3种相关度为该模型最终相关度。最后使用新浪微博数据集进行检索实验,实验结果表明:对比于融合隐含狄利克雷分布算法与图论的检索模型和基于开放数据关联和图论方法系统模型,新模型在MAP、准确率和召回率上性能有明显提高,说明该模型具有较优的检索性能。 展开更多
关键词 微博 短文本 相似度计算 btm 图论 主题模型
在线阅读 下载PDF
牵引系统引发BTM天线受扰的预测模型研究 被引量:1
11
作者 袁忠康 张健穹 +1 位作者 曹巍楠 周天一 《铁道标准设计》 北大核心 2023年第5期138-144,共7页
车载BTM(Balise Transmission Module)天线是列车应答器系统的核心部件,处于车底复杂电磁环境中,易受到电磁干扰影响列车正常运行。近期出现的车载应答器受扰问题多是由于牵引系统引发的干扰信号耦合到BTM天线中导致的,针对牵引系统引发... 车载BTM(Balise Transmission Module)天线是列车应答器系统的核心部件,处于车底复杂电磁环境中,易受到电磁干扰影响列车正常运行。近期出现的车载应答器受扰问题多是由于牵引系统引发的干扰信号耦合到BTM天线中导致的,针对牵引系统引发BTM天线受扰问题,开展列车车载BTM天线受扰的干扰预测模型研究。首先,通过分析城轨列车牵引系统干扰源产生机理及完整的干扰传递路径,搭建车载BTM天线受扰的全链路电磁干扰预测仿真模型;其次,将仿真获取的干扰电压传递函数与现场测得的变流器整流侧共模电流在频域进行叠加,得到车载BTM天线干扰预测电压;最后,将仿真结果与测试结果进行对比,验证干扰预测模型的准确性。研究表明,通过仿真获取的干扰预测电压与现车实测结果在2~6 MHz内具有一致性,覆盖车载BTM天线工作频段,可对车载BTM天线的受扰情况进行有效预测。研究成果为进一步探究干扰控制方法,提高列车运行的安全性奠定了基础。 展开更多
关键词 车载btm天线 电磁干扰 牵引系统 城轨列车 预测模型
在线阅读 下载PDF
基于BTM模型和改进聚类算法的热点话题检测 被引量:4
12
作者 徐菲菲 陈赛红 田宇 《计算机应用与软件》 北大核心 2022年第5期283-290,共8页
随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热... 随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热点话题;针对K-Means算法初始值敏感等问题,将基于共轭梯度的人工鱼群算法引入传统的K-Means算法;利用改进K-Means聚类算法对得到的话题词进行聚类。实验结果表明,所提方法与传统方法相比可有效、准确提高话题的准确性。 展开更多
关键词 btm模型 话题检测 K-MEANS聚类 共轭梯度 人工鱼群
在线阅读 下载PDF
基于BTM的物联网服务发现方法 被引量:2
13
作者 王舒漫 李爱萍 +2 位作者 段利国 付佳 陈永乐 《计算机应用》 CSCD 北大核心 2020年第2期459-464,共6页
针对物联网(IoT)服务描述文本篇幅较短、特征稀疏,直接采用传统的主题模型对IoT服务建模得到的聚类效果不佳,从而导致无法发现最佳服务的问题,提出了一种基于BTM的IoT服务发现方法。该方法首先利用BTM挖掘现有IoT服务的隐含主题,并通过... 针对物联网(IoT)服务描述文本篇幅较短、特征稀疏,直接采用传统的主题模型对IoT服务建模得到的聚类效果不佳,从而导致无法发现最佳服务的问题,提出了一种基于BTM的IoT服务发现方法。该方法首先利用BTM挖掘现有IoT服务的隐含主题,并通过全局主题分布和主题-词分布计算推理得到服务文档-主题概率分布;其次利用K-means算法对服务进行聚类,并返回服务请求的最佳匹配结果。实验结果分析表明,该方法能够有效提高IoT服务的聚类效果,从而得到匹配的最佳服务。与现有的HDP(Hierarchical Dirichlet Process)、基于K-means的隐狄利克雷分配(LDA-K)等方法相比,该方法进行最佳服务发现的准确度(Precision)和归一化折损累积增益(NDCG)均有一定幅度的提高。 展开更多
关键词 物联网服务 btm 短文本 主题建模 服务发现
在线阅读 下载PDF
基于文本数据的灾害信息风险监测与预警集成方法研究 被引量:1
14
作者 王治莹 陈笑 刘翰界 《灾害学》 CSCD 北大核心 2024年第4期81-87,共7页
基于灾害信息的文本数据,该文提出一种风险监测与预警集成方法,以提高灾害信息风险监测效率及监测支持预警的针对性。首先,运用八爪鱼数据采集器采集和处理灾害信息的文本数据;其次,运用BTM主题模型构建灾害信息风险监测模型,得到主题... 基于灾害信息的文本数据,该文提出一种风险监测与预警集成方法,以提高灾害信息风险监测效率及监测支持预警的针对性。首先,运用八爪鱼数据采集器采集和处理灾害信息的文本数据;其次,运用BTM主题模型构建灾害信息风险监测模型,得到主题热度趋势并确定具有高风险且亟待预警的话题;然后,提出灾害信息风险预警指标体系和预警等级判定方法,计算所确定话题的风险综合指标预警加权值,并结合预警区间判定预警等级;最后,以2021年“7·20”郑州特大暴雨灾害信息的风险监测和预警为例进行实验分析,验证所提方法的可行性。研究表明,该方法可将灾害信息的文本数据贯穿于风险监测与预警两个过程,有助于为监测结果更有针对性地支持预警工作提供参考。 展开更多
关键词 灾害信息 风险监测 风险预警 集成方法 文本数据 btm主题模型
在线阅读 下载PDF
HFL模型在海上压裂工艺过程风险评估中的应用 被引量:2
15
作者 武胜男 张来斌 +2 位作者 郑文培 赵战江 张超 《中国安全科学学报》 CAS CSCD 北大核心 2015年第2期153-158,共6页
为有效降低海上压裂工艺过程事故发生的可能性,建立将危险与可操作性研究(HAZOP)、事故树分析(FTA)和保护层分析(LOPA)集成的量化风险评估模型(HFL模型)。阐述HFL模型的集成机理和分析流程。以海上压裂工艺过程高压管线危险性分析为实例... 为有效降低海上压裂工艺过程事故发生的可能性,建立将危险与可操作性研究(HAZOP)、事故树分析(FTA)和保护层分析(LOPA)集成的量化风险评估模型(HFL模型)。阐述HFL模型的集成机理和分析流程。以海上压裂工艺过程高压管线危险性分析为实例,开展该模型的研究与应用。在运用HAZOP方法对危险源初步辨识基础上,构建高压管线超压的蝴蝶结模型(BTM),确定导致事故发生的9种风险因素和5种事故后果,并估算高压管线断裂事故场景的初始事件概率和剩余事故风险。结果表明,现有的独立保护层(IPL)即超压电子保护装置无法使事故风险达到可接受水平,需要通过增加新的IPL,即安装井口保护装置和泄压装置,提高压裂过程高压管线运行的可靠性,确保剩余事故风险处于可接受水平。 展开更多
关键词 HFL模型 高压管线超压 蝴蝶结模型(btm) 独立保护层(IPL) 量化评估 剩余事故风险
在线阅读 下载PDF
一种针对短文本的主题情感混合模型 被引量:4
16
作者 谢珺 郝洁 +2 位作者 苏婧琼 邹雪君 李思宇 《中文信息学报》 CSCD 北大核心 2017年第1期162-168,共7页
主题情感混合模型可以同时提取语料的主题信息和情感倾向。针对短文本特征稀疏的问题,主题情感联合分析方法较少的问题,该文提出了BJSTM模型(Biterm Joint Sentiment Topic Model),在BTM模型(Biterm Topic Model)的基础上,增加情感层的... 主题情感混合模型可以同时提取语料的主题信息和情感倾向。针对短文本特征稀疏的问题,主题情感联合分析方法较少的问题,该文提出了BJSTM模型(Biterm Joint Sentiment Topic Model),在BTM模型(Biterm Topic Model)的基础上,增加情感层的设置,从而形成"情感-主题-词汇"的三层贝叶斯模型。对每个双词的情感和主题进行采样,从而对整个语料的词共现关系建模,一定程度上克服了短文本的稀疏性。实验表明,BJSTM模型在无监督情感分类和主题提取方面都有不错的表现。 展开更多
关键词 主题情感混合模型 情感分类 btm
在线阅读 下载PDF
基于Biterm主题模型的无监督微博情感倾向性分析 被引量:13
17
作者 张佳明 王波 +1 位作者 唐浩浩 李天彩 《计算机工程》 CAS CSCD 北大核心 2015年第7期219-223,229,共6页
基于传统主题模型的无监督情感倾向性分析方法不能较好地解决微博语料特征稀疏的问题。为此,提出一种新的无监督微博情感倾向性分析方法。对语料进行预处理并统计语料中的共现词对,利用BTM模型挖掘文档中的隐含主题,通过已有情感词典分... 基于传统主题模型的无监督情感倾向性分析方法不能较好地解决微博语料特征稀疏的问题。为此,提出一种新的无监督微博情感倾向性分析方法。对语料进行预处理并统计语料中的共现词对,利用BTM模型挖掘文档中的隐含主题,通过已有情感词典分析隐含主题的情感分布,并实现整条微博的情感倾向性分析。在NLP&CC2012语料上进行测试,结果表明,该方法能够有效识别微博的情感倾向,平均F1值比传统主题模型方法提高15%。 展开更多
关键词 微博 短文本 情感倾向性分析 无监督 Biterm主题模型
在线阅读 下载PDF
基于双词语义扩展的Biterm主题模型 被引量:4
18
作者 李思宇 谢珺 +2 位作者 邹雪君 续欣莹 冀小平 《计算机工程》 CAS CSCD 北大核心 2019年第1期210-216,共7页
针对Biterm主题模型短文本文档的双词产生过程中词对之间缺乏语义联系的情况,提出一种融入词对语义扩展的Biterm主题模型。考虑双词的语义关系,引入词向量模型。通过训练词向量模型,判断词与词之间的语义距离,并根据语义距离对Biterm主... 针对Biterm主题模型短文本文档的双词产生过程中词对之间缺乏语义联系的情况,提出一种融入词对语义扩展的Biterm主题模型。考虑双词的语义关系,引入词向量模型。通过训练词向量模型,判断词与词之间的语义距离,并根据语义距离对Biterm主题模型进行双词语义扩展。实验结果表明,与现有Biterm主题模型相比,该模型不仅具有较好的短文本主题分类效果,而且双词间的语义关联性能及主题词义聚类性能也得到明显提升。 展开更多
关键词 Biterm主题模型 双词 词向量 双词语义 吉布斯采样
在线阅读 下载PDF
一种基于词和事件主题的卷积网络的新闻文本分类方法 被引量:3
19
作者 于游 付钰 吴晓平 《计算机应用与软件》 北大核心 2021年第5期170-174,240,共6页
针对传统文本分类过程中词表示特征时不够全面、可解释性差的问题,提出一种基于词和事件主题的W-E CNN文本分类方法,并给出基于BTM的事件主题模型。将传统基于词的特征表示方法与事件主题特征表示方法进行拼接作为CNN的输入,丰富特征语... 针对传统文本分类过程中词表示特征时不够全面、可解释性差的问题,提出一种基于词和事件主题的W-E CNN文本分类方法,并给出基于BTM的事件主题模型。将传统基于词的特征表示方法与事件主题特征表示方法进行拼接作为CNN的输入,丰富特征语义信息,提高了文本分类的准确性。实验分析可知,该方法的分类准确性在一定程度上要优于其他方法。 展开更多
关键词 文本分类 事件主题模型 btm CNN
在线阅读 下载PDF
基于异构图卷积网络的小样本短文本分类方法 被引量:11
20
作者 袁自勇 高曙 +1 位作者 曹姣 陈良臣 《计算机工程》 CAS CSCD 北大核心 2021年第12期87-94,共8页
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主... 针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。 展开更多
关键词 小样本短文本分类 异构图卷积网络 短文本异构信息网络 btm主题模型 过拟合
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部