期刊文献+
共找到211篇文章
< 1 2 11 >
每页显示 20 50 100
基于TF-IDF算法的无线传感网络攻击流量检测方法研究 被引量:1
1
作者 王晨 刘鑫 《传感技术学报》 北大核心 2025年第4期744-748,共5页
无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归... 无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归一化处理离散型流量;然后通过TF-IDF算法提取无线传感网络流量特征,利用特征向量集训练多通道自编码器,利用TF-IDF算法计算待检测的攻击流量数据特征在无线传感网络流量内出现的频率,以此对攻击流量进行排序;最后通过Softmax分类器输出最终流量类型检测结果。仿真结果表明,所提方法的检测精确度最低值为97.05%,虚警率最高值为2.01%、测试时间平均值为20.1 s,证明所提方法能高效、精确地实现无线传感网络攻击流量检测。 展开更多
关键词 无线传感网络 攻击流量检测 tf-idf算法 多通道自编码器
在线阅读 下载PDF
基于熵优化的TF-IDF算法研究
2
作者 王逸蓓 王芳 《燕山大学学报》 北大核心 2025年第5期422-428,共7页
传统的TF-IDF(Term Frequency-Inverse Document Frequency)算法通过特征项的频率对文本特征项进行表示,然而该算法在考虑类别分布信息存在一定的局限性,即忽略了特征项在类内和类间分布。针对这一问题,本文首先提出基于信息熵优化的TF-... 传统的TF-IDF(Term Frequency-Inverse Document Frequency)算法通过特征项的频率对文本特征项进行表示,然而该算法在考虑类别分布信息存在一定的局限性,即忽略了特征项在类内和类间分布。针对这一问题,本文首先提出基于信息熵优化的TF-IDF算法,引入去中心化词频因子和信息熵,捕捉特征项在类内和类间的分布特征。在此基础上,进一步结合期望信息熵理论,提出基于期望交叉熵优化的TF-IDF算法。通过对比实验,基于信息熵优化的TF-IDF算法一定程度上提升了模型性能,但基于期望交叉熵优化的TF-IDF算法在精度、召回率和F1值上表现更佳。 展开更多
关键词 tf-idf 特征项 词频 期望交叉熵
在线阅读 下载PDF
基于电网对账系统的TF-IDF优化算法
3
作者 王岩 郭威 +1 位作者 隋海滨 符贵谦 《兵工自动化》 北大核心 2025年第4期83-87,共5页
为提高电网集团对账系统的工作效率,优化电网集团的服务效果,设计一种TF-IDF词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)优化算法。论述电网集团对账系统的基本设计,讨论服务器和浏览器(browser/server,B/S... 为提高电网集团对账系统的工作效率,优化电网集团的服务效果,设计一种TF-IDF词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)优化算法。论述电网集团对账系统的基本设计,讨论服务器和浏览器(browser/server,B/S)架构下的TF-IDF算法优化设计方法,对B/S架构下使用TF-IDF算法优化设计在电网系统中的综合应用效果进行分析。结果表明:该算法的对账效果提升明显,为优化电网对账系统提供了技术基础,为提升电网集团服务质量做出了贡献。 展开更多
关键词 电网集团 B/S架构 tf-idf算法 电网对账系统 对账效果
在线阅读 下载PDF
基于TF-IDF加权机制的交通事故致因关联规则挖掘研究
4
作者 熊杰 李慧 《农业装备与车辆工程》 2025年第10期113-119,共7页
基于我国西部M市2023—2024年道路交通事故数据,围绕“人-车-路-环境-管理”五大致因维度构建系统性变量体系,引入事故参与方数量作为致因复杂度代理指标,利用TF-IDF加权机制优化Apriori算法,通过对伤亡事故复合致因模式的挖掘,提升低... 基于我国西部M市2023—2024年道路交通事故数据,围绕“人-车-路-环境-管理”五大致因维度构建系统性变量体系,引入事故参与方数量作为致因复杂度代理指标,利用TF-IDF加权机制优化Apriori算法,通过对伤亡事故复合致因模式的挖掘,提升低频高价值致因的识别能力。研究结果显示:车辆违法(不按规定让行、违反信号灯)与行人违法穿行是导致伤亡事故的核心因素;低能见度、交通设施效能不足加剧了事故风险;“刮撞行人”的事故形态在人员受伤中高频出现;死亡事故呈现人、车、路、环境、管理多因素交织的复合致因,可为交通事故预防与差异化治理提供理论与方法参考。 展开更多
关键词 交通事故 致因分析 关联规则挖掘 tf-idf加权
在线阅读 下载PDF
应急决策文本的多维语义挖掘方法——基于TF-IDF和PMI的技术框架 被引量:1
5
作者 邓云峰 冯永康 王双燕 《中国安全生产科学技术》 北大核心 2025年第5期36-45,共10页
为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词... 为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词和LTP平台的依存句法分析,挖掘文本中的目标和行动信息,利用TF-IDF算法和词云图展示关键行动,然后通过PMI构建复杂网络,揭示行动间的关联性和决策偏好。研究结果表明:结合应急行动分类体系,TF-IDF算法能精确提取文本中目标和行动信息,以频次反映行动的受关注程度,为理解决策者的决心和意图提供支持;PMI和改良PMI方法能有效挖掘行动的共现关系,揭示行动之间的关联性和决策偏好,其中PMI方法适合分析行动之间的平均相关性,而改良PMI方法能识别出低频高权重的行动关联。研究结果可为分析决策行为特征,细化实化应急决策部署提供可扩展的支持性工具。 展开更多
关键词 应急决策文本 词频-逆文档频率 点互信息 关联性分析 复杂网络 依存句法分析
在线阅读 下载PDF
基于词频差异的特征选取及改进的TF-IDF公式 被引量:56
6
作者 罗欣 夏德麟 晏蒲柳 《计算机应用》 CSCD 北大核心 2005年第9期2031-2033,共3页
文档向量化的质量对于文本分类的速度和准确度有着很大的影响。对文档向量化中常用的TF-IDF公式,互信息量公式以及信息增益公式进行了分析。提出一种基于词频差异的特征选取方法和改进的TF-IDF公式,以提高特征选取质量和文本分类的速度... 文档向量化的质量对于文本分类的速度和准确度有着很大的影响。对文档向量化中常用的TF-IDF公式,互信息量公式以及信息增益公式进行了分析。提出一种基于词频差异的特征选取方法和改进的TF-IDF公式,以提高特征选取质量和文本分类的速度及准确度。 展开更多
关键词 特征选取 向量空间模型 文本分类 tf-idf 信息增益 互信息量
在线阅读 下载PDF
移动机器人闭环检测的视觉字典树金字塔TF-IDF得分匹配方法 被引量:26
7
作者 李博 杨丹 邓林 《自动化学报》 EI CSCD 北大核心 2011年第6期665-673,共9页
针对移动机器人视觉闭环检测中,基于视觉字典本的场景外观表征性能受制于有限单词个数以及算法效率低的不足,本文对机器人视觉特征分层量化,构建视觉字典树,计算树节点的TF-IDF熵作为对应视觉单词的权重,生成图像–单词逆向文档索引.为... 针对移动机器人视觉闭环检测中,基于视觉字典本的场景外观表征性能受制于有限单词个数以及算法效率低的不足,本文对机器人视觉特征分层量化,构建视觉字典树,计算树节点的TF-IDF熵作为对应视觉单词的权重,生成图像–单词逆向文档索引.为消除视觉字典本的单尺度量化误差,并克服基于字典树投影路径的平面匹配模式中不区分不同层次节点的区分度对闭环检测的影响,本文融合字典树低层单词的强表征性和高层单词的强鲁棒性,提出由下而上逐层计算图像间相似性增量的金字塔得分匹配方法.将不同时刻相似性大于阈值的图像位置提取为候选闭环,通过后验确认操作剔除误正闭环.在移动机器人视觉闭环检测实验中,本文算法提高了图像相似性计算的效率和准确性,提高了闭环检测的准确率和召回率. 展开更多
关键词 闭环检测 视觉字典树 tf-idf得分准则 金字塔匹配
在线阅读 下载PDF
TF-IDF与规则相结合的中文关键词自动抽取研究 被引量:35
8
作者 牛萍 黄德根 《小型微型计算机系统》 CSCD 北大核心 2016年第4期711-715,共5页
关键词的抽取广泛应用于自然语言处理过程中.对于中文关键词抽取,分词结果及候选词的选取严重影响后期的抽取结果.针对候选词的选取,提出一种连续单字未登录词识别和多词短语识别的方法来进行候选词选择,可以较好的识别出频率大于1的未... 关键词的抽取广泛应用于自然语言处理过程中.对于中文关键词抽取,分词结果及候选词的选取严重影响后期的抽取结果.针对候选词的选取,提出一种连续单字未登录词识别和多词短语识别的方法来进行候选词选择,可以较好的识别出频率大于1的未登录词,且不依赖于语料库规模和领域.并且,在传统的TF-IDF基础上,结合位置特征和长度特征的情况下,考虑兼类词的不同词性问题,提出改进的TF-IDF计算公式,进行关键词抽取.通过比较实验,证明了候选词对关键词抽取的影响,与TF-IDF进行比较实验,改进的TF-IDF的准确率提高了5%左右. 展开更多
关键词 抽取 未登录词识别 候选词抽取 tf-idf
在线阅读 下载PDF
基于行业专有词典的TF-IDF特征选择算法改进 被引量:8
9
作者 张齐勋 刘宏志 +2 位作者 刘诗祥 贾堂 曹健 《计算机应用与软件》 2017年第7期277-281,共5页
行业专有词典是收录特定行业专有用语的词典,将行业专有词典运用到基于TF-IDF的特征选取算法中可提高文本特征空间的完备性。基于TF-IDF的改进算法的核心目标是提取出低频的关键词,现有的基于统计特征的改进方法增加了原始算法的计算复... 行业专有词典是收录特定行业专有用语的词典,将行业专有词典运用到基于TF-IDF的特征选取算法中可提高文本特征空间的完备性。基于TF-IDF的改进算法的核心目标是提取出低频的关键词,现有的基于统计特征的改进方法增加了原始算法的计算复杂度,降低了算法的效率。针对这一问题,在原始的TF-IDF特征选取算法上采用词典映射的方法提取低频关键词来构建完备的特征空间。实验结果表明,基于行业专有词典的TFIDF算法提取出的特征较未使用行业专有词典特征选取算法提取出的特征在后续的二次聚类验证实验中能有效地提高聚类的查全率和查准率。 展开更多
关键词 行业专有词典 tf-idf 特征空间 特征选择算法
在线阅读 下载PDF
基于C-value与TF-IDF的文献簇主题识别研究 被引量:11
10
作者 陈仕吉 王小梅 《情报学报》 CSSCI 北大核心 2009年第6期821-826,共6页
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此... 引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征。本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法。实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别。 展开更多
关键词 C-VALUE tf-idf CV-IDF 引文分析 主题识别
在线阅读 下载PDF
基于改进TF-IDF算法的牛疾病智能诊断系统 被引量:12
11
作者 杜永兴 牛丽静 +1 位作者 秦岭 李宝山 《计算机应用与软件》 北大核心 2021年第2期50-53,57,共5页
传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统的性能。对此,提出一种改进的TF-IDF算法,并将其应用在牛疾病诊断系统中。系统将用户描述的文本内容... 传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统的性能。对此,提出一种改进的TF-IDF算法,并将其应用在牛疾病诊断系统中。系统将用户描述的文本内容转换成向量的形式,用TF-IDF算法提取关键症状词,利用余弦定理和可信度计算给出可靠的疾病推荐和治疗方案。实验结果表明,该算法在疾病诊断中准确率和可信度两方面都具有更好的效果。与传统TF-IDF算法相比,平均可信度提高约4%。 展开更多
关键词 智能诊断 tf-idf 余弦相似度 VSM
在线阅读 下载PDF
一种基于改进TF-IDF函数的文本分类方法 被引量:6
12
作者 卢中宁 张保威 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第6期158-160,174,共4页
为了解决传统TF-IDF函数由于忽略特征项之间的联系带来的诸多问题,对TF-IDF函数在文本分类中的应用进行了研究.结合信息论相关知识,找出了类间分布度和类内分布度表征特征项之间的潜在关系,进而提出改进的TF-IDF函数用于文本分类.实验表... 为了解决传统TF-IDF函数由于忽略特征项之间的联系带来的诸多问题,对TF-IDF函数在文本分类中的应用进行了研究.结合信息论相关知识,找出了类间分布度和类内分布度表征特征项之间的潜在关系,进而提出改进的TF-IDF函数用于文本分类.实验表明,改进后的TF-IDF函数是有效可行的,而且较好的弥补了传统方法所丢失的特征项之间的关联信息,提高了文本分类的准确率. 展开更多
关键词 VSM tf-idf函数 权重 文本分类
在线阅读 下载PDF
基于改进的TF-IDF权重的短文本分类算法 被引量:15
13
作者 杨彬 韩庆文 +4 位作者 雷敏 张亚鹏 刘向国 杨亚强 马雪峰 《重庆理工大学学报(自然科学)》 CAS 2016年第12期108-113,共6页
短文本具有特征稀疏的特点,如采用TF-IDF权重和算法来选择短文本特征,很多具有专业领域信息特征而训练集中未出现过的特征将被忽略,从而导致待分类文本集的权值分布比较集中,区分度小,最终影响短文本信息推送。因此,一种基于改进的TF-ID... 短文本具有特征稀疏的特点,如采用TF-IDF权重和算法来选择短文本特征,很多具有专业领域信息特征而训练集中未出现过的特征将被忽略,从而导致待分类文本集的权值分布比较集中,区分度小,最终影响短文本信息推送。因此,一种基于改进的TF-IDF权重的短文本分类算法被提出。该算法通过同义词对分类器的关键词库进行扩展和基于特征长度对短文本权值进行加权,使得文本集的权值方差增大。与直接对短文本进行扩展的算法相比,该算法具有更快的分类速度。 展开更多
关键词 短文本 tf-idf权重 特征扩展
在线阅读 下载PDF
基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型 被引量:43
14
作者 王根生 黄学坚 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1120-1126,共7页
针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出... 针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果. 展开更多
关键词 Word2vec 改进型tf-idf算法 卷积神经网络 文本分类 CTMWT
在线阅读 下载PDF
基于TF-IDF相对熵的中医证候量化研究 被引量:7
15
作者 余江维 余泉 +1 位作者 张太珍 彭玉 《世界科学技术-中医药现代化》 2015年第10期1986-1991,共6页
提出了用术语频率-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)相对熵作为证候量化的表示方法。TF-IDF思想来源于文本信息挖掘,是文本自动分类中一种重要的方法。TF-IDF算法也体现了中医证候的自动分类思想:一个症... 提出了用术语频率-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)相对熵作为证候量化的表示方法。TF-IDF思想来源于文本信息挖掘,是文本自动分类中一种重要的方法。TF-IDF算法也体现了中医证候的自动分类思想:一个症状在特定证候中出现的频率越高,说明它在区分该证候方面的能力(即TF)越强;一个症状在所有证候中出现的范围越广,说明它区分某证候的能力(即IDF)越低,并用具体实例进行了验证。 展开更多
关键词 中医 tf-idf 相对熵 证候量化 文本挖掘
在线阅读 下载PDF
基于TF-IDF改进聚类算法的网络敏感信息挖掘 被引量:6
16
作者 孟彩霞 陈红玉 《现代电子技术》 北大核心 2015年第24期44-46,49,共4页
网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。提出基于TF-IDF改进聚类算法的网络敏感信息挖掘方法,通过TF-IDF方法获取网... 网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。提出基于TF-IDF改进聚类算法的网络敏感信息挖掘方法,通过TF-IDF方法获取网络敏感信息文本,在网络敏感信息文本中获取有价值的敏感信息特征,采用该信息完成聚类算法,对全部敏感信息特征进行聚类分析,完成网络敏感信息的挖掘。实验结果说明,所提方法进行网络敏感信息挖掘,具有较高的挖掘效率和精度。 展开更多
关键词 tf-idf 聚类分析 网络敏感信息 信息挖掘
在线阅读 下载PDF
基于TF-IDF改进算法的聚焦主题网络爬虫 被引量:16
17
作者 王景中 邱铜相 《计算机应用》 CSCD 北大核心 2015年第10期2901-2904,2919,共5页
针对传统的TF-IDF算法、K-means算法、自适应遗传算法在网络检索结果中含有大量不相关数据、语义检索准确性不高的问题,研究了TF-IDF算法的改进及其在语义检索中的应用。将正则表达式和语义分析技术相结合,从而实现对TF-IDF算法的改进... 针对传统的TF-IDF算法、K-means算法、自适应遗传算法在网络检索结果中含有大量不相关数据、语义检索准确性不高的问题,研究了TF-IDF算法的改进及其在语义检索中的应用。将正则表达式和语义分析技术相结合,从而实现对TF-IDF算法的改进。利用语义库对搜索主题进行描述,根据正则原子语义的重要性和在网页标签中的不同位置进行加权计算,得到正则原子在文档中的相似度。通过空间向量模型对文档相似度和主题模型进行余弦运算,从而获取最终的搜索结果。最后,将改进的TF-IDF算法、传统的TF-IDF算法、K-means算法和自适应遗传算法运用于聚焦主题网络爬虫中,对其检索结果进行了对比分析。计算结果表明,在聚焦主题网络爬虫语义分析的垂直搜索中,改进TF-IDF算法的相似度准确率比传统的TF-IDF算法检索准确率提高了17.1个百分点,遗漏率降低了7.76个百分点;比K-means算法检索准确率提高6个百分点;比自适应遗传算法检索准确率提高了8.1个百分点。总之,改进的TF-IDF算法可以有效地提高文档相似度检测的准确率,很好地改善聚焦主题网络爬虫在语义分析中的缺陷。 展开更多
关键词 网络爬虫 语义分析 搜索引擎 tf-idf 主题爬虫 文档相似度
在线阅读 下载PDF
结合TF-IDF的企业生产隐患关联预警及可视化研究 被引量:14
18
作者 胡瑾秋 张曦月 吴志强 《中国安全科学学报》 CAS CSCD 北大核心 2019年第7期170-176,共7页
为有效利用企业在日常管理中积累的大量生产事故隐患记录,实现隐患预警,解决人工分析数据效率低、主观性强等问题,构建结合词频率-逆文档频率(TF-IDF)的企业生产隐患关联预警可视化模型。首先,运用先验(Apriori)关联规则算法挖掘各隐患... 为有效利用企业在日常管理中积累的大量生产事故隐患记录,实现隐患预警,解决人工分析数据效率低、主观性强等问题,构建结合词频率-逆文档频率(TF-IDF)的企业生产隐患关联预警可视化模型。首先,运用先验(Apriori)关联规则算法挖掘各隐患间的潜在联系,获取信息中的隐藏价值;然后,引入TF-IDF算法优化关联规则,找出隐患间的关键规则;最后,运用可视化技术直观地展现挖掘结果。研究表明:可视化模型能快速、准确地实现隐患预警;对关联规则的优化,解决了Apriori算法支持度依赖性强的问题;挖掘结果能为企业安全管理者提供整改方向与依据。 展开更多
关键词 词频率-逆文档频率(tf-idf) 先验(Apriori)关联分析 优化排序 隐患预警 文本可视化
在线阅读 下载PDF
基于TF-IDF和VOSviewer的我国应急救援现状可视化分析 被引量:6
19
作者 黄萍 张文龙 +2 位作者 叶圣琳 余君 余龙星 《中国安全科学学报》 CAS CSCD 北大核心 2023年第11期196-205,共10页
为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2... 为有效利用消防救援队伍的实战记录资料挖掘应急救援战例成功经验,结合词频-逆文档频率(TF-IDF)算法和VOSviewer文献可视化分析技术,构建战例资料分析模型,分析战例成功与失败的共性规律和特点,总结我国应急救援现状及发展趋势。模型以2007—2019年间共185起应急救援典型战例为数据库,按照自然灾害、交通事故、建筑坍塌、危化品泄漏、火灾扑救等应急救援行动类型展开分析。结果表明:我国应急救援行动的影响因素主要表现在人(救援队伍)、机(装备技术)、环(环境)、管(管理)4个方面。其中,环境因素的影响几乎都是负面的,其他3个因素均有正负面影响。此外,不同应急救援行动类型的主导影响因素存在差异,自然灾害突出“机”;交通事故突出“管”;建筑坍塌突出“机”“环”;危化品泄漏在“人机环管”4个方面均有突出问题;火灾救援突出“机”。 展开更多
关键词 词频-逆文档频率(tf-idf) VOSviewer 应急救援 消防救援 可视化分析 战例分析
在线阅读 下载PDF
基于TF-IDF加权的卷积神经网络文本情感分类模型 被引量:6
20
作者 李昌兵 赵玲 +1 位作者 李晓光 王利 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第11期109-115,共7页
构建好的文本向量表示对文本情感分类任务十分重要。针对文本中词语类别区分能力的不同,提出了一种用改进的TF-IDF加权Word2Vec的文本向量表示方法(ITIW),对类别区分能力不同的词语赋予不同的权重,将基于该方法构建的词向量作为卷积神... 构建好的文本向量表示对文本情感分类任务十分重要。针对文本中词语类别区分能力的不同,提出了一种用改进的TF-IDF加权Word2Vec的文本向量表示方法(ITIW),对类别区分能力不同的词语赋予不同的权重,将基于该方法构建的词向量作为卷积神经网络(CNN)的输入,设计了ITIW-CNN文本情感分类模型。该模型通过改进TF-IDF以区分不同词语的类别表示能力,计算词语的权重,进而得到词语的加权词向量表示(ITIW),将加权词向量输入CNN进行文本情感分类,促使模型具有更好的分类能力。实验结果表明:与传统的表示文本的分类算法相比,ITIW-CNN模型在各项指标上均有一定的提高,F 1值和分类准确率分别达到94.77%、92.80%。ITIW-CNN模型能够有效提升文本的情感分类效果。 展开更多
关键词 tf-idf Word2Vec 卷积神经网络 情感分类
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部