期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于TF·IEF模型的在线新闻事件探测方法 被引量:3
1
作者 张辉 李国辉 +1 位作者 贾立 孙博良 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第3期55-60,共6页
为了提升在线新闻事件探测的性能,提出一种基于TF.IEF模型的在线新闻事件探测方法。该方法受TF.IDF思想的启发,直接计算特征词表征事件的权重,建立新的增量事件模型,并将探测过程分为两个阶段:第一阶段利用Single-Pass将一定时段内收集... 为了提升在线新闻事件探测的性能,提出一种基于TF.IEF模型的在线新闻事件探测方法。该方法受TF.IDF思想的启发,直接计算特征词表征事件的权重,建立新的增量事件模型,并将探测过程分为两个阶段:第一阶段利用Single-Pass将一定时段内收集到的报道聚成微簇;第二阶段将微簇与已有事件进行相似性匹配,然后通过重新计算事件向量实现模型更新。实验结果表明,该方法运算速度快,特征信息丢失少,提高了探测的效率和准确率。 展开更多
关键词 在线新闻事件探测 tf·ief模型 增量事件模型 Single-Pass聚类
在线阅读 下载PDF
基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型 被引量:43
2
作者 王根生 黄学坚 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1120-1126,共7页
针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出... 针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果. 展开更多
关键词 Word2vec 改进型tf-IDF算法 卷积神经网络 文本分类 CTMWT
在线阅读 下载PDF
基于改进的TF-IDF软件测试错误信息分析方法 被引量:1
3
作者 王茹 严明 王柳舒 《计算机应用》 CSCD 北大核心 2016年第A02期259-261,共3页
针对软件测试领域人工分析测试用例错误信息工作量大、时间效率低的问题,提出了一种基于改进的词频-逆文本词频(TF-IDF)软件测试错误信息文本分析方法。首先,根据错误信息文本的特点对目标错误信息文本进行预处理,减少了干扰信息,缩短... 针对软件测试领域人工分析测试用例错误信息工作量大、时间效率低的问题,提出了一种基于改进的词频-逆文本词频(TF-IDF)软件测试错误信息文本分析方法。首先,根据错误信息文本的特点对目标错误信息文本进行预处理,减少了干扰信息,缩短了计算时间;然后,结合关键词集合、TF-IDF和向量空间模型(VSM)计算文本特征向量,其中关键词集合避免了多次对数据库中错误信息文本进行TF-IDF权值计算,提高了计算效率;接着,利用余弦相似计算目标错误信息文本与数据库文本之间的相似度,并对相似度排序,从而找到相似度最高的错误信息,进而找到相关联的变更请求(CR);最后,自动关联CR。实验结果表明,该方法在软件测试错误信息分析方面能够有效提高时间效率。 展开更多
关键词 向量空间模型 tf-IDF 文本相似度量 余弦相似 软件测试
在线阅读 下载PDF
TF法则嵌入机制的动态局域加权网络模型
4
作者 马杰良 赵岳 《计算机应用》 CSCD 北大核心 2012年第5期1240-1243,1254,共5页
分析目前加权局域世界演化模型已取得的研究成果,在其基础上进行综合改进与完善,提出一种TF法则嵌入机制的动态局域加权网络模型(TF-DLW),该模型在演化过程中融入了TF法则和BBV权值动态演化机制。平均场理论和计算机模拟仿真均验证了该... 分析目前加权局域世界演化模型已取得的研究成果,在其基础上进行综合改进与完善,提出一种TF法则嵌入机制的动态局域加权网络模型(TF-DLW),该模型在演化过程中融入了TF法则和BBV权值动态演化机制。平均场理论和计算机模拟仿真均验证了该模型强度分布具有幂率特性。同时,计算机仿真中强度分布、边权分布以及度分布均出现了幂率肥尾现象,三角形结构的嵌入使得模型能更平稳地调节聚类系数的大小。实验表明,TF-DLW演化模型继承了许多复杂模型具有的幂率分布特性,而且可以快速平稳地调控簇系数的范围大小。 展开更多
关键词 局域加权网络 幂率肥尾 tf-DLW演化模型 BBV模型 tf法则
在线阅读 下载PDF
基于TF-IDF分类算法的雷达情报分发技术 被引量:8
5
作者 余苗 杨瑞娟 +2 位作者 程伟 高路 程红斌 《计算机工程与设计》 CSCD 北大核心 2012年第5期1822-1826,共5页
为了提高情报分发的效率,解决雷达组网上信息过载的问题,提出了一种利用个性化推荐技术过滤情报用户感兴趣的情报信息的技术。根据情报用户兴趣多样性的特点和雷达情报的格式化特征,对情报用户兴趣的类别进行划分,并设计出基于层次向量... 为了提高情报分发的效率,解决雷达组网上信息过载的问题,提出了一种利用个性化推荐技术过滤情报用户感兴趣的情报信息的技术。根据情报用户兴趣多样性的特点和雷达情报的格式化特征,对情报用户兴趣的类别进行划分,并设计出基于层次向量空间模型;在此基础上,利用用户的历史情报信息和定制信息,运用TF-IDF算法挖掘用户兴趣,建立用户兴趣模型,通过实时情报与用户兴趣模型的匹配,将用户感兴趣的情报分发给用户。仿真实验结果表明,该算法能够较好地实现雷达情报的按需分发。 展开更多
关键词 情报按需分发 个性化推荐 层次向量空间模型 兴趣模型 词频-逆文档频率
在线阅读 下载PDF
文本分类TF-IDF算法的改进研究 被引量:121
6
作者 叶雪梅 毛雪岷 +1 位作者 夏锦春 王波 《计算机工程与应用》 CSCD 北大核心 2019年第2期104-109,161,共7页
中国互联网环境的发展,让大量蕴含丰富信息的新词得以普及。而传统的特征词权重TF-IDF(Term Frequency and Inverted Document Frequency)算法主要考虑TF和IDF两个方面的因素,未考虑到新词这一新兴词类的优势。针对特征项中的新词对分... 中国互联网环境的发展,让大量蕴含丰富信息的新词得以普及。而传统的特征词权重TF-IDF(Term Frequency and Inverted Document Frequency)算法主要考虑TF和IDF两个方面的因素,未考虑到新词这一新兴词类的优势。针对特征项中的新词对分类结果的影响,提出基于网络新词改进文本分类TF-IDF算法。在文本预处理中识别新词,并在向量空间模型表示中改变特征权重计算公式。实验结果表明把新词发现加入文本预处理,可以达到特征降维的目的,并且改进后的特征权重算法能优化文本分类的结果。 展开更多
关键词 新词 词频-逆文档频率(tf-IDF) 向量空间模型 文本分类
在线阅读 下载PDF
基于TF-IQF模型的查询建议 被引量:4
7
作者 汪晴 庄卫华 《计算机工程》 CAS CSCD 北大核心 2010年第21期78-80,共3页
基于TF-IQF模型的建议方法不考虑用户查询行为的上下文,在满足用户个性化需求方面存在缺陷。针对这一情况,在该方法的基础上进行优化改进,根据不同用户的查询上下文来分析用户的查询偏好,重新排序系统推荐的查询。实验结果表明,改进方... 基于TF-IQF模型的建议方法不考虑用户查询行为的上下文,在满足用户个性化需求方面存在缺陷。针对这一情况,在该方法的基础上进行优化改进,根据不同用户的查询上下文来分析用户的查询偏好,重新排序系统推荐的查询。实验结果表明,改进方法能够给出个性化的查询建议,提高用户查询的满意度。 展开更多
关键词 查询建议 个性化 tf—IQF模型
在线阅读 下载PDF
基于TF-IDF和多头注意力Transformer模型的文本情感分析 被引量:19
8
作者 高佳希 黄海燕 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期129-136,共8页
文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Documen... 文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见的停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。然后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高模型对语义的分析和泛化能力。该模型在多领域、多类型评论语料库数据集上取得了98.17%的准确率。 展开更多
关键词 文本情感分析 自然语言处理 多头注意力机制 tf-IDF算法 Transformer模型
在线阅读 下载PDF
基于知识图谱、TF-IDF和BERT模型的冬奥知识问答系统 被引量:11
9
作者 罗玲 李硕凯 +3 位作者 何清 杨骋骐 王宇洋恒 陈天宇 《智能系统学报》 CSCD 北大核心 2021年第4期819-826,共8页
传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点。本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数(term frequency-inverse documen... 传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点。本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数(term frequency-inverse document frequency,TF-IDF)和自注意力机制的双向编码表示(bidirectional encoder representation from transformers,BERT)的3种冬奥问答系统模型。本文首次构建了冬奥问答数据集,并将上述3种方法集成在一起,应用于冬奥问答领域,用户可以使用本系统来快速准确地获取冬奥内容相关的问答知识。进一步,对3种模型的效果进行了测评,测量了3种模型各自的回答可接受率。实验结果显示BERT模型的整体效果略优于知识图谱和TDIDF模型,BERT模型对3类问题的回答可接受率都超过了96%,知识图谱和TDIDF模型对于复合统计问答对的回答效果不如BERT模型。 展开更多
关键词 智能问答 冬奥问答 对话模型 知识图谱 tf-IDF BERT
在线阅读 下载PDF
改进的WLS-TF动态同步相角和频率估计算法 被引量:1
10
作者 张婕 赵庆生 +1 位作者 梁定康 郭尊 《水电能源科学》 北大核心 2020年第7期198-202,共5页
为提高电力系统相角和频率的测量精度,基于加权最小二乘泰勒展开傅里叶算法(WLS-TF),将带通信号模型扩展到考虑二阶谐波的更一般的信号模型,提出一种利用二阶多项式插值函数进行频率估计的新方法。仿真结果表明,在信号模型中考虑不同稳... 为提高电力系统相角和频率的测量精度,基于加权最小二乘泰勒展开傅里叶算法(WLS-TF),将带通信号模型扩展到考虑二阶谐波的更一般的信号模型,提出一种利用二阶多项式插值函数进行频率估计的新方法。仿真结果表明,在信号模型中考虑不同稳态和动态条件下,所提算法可显著提高相角和频率的估计精度。 展开更多
关键词 动态相量模型 相角估计 频率估计 PMU WLS-tf
在线阅读 下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:10
11
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
在线阅读 下载PDF
基于用户会话的TF-Ranking推荐方法 被引量:3
12
作者 贾丹 孙静宇 《应用科学学报》 CAS CSCD 北大核心 2021年第3期495-507,共13页
基于用户会话日志,提出了一种融合XGBoost和门控循环单元网络的TF-Ranking推荐方法。该方法利用门控循环单元学习用户行为。首先,利用XGBoost进行特征提取,克服了传统方法中数据模型复杂的缺陷,使数据模型在保持原始属性的基础上大大降... 基于用户会话日志,提出了一种融合XGBoost和门控循环单元网络的TF-Ranking推荐方法。该方法利用门控循环单元学习用户行为。首先,利用XGBoost进行特征提取,克服了传统方法中数据模型复杂的缺陷,使数据模型在保持原始属性的基础上大大降低了复杂度;其次,利用改进后的Dropout网络对数据进行处理,使得召回率提高了1.32%;最后,基于Learning to Rank与Pairwise方法训练用户会话数据,尽可能为用户提供一个与查询内容相关性较强的正向排序推荐清单。实验在Trivago RecSys Challenge 2019数据集上进行。结果表明,所提出的推荐算法在召回率和平均倒数排名上均有提高,而且可以应用于大规模数据推荐。 展开更多
关键词 推荐系统 tf-Ranking推荐 门控循环单元 提升树模型 Dropout网络 停留时间
在线阅读 下载PDF
基于TF-IQF模型和图聚类的个性化搜索研究
13
作者 曹晓龙 宋威 梁久祯 《计算机工程与科学》 CSCD 北大核心 2011年第12期116-120,共5页
针对信息检索领域存在的用词歧义和检索词简短的问题,本文提出了一种基于TF-IQF模型和图聚类的个性化查询建议方法。对于用户的查询请求,提供查询建议,帮助用户进行查询修正,进而检索到其所需的信息;同时通过获取不同用户的查询偏好,以... 针对信息检索领域存在的用词歧义和检索词简短的问题,本文提出了一种基于TF-IQF模型和图聚类的个性化查询建议方法。对于用户的查询请求,提供查询建议,帮助用户进行查询修正,进而检索到其所需的信息;同时通过获取不同用户的查询偏好,以达到个性化查询推荐的目的。实验结果表明,该方法能够给出个性化的查询建议,为用户提供潜在感兴趣的资源,具有较高的准确率。 展开更多
关键词 个性化搜索 查询建议 tf-IQF模型 图聚类
在线阅读 下载PDF
基于文本挖掘的我国长期护理保险政策供给特征研究
14
作者 刘芷含 李鹤斌 +1 位作者 卢志诚 王雪晗 《护理研究》 北大核心 2025年第19期3242-3255,共14页
目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘... 目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘研究。结果:利用多维尺度分析将政策文本内容梳理出宏观政策环境、服务模式与内容、筹资与给付标准3条政策脉络。结论:建议政府创新制度供给,鼓励数据驱动供给,加强危机学习意识。 展开更多
关键词 长期护理保险 词频-逆文档频率词向量模型 多维尺度分析 文本挖掘 政策供给
在线阅读 下载PDF
一种新闻事件演化建模方法 被引量:2
15
作者 张辉 李国辉 +1 位作者 孙博良 贾立 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期166-170,共5页
为了准确地发现话题中事件间的潜在关系,提出一种新闻事件演化建模方法。该方法利用事件的时间关系、内容相似性、命名实体关联信息构建新的演化关系模型,并通过定义事件的五种演化模式,识别出演化过程中的开始、中间、结束事件,最后根... 为了准确地发现话题中事件间的潜在关系,提出一种新闻事件演化建模方法。该方法利用事件的时间关系、内容相似性、命名实体关联信息构建新的演化关系模型,并通过定义事件的五种演化模式,识别出演化过程中的开始、中间、结束事件,最后根据新演化模型及演化模式建立事件演化的有向无环图模型,揭示事件发展的潜在脉络结构。实验结果表明,本文方法能够有效检测事件演化,提升系统性能。 展开更多
关键词 新闻事件演化 演化模式 tf·ief模型 有向无环图
在线阅读 下载PDF
基于领域本体的语义向量空间模型 被引量:15
16
作者 唐明伟 卞艺杰 陶飞飞 《情报学报》 CSSCI 北大核心 2011年第9期951-955,共5页
经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制。针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究。针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型... 经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制。针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究。针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析。结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能。最后用实例验证了该模型在查全率和查准率方面均要优于原模型。 展开更多
关键词 领域本体 语义相似度 向量空间模型 tf-IDF 语义增量
在线阅读 下载PDF
基于语义信息的中文短信文本相似度研究 被引量:9
17
作者 刘金岭 宋连友 范玉虹 《计算机工程》 CAS CSCD 2012年第13期58-60,70,共4页
在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加... 在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加权,给出2篇短信文本相似度的计算方法。实验结果表明,该方法在F-度量值上优于TF-IDF算法及词语语义相似度算法。 展开更多
关键词 短信文本 相似度 tf-IDF模型 特征词 向量空间模型
在线阅读 下载PDF
基于ICE-LDA模型的中英文跨语言话题发现研究 被引量:7
18
作者 陈兴蜀 罗梁 +2 位作者 王海舟 王文贤 高悦 《工程科学与技术》 EI CAS CSCD 北大核心 2017年第2期100-106,共7页
近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分... 近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分,由于互联网的大规模普及而成为人们方便快捷获知信息的重要来源。首先,本文选择中文与英文的网络新闻作为数据源进行采集,提出了在LDA模型上改进的ICE-LDA模型进行跨英汉语言网络环境下的共现话题发现。采用话题向量化的方式,对建模产生的话题进行JS距离检测和话题文本分布相似度度量。其次,本文分别对爬虫采集到的中英混合新闻数据分别构建可对比平行语料集和非可对比语料集进行话题建模,在建模过程中利用TF-IDF算法对文档提取特征词去噪,提高话题特征表示去除无意义噪音词。最后,分别采用两种不同的话题向量化方式进行跨语言的共现话题发现建模。实验结果表明,在本文设计的爬虫采集构建的真实数据集上,改进后的话题模型不仅能够在不需要先验话题对的情况下对可对比语料集进行跨语言共现话题进行发现,而且能够对语料不平衡的情况进行共现话题发现。 展开更多
关键词 话题发现 跨英汉文本 ICE-LDA模型 tf-IDF特征提取 共现话题
在线阅读 下载PDF
基于VSM的文本相似度计算的研究 被引量:101
19
作者 郭庆琳 李艳梅 唐琦 《计算机应用研究》 CSCD 北大核心 2008年第11期3256-3258,共3页
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词... 文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。 展开更多
关键词 文本相似度 特征选择 词频—逆文档频率法 向量空间模型
在线阅读 下载PDF
基于概率图模型的文本情感分析 被引量:9
20
作者 吴钰洁 朱福喜 周竞 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1421-1425,共5页
相比于句子级和文档级情感分析,词语级的情感分析呈现出领域性和上下文相关性,难以得到良好的应用.提出一种基于概率图模型的情感分析方法,先通过分析训练语料建立一种具有先验概率的图模型,用于计算语料中词语的情感概率值,再利用信息... 相比于句子级和文档级情感分析,词语级的情感分析呈现出领域性和上下文相关性,难以得到良好的应用.提出一种基于概率图模型的情感分析方法,先通过分析训练语料建立一种具有先验概率的图模型,用于计算语料中词语的情感概率值,再利用信息熵公式将概率值归一化为情感特征值,最后使用该特征值训练SVM分类器对测试语料进行分类.论文在理论上证明该方法能够有效运用于具有"评价对象"和"评价词"二元特性的商品评论的情感判定,且在未表明用户明显态度语句的极性判定中也可以获得良好的效果.实验结果也显示,该方法比传统SVM分类方法在准确率上有明显提高. 展开更多
关键词 概率图模型 情感分析 信息熵 tf-IDF
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部