-
题名基于混合主题模型的文本蕴涵识别
被引量:2
- 1
-
-
作者
盛雅琦
张晗
吕晨
姬东鸿
-
机构
武汉大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第5期180-184,共5页
-
基金
国家自然科学基金资助面上项目"汉语文本推理的资源建设和统计分析研究"(61173062)
-
文摘
分析识别文本蕴涵的主流方法,并基于文本T和假设H可以从潜在混合主题中生成的猜想,提出一个混合主题模型来识别文本蕴涵,描述一个在混合主题模型上生成文本的概率模型。该模型把文本T和假设H看成是同一语义的不同表达,表示为多模式的数据,若文本T和假设H有蕴涵关系,则它们有相似的主题分布,共享混合词汇表和主题。设计mix LDA和LDA模型的对比实验,并对RTE-8任务进行测试,通过支持向量机对得到的句子相似度和其他词法句法特征进行分类。实验结果表明,基于混合主题模型的文本蕴涵识别具有较高的准确率。
-
关键词
文本蕴涵
主题模型
多模式
混合主题
隐藏语义
支持向量机
-
Keywords
textual entailment
topic model
multi mode
mixed topic
latent semantic
Support Vector Machine ( SVM )
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LDA的多粒度主题情感混合模型
被引量:23
- 2
-
-
作者
欧阳继红
刘燕辉
李熙铭
周晓堂
-
机构
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2015年第9期1875-1880,共6页
-
基金
国家自然科学基金(No.61170092
No.61133011
No.61103091)
-
文摘
主题情感混合模型(Reverse-Joint Sentiment/Topic Model;Joint Sentiment/Topic Model)能够有效地同时抽取文档的主题和情感信息,在情感分析领域受到广泛的关注,因为没有考虑整体分布与局部分布的关系,导致分类效果不佳且不稳定.本文同时考虑两个粒度上的情感/主题分布——文档级和局部,提出多粒度的主题情感混合模型(MG-.R-JST;MG-JST).MG-R-JST/MG-JST、在文档级分布和局部分布的共同作用下生成单词的情感/主题;使用吉布斯采样进行模型推理,并给出了推理过程;在MR与MDS数据集上进行实验,实验结果表明本文算法分类效果优于主题情感混合模型,且稳定性更好.
-
关键词
LDA
主题情感混合模型
情感分析
多粒度
-
Keywords
LDA
topic and sentiment unification model
sentiment analysis
multi-grain
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种针对短文本的主题情感混合模型
被引量:4
- 3
-
-
作者
谢珺
郝洁
苏婧琼
邹雪君
李思宇
-
机构
太原理工大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期162-168,共7页
-
基金
山西省回国留学人员科研资助项目(2015-045
2013-033)
+1 种基金
山西省留学回国人员科技活动择优资助项目(2013年度)
山西省自然科学基金(2014011018-2)
-
文摘
主题情感混合模型可以同时提取语料的主题信息和情感倾向。针对短文本特征稀疏的问题,主题情感联合分析方法较少的问题,该文提出了BJSTM模型(Biterm Joint Sentiment Topic Model),在BTM模型(Biterm Topic Model)的基础上,增加情感层的设置,从而形成"情感-主题-词汇"的三层贝叶斯模型。对每个双词的情感和主题进行采样,从而对整个语料的词共现关系建模,一定程度上克服了短文本的稀疏性。实验表明,BJSTM模型在无监督情感分类和主题提取方面都有不错的表现。
-
关键词
主题情感混合模型
情感分类
BTM
-
Keywords
the topic and sentiment unification model
sentiment classification
BTM
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词嵌入与概率主题模型的社会媒体话题识别
被引量:13
- 4
-
-
作者
余冲
李晶
孙旭东
傅向华
-
机构
深圳大学计算机与软件学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第12期184-191,共8页
-
基金
国家自然科学基金(61472258)
深圳市基础研究计划项目(JCYJ20140509172609162)
-
文摘
词嵌入技术能从大语料库中捕获词语的语义信息,将其与概率主题模型结合可解决标准主题模型缺乏语义信息的问题。为此,同时对词嵌入和主题模型进行改进,构建词-主题混合模型。在主题词嵌入(TWE)模型中引入外部语料库获得初始主题和单词表示,通过定义主题向量和词嵌入的条件概率分布,将词嵌入特征表示和主题向量集成到主题模型中,同时最小化新词-主题分布函数和原始词-主题分布函数的KL散度。实验结果表明,与Word2vec、TWE、LDA和LFLDA模型相比,该模型在词表示和主题检测方面性能更好。
-
关键词
社会媒体
话题检测
特征表示
词嵌入
话题模型
词-主题混合模型
-
Keywords
social media
topic detection
feature expression
word embedding
topic model
Word-Topic Mixture(WTM) model
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于TSCM模型的网络短文本情感挖掘
被引量:12
- 5
-
-
作者
黄发良
李超雄
元昌安
汪焱
姚志强
-
机构
福建师范大学软件学院
广西师范学院计信学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2016年第8期1887-1891,共5页
-
基金
国家自然科学基金(No.61370078
No.61363037)
+1 种基金
教育部人文社会科学研究青年基金项目(No.12YJCZH074)
福建省教育厅科技项目(No.JA13077)
-
文摘
针对网络短文本情感挖掘问题,提出一种新的基于LDA和互联网短评行为理论的主题情感混合模型TSCM,TSCM模型中的整篇评论中每个句子的主题分布是不同的,TSCM产生词的流程是先确定词的情感极性,再确定词的主题,TSCM考虑了词与词之间的联系.真实数据集Movie与Amazon上的大量实验表明,与代表性算法JST、SLDA、D-PLDA和SAS相比较,TSCM模型能对用户真实情感与讨论主题进行更加有效的分析建模.
-
关键词
情感分析
主题情感混合模型
LDA
-
Keywords
sentiment analysis
topic sentiment mixture
latent dirichlet allocation (LDA)
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于词加权LDA算法的无监督情感分类
被引量:5
- 6
-
-
作者
郝洁
谢珺
苏婧琼
续欣莹
韩晓霞
-
机构
太原理工大学信息工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2016年第4期539-545,共7页
-
基金
山西省回国留学人员科研项目(2015-045
2013-033)
+1 种基金
山西省留学回国人员科技活动择优资助项目(2013)
山西省自然科学基金项目(2014011018-2)
-
文摘
主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST(Joint Sentiment/Topic model)模型相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。
-
关键词
情感分类
主题情感混合模型
主题模型
LDA
加权算法
-
Keywords
sentiment classification
topic and sentiment unification model
topic model
LDA
weighting algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名文本情感分类中生成式情感模型的发展
被引量:3
- 7
-
-
作者
张辉
刘奕群
马少平
-
机构
清华大学智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)计算机系
南京陆军指挥学院作战实验中心
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第12期3521-3526,共6页
-
基金
国家"863"计划资助项目(2011AA01A207)
国家自然科学基金资助项目(60903107
61073071)
-
文摘
描述了生成式模型的概念及它在文本情感分类领域的发展,分析了生成式情感模型的分类,着重研究了不同生成式情感模型之间的关联性,并对生成式模型中最有代表性的三类模型进行了介绍,最后对生成式情感模型发展以及未来趋势进行了总结。
-
关键词
文本情感分类
主题模型
生成式情感模型
情感主题混合模型
-
Keywords
text sentiment classification
topic model
generative sentiment model
sentiment-topic mixture model
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于CTM模型的观点挖掘和可视化
被引量:3
- 8
-
-
作者
马长林
谢罗迪
陈梦丽
-
机构
华中师范大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2018年第4期745-751,共7页
-
基金
国家自然科学基金(61003192)
-
文摘
如何从海量文本中自动提取有价值的观点信息已成为重要的技术挑战,当下的观点挖掘方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,在CTM模型的基础上提出了基于主题情感混合的主题相关模型,在考虑到主题相关性的同时,还分析了对应主题下的观点特征以及潜藏的情感倾向,更为精确地获取了文档主题的情感极性,仿真实验验证了本模型的有效性,并使用R语言进行了可视化实验分析。
-
关键词
CTM模型
主题情感混合模型
观点挖掘
可视化
-
Keywords
CTM model
topic and sentiment hybrid model
opinion mining
visualization
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-