-
题名基于多特征的藏文微博情感倾向性分析
被引量:8
- 1
-
-
作者
江涛
袁斌
于洪志
加羊吉
-
机构
西北民族大学中国民族语言文字信息技术重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第3期163-169,共7页
-
基金
国家自然基金(61262054)
西北民族大学中央专项资金资助研究生项目(Yxm2014001)
+1 种基金
国家科技支撑计划项目(2014BAK10B03)
甘肃省科技重大专项项目(1203FKDA033)
-
文摘
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。
-
关键词
藏文微博
混合文本
情感倾向
情感词
词性序列
-
Keywords
Tibetan micro-blog
mixed text
sentiment orientation
emotional words
part of speech sequence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SVM的藏文微博文本情感分析研究与实现
被引量:7
- 2
-
-
作者
黄晨晨
索朗拉姆
拉姆卓嘎
群诺
-
机构
西藏大学信息科学技术学院
-
出处
《高原科学研究》
CSCD
2020年第1期92-96,共5页
-
基金
西藏自治区教育厅“计算机及藏文信息技术国家级团队和重点实验室建设”(藏教财指[2018]81号)
西藏大学研究生高水平人才培养计划项目(2018年中央支持地方高校改革发展资金).
-
文摘
随着人工智能技术的飞速发展,情感分析成为自然语言处理的重要研究内容。文章以现有的情感分析技术为基础,通过对藏文语料的预处理和构建特征向量空间,实现了基于SVM分类的藏文微博文本情感分析算法。通过对新浪微博上获取的2000多篇藏文微博的测试,实验结果表明该算法准确率达到91%。
-
关键词
藏文微博
情感分析
TF-IDF
Word2vec
SVM
-
Keywords
Tibetan microblog
sentiment analysis
TF-IDF
Word2vec
SVM
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-