期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文微博情感词提取:N-Gram为特征的分类方法
被引量:
13
1
作者
刘德喜
聂建云
+3 位作者
张晶
刘晓华
万常选
廖国琼
《中文信息学报》
CSCD
北大核心
2016年第4期193-205,212,共14页
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法...
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。
展开更多
关键词
情感词提取
中文微博
分类方法
N-Gram特征
在线阅读
下载PDF
职称材料
单词统计特性在情感词自动抽取和商品评论分类中的作用
被引量:
3
2
作者
韩彤晖
杨东强
马宏伟
《计算机应用研究》
CSCD
北大核心
2019年第3期866-872,共7页
单词的统计特征在自然语言处理中具有广泛应用。针对统计特征对关键词抽取和文本分类精确度的影响,分析了八种常见的统计特征,通过情感词抽取和商品评论分类,研究统计特征在情感分析领域中的作用。利用八种统计特征构造文本向量空间模型...
单词的统计特征在自然语言处理中具有广泛应用。针对统计特征对关键词抽取和文本分类精确度的影响,分析了八种常见的统计特征,通过情感词抽取和商品评论分类,研究统计特征在情感分析领域中的作用。利用八种统计特征构造文本向量空间模型,替代基于单词构造文本向量空间模型的方法,能够降低文本向量的维度,具有隐形语义空间(LSA/SVD)的压缩效果,在保证分类结果准确率的前提下有效降低了算法的复杂度,能够替代传统的向量空间模型。情感词提取实验的结果表明,通过结合统计特征与词性,情感词提取的准确率能够达到76. 4%,显著高于基于统计特征或单词词性的情感词提取算法;商品评论分类的测试结果表明,与传统的基于单词的文本情感分类相比,基于统计特征的商品评论分类的准确率提高了10. 8%。
展开更多
关键词
统计特征
情感词提取
商品评论分类
在线阅读
下载PDF
职称材料
题名
中文微博情感词提取:N-Gram为特征的分类方法
被引量:
13
1
作者
刘德喜
聂建云
张晶
刘晓华
万常选
廖国琼
机构
江西财经大学信息管理学院
蒙特利尔大学计算机科学与运筹学系
华南理工大学计算机科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2016年第4期193-205,212,共14页
基金
国家自然科学基金(61363039
61173146
+1 种基金
61363010)
国家社会科学基金(12CTQ042)
文摘
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。
关键词
情感词提取
中文微博
分类方法
N-Gram特征
Keywords
sentimental lexicon extracting
Chinese microblog
classification method
N-Gram features
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
单词统计特性在情感词自动抽取和商品评论分类中的作用
被引量:
3
2
作者
韩彤晖
杨东强
马宏伟
机构
山东建筑大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2019年第3期866-872,共7页
基金
国家教育部人文社会科学研究一般项目基金资助项目(15YJA740054)
文摘
单词的统计特征在自然语言处理中具有广泛应用。针对统计特征对关键词抽取和文本分类精确度的影响,分析了八种常见的统计特征,通过情感词抽取和商品评论分类,研究统计特征在情感分析领域中的作用。利用八种统计特征构造文本向量空间模型,替代基于单词构造文本向量空间模型的方法,能够降低文本向量的维度,具有隐形语义空间(LSA/SVD)的压缩效果,在保证分类结果准确率的前提下有效降低了算法的复杂度,能够替代传统的向量空间模型。情感词提取实验的结果表明,通过结合统计特征与词性,情感词提取的准确率能够达到76. 4%,显著高于基于统计特征或单词词性的情感词提取算法;商品评论分类的测试结果表明,与传统的基于单词的文本情感分类相比,基于统计特征的商品评论分类的准确率提高了10. 8%。
关键词
统计特征
情感词提取
商品评论分类
Keywords
statistical features
extracting sentimental words
classifying product reviews
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文微博情感词提取:N-Gram为特征的分类方法
刘德喜
聂建云
张晶
刘晓华
万常选
廖国琼
《中文信息学报》
CSCD
北大核心
2016
13
在线阅读
下载PDF
职称材料
2
单词统计特性在情感词自动抽取和商品评论分类中的作用
韩彤晖
杨东强
马宏伟
《计算机应用研究》
CSCD
北大核心
2019
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部