期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
网络舆情意见挖掘中极性词典构建和极性识别方法研究 被引量:16
1
作者 曹树金 张学莲 陈忆金 《图书情报知识》 CSSCI 北大核心 2012年第1期60-65,共6页
本研究通过对网络新词的构造规律分析,对表达情感的网络新词进行识别算法的设计,提出基于HowNet和网络情感词的极性词典的人工构建方法,引进了同义词表减少手工构建的工作量,并抓住网络新词往往是现有情感词的其他形式这一特点,设计了... 本研究通过对网络新词的构造规律分析,对表达情感的网络新词进行识别算法的设计,提出基于HowNet和网络情感词的极性词典的人工构建方法,引进了同义词表减少手工构建的工作量,并抓住网络新词往往是现有情感词的其他形式这一特点,设计了针对表达情感的网络新词的自动识别方法,进一步扩展极性词的收录范围。 展开更多
关键词 舆情 意见挖掘 极性 极性词典 极性识别
在线阅读 下载PDF
基于情感词典和集成学习的情感极性分类方法 被引量:22
2
作者 朱军 刘嘉勇 +1 位作者 张腾飞 邱利茂 《计算机应用》 CSCD 北大核心 2018年第A01期95-98,107,共5页
当前情感极性分析时使用机器学习方法进行褒贬分析需要完备的语料库,但对特定领域的语料库构建困难,而只使用情感词典的分类方法准确率低。针对以上缺点提出了一种改进的机器学习方法和情感词典结合的集成学习情感极性分类方法。首先,使... 当前情感极性分析时使用机器学习方法进行褒贬分析需要完备的语料库,但对特定领域的语料库构建困难,而只使用情感词典的分类方法准确率低。针对以上缺点提出了一种改进的机器学习方法和情感词典结合的集成学习情感极性分类方法。首先,使用Word2Vec特征提取方法将每条评论表示成固定维度向量,使用常见的机器学习分类方法进行分类,找出效果最好的分类方法;然后使用基于情感词典的朴素贝叶斯分类方法进行情感极性分类。最后将基于情感词典和集成学习的方法相结合,使用谭松波公开的数据集酒店评论数据进行实验。理论分析和实验表明,使用Word2Vec作为特征提取方法的支持向量机(SVM)分类方法结合基于情感词典的朴素贝叶斯分类方法的集成学习方法可以将积极类的准确率和宏平均分别提高6. 9个百分点和3个百分点,将消极类的召回率和宏平均分别提高8. 8个百分点和5. 1个百分点,有效提升了情感极性分类效果。 展开更多
关键词 情感极性分类 机器学习 情感词典 Word2Vec 朴素贝叶斯
在线阅读 下载PDF
应用语义关系自动构建情感词典 被引量:7
3
作者 谢松县 刘博 王挺 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第3期111-115,共5页
构建英文情感词典研究相对成熟,形成了丰富可靠的词典资源。而针对中文的研究时间短,中文情感分析词典资源较少。借鉴现有可靠的英文词典资源,提出了基于语义关系的情感词典自动构建算法,算法先从HowNet的概念中进行中文义原和词语抽取... 构建英文情感词典研究相对成熟,形成了丰富可靠的词典资源。而针对中文的研究时间短,中文情感分析词典资源较少。借鉴现有可靠的英文词典资源,提出了基于语义关系的情感词典自动构建算法,算法先从HowNet的概念中进行中文义原和词语抽取及语义分析,再利用HowNet概念中DEF中英文属性值,在英文情感词典SentWordNet中进行义原和词语情感值查询,最后根据词语和义原之间的语义关系进行词语的情感值计算。算法直接利用现有的英文情感词典,无须人工标注,生成的情感词典记录了词语的语义关系、情感极性值等多种信息,弥补了现有词典的不足。评测实验结果表明,根据算法实现的情感词典相比其他词典在准确率接近的情况下,召回率和F值最高,取得了较好的评测性能。 展开更多
关键词 情感分析 情感词典 hownet 语义关系
在线阅读 下载PDF
基于Word Net和How Net建设双语语义词典 被引量:5
4
作者 张晶 姚建民 +1 位作者 赵铁军 李生 《高技术通讯》 EI CAS CSCD 2001年第12期28-32,共5页
针对当前语义信息往往需要手工获取的现状 ,探讨了利用英语义类词典Word Net和汉语概念词典HowNet资源 ,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法 ,以改善手工添加语义类带来的低效率和不一致性等问题。实验表明 ,... 针对当前语义信息往往需要手工获取的现状 ,探讨了利用英语义类词典Word Net和汉语概念词典HowNet资源 ,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法 ,以改善手工添加语义类带来的低效率和不一致性等问题。实验表明 ,该方法向英汉双语机读词典ECDic2K的 35 84 8词条译文项自动添加语义信息 ,而改造后的双语语义词典为单语语义分析中的成熟技术用于跨语言研究提供了方便 ,这在机器翻译和跨语言检索等自然语言处理领域具有很高的实用价值。 展开更多
关键词 hownet WORDNET 词典 语义分析 语义资源 自然语言处理 英语语义词典 汉语概念词典
在线阅读 下载PDF
基于微博表情符号的情感词典构建研究 被引量:17
5
作者 桂斌 杨小平 +1 位作者 张中夏 肖文韬 《北京理工大学学报》 EI CAS CSCD 北大核心 2014年第5期537-541,共5页
基于微博表情符号,提出一种自动构建情感词典的方法.从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库.对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统... 基于微博表情符号,提出一种自动构建情感词典的方法.从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库.对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典.这是一种全新的思路.以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上. 展开更多
关键词 表情符号 情感词典 语料库 情感极性
在线阅读 下载PDF
基于领域本体、情感词典的商品评论倾向性分析 被引量:20
6
作者 董丽丽 赵繁荣 张翔 《计算机应用与软件》 CSCD 北大核心 2014年第12期104-108,194,共6页
文本倾向性分析已成为当前自然语言处理领域的研究热点,其研究成果具有极高的应用价值。针对网络在线中文评论的特点,基于领域本体与情感词典对商品评论倾向性进行分析。其主要思想是首先构建面向商品论坛的领域本体;其次利用情感词典... 文本倾向性分析已成为当前自然语言处理领域的研究热点,其研究成果具有极高的应用价值。针对网络在线中文评论的特点,基于领域本体与情感词典对商品评论倾向性进行分析。其主要思想是首先构建面向商品论坛的领域本体;其次利用情感词典与上下文极性算法计算情感词极性;再次通过将本体与SBV算法相结合,实现评价对象和评价词的二元组抽取;最后完成句子的倾向性分析。实验结果表明,有效提高了句子级倾向性分析的准确率。 展开更多
关键词 倾向性分析 领域本体 情感词典 上下文极性 评价对象抽取
在线阅读 下载PDF
基于直推式学习的中文情感词极性判别 被引量:3
7
作者 金宇 朱洪波 +2 位作者 王亚强 陈黎 于中华 《计算机工程与应用》 CSCD 北大核心 2011年第34期164-167,共4页
态度挖掘是近年来文本挖掘领域的热点课题之一,旨在发现文本中作者的主观态度倾向,为基于舆情的决策过程提供支持。目前已有的态度挖掘算法绝大多数都基于情感词典来识别情感词,在此基础上判别句子或文本的总体态度倾向。然而,手工构造... 态度挖掘是近年来文本挖掘领域的热点课题之一,旨在发现文本中作者的主观态度倾向,为基于舆情的决策过程提供支持。目前已有的态度挖掘算法绝大多数都基于情感词典来识别情感词,在此基础上判别句子或文本的总体态度倾向。然而,手工构造和维护一部完善的情感词典是不现实的。对中文情感词的极性判别问题进行了研究,提出了基于直推式学习的中文情感词极性判别算法。该算法以少量情感词为种子,利用词典中词汇的解释信息,直推出其他词的情感极性。与使用相同情感种子词的解释信息作为训练数据的有监督学习算法相比,直推式学习算法的识别精度提高了20%左右。 展开更多
关键词 态度挖掘 情感词识别 极性判别 直推式学习 词典解释
在线阅读 下载PDF
利用语义词典的情感词快速识别 被引量:2
8
作者 杨立公 樊孝忠 朱俭 《计算机工程与设计》 CSCD 北大核心 2013年第8期2978-2982,共5页
对文本情感分析中的情感词识别任务进行了研究,提出了综合利用已有各种语言知识以及辞典中的信息和知识来判断识别情感词。在识别中主要借助于不同语义知识词典中提供的词语间的知识和关系,对候选词进行语义归类,并计算情感置信度。实... 对文本情感分析中的情感词识别任务进行了研究,提出了综合利用已有各种语言知识以及辞典中的信息和知识来判断识别情感词。在识别中主要借助于不同语义知识词典中提供的词语间的知识和关系,对候选词进行语义归类,并计算情感置信度。实验结果表明,该方法能够很大限度利用手工编撰词典中的权威信息,快速识别文本中的情感词,对于词典中不存在的未登录词也有一定的识别能力。 展开更多
关键词 情感分析 情感词 情感极性 语义词典 置信度
在线阅读 下载PDF
基于语义准则函数的中文评论性文本极性聚类算法研究 被引量:1
9
作者 徐斌 张玉峰 《情报学报》 CSSCI 北大核心 2011年第5期451-455,共5页
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类... 通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语义的聚类方法对汉语主观性文本处理的一次探索。实验结果显示总平均召回率达到了80.70%,总平均精确率达到了67.75%,说明该算法是可行和有效的。 展开更多
关键词 准则函数 极性词语义词典 文本聚类 评论 算法
在线阅读 下载PDF
融合语素特征的中文褒贬词典构建 被引量:7
10
作者 常晓龙 张晖 《计算机应用》 CSCD 北大核心 2012年第7期2033-2037,共5页
针对传统语素方法对于种子词语数量的依赖和传统图方法召回率较低的问题,提出一种将词语间语素关系融入到图模型中,并结合词语同义关系进行中文褒贬词典半监督构建的方法。首先利用语素模型计算词语间语素相似度;然后利用同义词林和双... 针对传统语素方法对于种子词语数量的依赖和传统图方法召回率较低的问题,提出一种将词语间语素关系融入到图模型中,并结合词语同义关系进行中文褒贬词典半监督构建的方法。首先利用语素模型计算词语间语素相似度;然后利用同义词林和双语词典资源,构建词语间同义关系;最后将二种关系结合,并利用标签传播(LP)算法进行词语的褒贬分类。实验结果表明,所提方法具有较高的准确率和召回率,微平均F1值最高可达92.8%;并降低了对种子词语数量的依赖,当种子词语数量仅为100时,微平均F1值依然可达到84.1%。除此之外,所提方法还具有快速收敛的特性。 展开更多
关键词 极性词典 语素模型 同义关系 图模型 标签传播
在线阅读 下载PDF
面向网络新闻领域的评论情感极性分析 被引量:7
11
作者 任聪 李石君 《计算机工程与应用》 CSCD 北大核心 2017年第1期77-82,共6页
网络新闻评论情感分析对于互联网时代分析舆情、掌握民调具有重要意义。目前研究聚焦在评论自身的分析而忽略评论间的结构关系,因此利用该关系生成评论关系树,并基于评论关系树建立情感极性判别规则。将评论经过预处理后,同时采用基于... 网络新闻评论情感分析对于互联网时代分析舆情、掌握民调具有重要意义。目前研究聚焦在评论自身的分析而忽略评论间的结构关系,因此利用该关系生成评论关系树,并基于评论关系树建立情感极性判别规则。将评论经过预处理后,同时采用基于扩展情感词典和支持向量机两种方法来进行情感极性分析,动态扩展了情感词典,设计了情感极性分类器。实验结果表明,在利用了评论结构关系之后,两种方法的分析准确率均较没利用该关系之前有了明显的提升。 展开更多
关键词 情感极性 网络新闻评论 评论关系 扩展情感词典 支持向量机
在线阅读 下载PDF
基于词频-极性强度的抑郁症情感词挖掘方法 被引量:3
12
作者 尹畅 张顺香 +1 位作者 朱广丽 张标 《太原理工大学学报》 CAS 北大核心 2021年第1期105-110,共6页
提出一种基于词频-极性强度值的情感词挖掘方法构建中文抑郁症情感词典。首先,对抑郁症患者评论语料进行有效分词,采用双向最大匹配和互信息方法选出候选情感词,再通过计算词频-极性强度值得到种子词集;然后,通过计算基础中文情感词典... 提出一种基于词频-极性强度值的情感词挖掘方法构建中文抑郁症情感词典。首先,对抑郁症患者评论语料进行有效分词,采用双向最大匹配和互信息方法选出候选情感词,再通过计算词频-极性强度值得到种子词集;然后,通过计算基础中文情感词典与种子词的语义相似度,得到抑郁症领域情感词表,将词表与种子词集合并,得到中文抑郁症情感词典。结果表明:本文提出的方法可准确地挖掘抑郁症专有领域情感词。 展开更多
关键词 情感分析 双向最大匹配 词频-极性强度 语义相似度 抑郁症情感词典
在线阅读 下载PDF
中文领域情感词典自适应学习方法 被引量:17
13
作者 叶霞 曹军博 +2 位作者 许飞翔 郭鸿燕 尹列东 《计算机工程与设计》 北大核心 2020年第8期2231-2237,共7页
针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进... 针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进行情感极性判定,形成领域正负情感词典。实验结果表明,该方法能够自适应生成领域情感词典,情感词识别准确率较高,该模型在中文情感分析应用中取得了较好的效果。 展开更多
关键词 情感分析 领域情感词典 情感极性 CBOW连续词袋模型 PMI算法
在线阅读 下载PDF
基于用户评论的农业新技术推荐模型设计与应用展望
14
作者 刘伟 刘世洪 +1 位作者 王翠 宋林鹏 《农业展望》 2023年第8期100-105,共6页
近年来,推荐系统的应用取得了飞速进步。大数据、人工智能技术的出现为农业信息化的加速发展提供了广阔的空间和前景。为提升农业领域内推荐技术的应用,满足农业用户的信息获取需求,对传统协同过滤推荐算法进行了一定的改进,重点体现在... 近年来,推荐系统的应用取得了飞速进步。大数据、人工智能技术的出现为农业信息化的加速发展提供了广阔的空间和前景。为提升农业领域内推荐技术的应用,满足农业用户的信息获取需求,对传统协同过滤推荐算法进行了一定的改进,重点体现在融合了K-means算法以及BIRCH算法进行聚类分析,通过搭建HowNet极性词典解决传统协同过滤方法过度依赖用户具体评分的问题,并提出了一种个性化推荐模型,利用相关数据源,进行模型验证。实验结果表明,该模型运行稳定,可以达到精准推荐农业技术信息的目的。 展开更多
关键词 协同过滤算法 聚类分析 hownet极性词典 个性化推荐模型
在线阅读 下载PDF
中文博客多方面话题情感分析研究 被引量:17
15
作者 傅向华 刘国 +1 位作者 郭岩岩 郭武彪 《中文信息学报》 CSCD 北大核心 2013年第1期47-55,共9页
博客是Web环境中个人表达观点和情感的一种重要载体,一般涉及较宽泛的话题,蕴含丰富的舆情信息。现有针对有关社会事件的用户产生内容进行情感分析的研究多数以篇章级为处理粒度,尚不能满足博客文本深度情感分析的需求。该文提出一种基... 博客是Web环境中个人表达观点和情感的一种重要载体,一般涉及较宽泛的话题,蕴含丰富的舆情信息。现有针对有关社会事件的用户产生内容进行情感分析的研究多数以篇章级为处理粒度,尚不能满足博客文本深度情感分析的需求。该文提出一种基于LDA话题模型与Hownet词典的中文博客多方面话题情感分析方法。该方法首先利用数据语料训练LDA话题模型,然后以滑动窗口为基本处理单位,利用训练好的LDA模型对博客文本进行话题识别与划分;在此基础上,基于Hownet词典对划分后的话题段落进行情感倾向计算。该方法有助于同时识别博客文本所涉及的多方面子话题及每个子话题上的情感倾向。实验结果表明,该方法不仅能获得较好的话题划分结果,也有助于改善情感分析的准确率。 展开更多
关键词 多方面情感分析 博客情感分析 LDA模型 hownet词典
在线阅读 下载PDF
基于在线评论挖掘的产品感性评价方法研究 被引量:13
16
作者 高新勤 金雨昊 +1 位作者 王雪萍 郝娟 《现代制造工程》 CSCD 北大核心 2021年第12期13-20,共8页
为了快速获取用户感性评价并用于产品的改进设计,提出一种基于在线评论挖掘的产品感性评价方法。采用爬虫技术从网络平台获取用户对产品的在线评论数据,构建在线评论原始语料库;通过分词技术和词向量技术预处理数据,将文本评论转化为词... 为了快速获取用户感性评价并用于产品的改进设计,提出一种基于在线评论挖掘的产品感性评价方法。采用爬虫技术从网络平台获取用户对产品的在线评论数据,构建在线评论原始语料库;通过分词技术和词向量技术预处理数据,将文本评论转化为词向量表达形式;挖掘在线评论数据,构建用户极性词典并获取产品特征;分析用户关注特征和在线评论数据,为制造企业提出产品改进措施。最后以笔记本电脑为例,基于在线评论和产品规格说明书,构建在线评论原始语料库并进行数据预处理,获取产品特征,分析用户评价,验证所提理论与方法的可行性和有效性,为改进产品设计提供依据。 展开更多
关键词 在线评论 感性工学 文本挖掘 产品特征 极性词典 改进设计
在线阅读 下载PDF
利用语义相似度解决双语词汇知识获取的错误累计问题 被引量:1
17
作者 刘鹏远 赵铁军 +1 位作者 李生 杨沭昀 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期575-579,共5页
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方... 在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率. 展开更多
关键词 词对齐 知识获取 hownet WORDNET 相似度 语义词典 错误累计
在线阅读 下载PDF
协同讨论观点影响度分析及其可视化实现
18
作者 刘晓平 沈冠町 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第3期315-318,386,共5页
随着大量网络协同讨论平台的产生,讨论的参与者已经突破了地域的限制,讨论的内容与深度也随之爆炸性地增长。在含有大量冗余信息的讨论中,快速找到讨论的核心与当前热点话题,是推进讨论快速进行的关键。文章提出一种观点影响度分析方法... 随着大量网络协同讨论平台的产生,讨论的参与者已经突破了地域的限制,讨论的内容与深度也随之爆炸性地增长。在含有大量冗余信息的讨论中,快速找到讨论的核心与当前热点话题,是推进讨论快速进行的关键。文章提出一种观点影响度分析方法,通过基于Hownet语义词典的语义相似度分析方法,帮助讨论观点自动分类,并通过可视化手段将观点之间的影响程度实时展现出来,辅助人们在杂乱的讨论过程中把握中心观点和当前热点。 展开更多
关键词 协同讨论 hownet语义词典 影响度 可视化
在线阅读 下载PDF
基于中文微博的情绪分类与预测算法 被引量:16
19
作者 郝苗苗 徐秀娟 +2 位作者 于红 赵小薇 许真珍 《计算机应用》 CSCD 北大核心 2018年第A02期89-96,共8页
为解决中文网络短文本情感多分类及预测问题,提出基于微博数据的针对微博上某一领域的人表达的情感进行多分类以及预测的算法。通过对微博数据特点的研究分析提出了一种基于词典的权重规则算法,构建了微博情绪分析词典,识别微博所表达的... 为解决中文网络短文本情感多分类及预测问题,提出基于微博数据的针对微博上某一领域的人表达的情感进行多分类以及预测的算法。通过对微博数据特点的研究分析提出了一种基于词典的权重规则算法,构建了微博情绪分析词典,识别微博所表达的5种情感极性:过度积极、轻微积极、中性、轻微消极、过度消极;提出了一种基于监督学习的分类方法对微博的情感极性进行分类预测,提取文本特征构建特征向量等对5种监督学习分类方法进行分析与讨论,实验分析结果准确率达到79. 9%。实验分析表明,与基于词典的权重规则算法相比,在微博细致情绪多分类类别识别中,基于监督学习的情绪分类预测方法能够有效提高短文本分类预测的准确率。 展开更多
关键词 微博文本分类 情绪分类预测 词典分析 监督学习 情感极性
在线阅读 下载PDF
基于卷积神经网络的情感分析算法 被引量:5
20
作者 李佳丽 封化民 +2 位作者 潘扬 徐治理 刘飚 《计算机应用与软件》 北大核心 2018年第4期287-292,共6页
随着词向量的广泛应用,情感词典在情感分析任务中不再使用。但是使用传统机器学习方法时,情感词仍然提供了重要的特征。通过结合词向量与情感词典,提出两种基于卷积神经网络的情感分析方法,分别为朴素连接法和独立卷积法。其中情感词典... 随着词向量的广泛应用,情感词典在情感分析任务中不再使用。但是使用传统机器学习方法时,情感词仍然提供了重要的特征。通过结合词向量与情感词典,提出两种基于卷积神经网络的情感分析方法,分别为朴素连接法和独立卷积法。其中情感词典的构建采用传统的种子词方法,根据How Net和Word2Vec共同计算出当前语料库的词语-情感分数键值对。实验结果表明,提出的情感分析方法可以有效地提高情感分析的准确率。 展开更多
关键词 词向量 情感词典 卷积神经网络 朴素连接 独立卷积 hownet Word2Vec
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部