期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于迁移学习微博情绪分类研究——以H7N9微博为例 被引量:18
1
作者 周清清 章成志 《情报学报》 CSSCI 北大核心 2016年第4期339-348,共10页
社交媒体的发展吸引大量用户,继而产生海量的用户生成内容。对用户生成内容的挖掘分析能够及时掌握用户的情绪动态,继而帮助事件处理、政策施行等。已有研究利用监督机器学习方法进行文本情绪分类,但是这类方法依赖于语料的标注、耗时耗... 社交媒体的发展吸引大量用户,继而产生海量的用户生成内容。对用户生成内容的挖掘分析能够及时掌握用户的情绪动态,继而帮助事件处理、政策施行等。已有研究利用监督机器学习方法进行文本情绪分类,但是这类方法依赖于语料的标注、耗时耗力,并且存在领域适应性问题。迁移学习方法能够避免大量的语料标注、并且一定程度解决领域适应性问题。但是,目前迁移学习鲜有用于情绪分类任务。此外,情绪分类主要是针对博文等长文本,缺少针对微博短文本的相关实证研究。本文在主客观分类基础上,利用迁移学习方法对H7N9微博主观语料文本进行情感分类,并对结果进行情绪分类。实验结果表明,首先,设置形容词个数阈值为2时主客观分类效果最优;其次,利用迁移学习算法进行微博情感分类效果优于非迁移学习方法;最后,利用词频-相关频率作为特征权重计算方法时可以得到较好的情绪分类性能。 展开更多
关键词 情感分类 情绪分类 迁移学习 微博挖掘
在线阅读 下载PDF
基于粗糙集的微博用户性别识别 被引量:2
2
作者 黄发良 熊金波 +1 位作者 黄添强 刘西蒙 《计算机应用》 CSCD 北大核心 2014年第8期2209-2211,共3页
针对微博消息往往会不同程度表现出性别倾向性的特点,从消息内容挖掘的角度出发提出了一种基于粗糙集的微博用户性别识别算法。设计了一种基于容差粗集的微博消息表示模型(TRSRM),有效地刻画微博消息的性别特征。实验结果表明,在1000个... 针对微博消息往往会不同程度表现出性别倾向性的特点,从消息内容挖掘的角度出发提出了一种基于粗糙集的微博用户性别识别算法。设计了一种基于容差粗集的微博消息表示模型(TRSRM),有效地刻画微博消息的性别特征。实验结果表明,在1000个真实微博用户的微博消息的测试集下,所提模型的准确率比特征项频数表示模型平均提高了7%,取得了更好的识别效果。 展开更多
关键词 微博挖掘 性别识别 粗糙集 K近邻分类器 网络安全
在线阅读 下载PDF
基于社区时空主题模型的微博社区发现方法 被引量:10
3
作者 段炼 朱欣焰 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第3期464-469,共6页
提出了一种基于主题模型的微博社区发现方法。该方法采用狄利克雷过程(Dirichlet process)自适应生成多个潜在地理区域;利用多项式分布描述主题在连续时间中的强度;将用户对潜在地理区域和社区的选择偏好引入主题模型;最后通过EM方法和G... 提出了一种基于主题模型的微博社区发现方法。该方法采用狄利克雷过程(Dirichlet process)自适应生成多个潜在地理区域;利用多项式分布描述主题在连续时间中的强度;将用户对潜在地理区域和社区的选择偏好引入主题模型;最后通过EM方法和Gibbs采样,实现时空主题模型参数估算,以基于主题相似性进行社区发现。实验表明,该方法能更加准确地识别微博社区。 展开更多
关键词 狄利克雷过程 地理标识微博 微博社区发现 微博主题挖掘 时空主题模型
在线阅读 下载PDF
基于关联规则的微博主题搜索策略研究 被引量:1
4
作者 何跃 王迪 张丽丽 《情报杂志》 CSSCI 北大核心 2013年第6期131-136,共6页
在Web2.0时代,微博已成为一个有重要价值的信息平台。为了利用微博平台为用户提供较好的搜索服务,论文应用关联规则挖掘技术识别微博相关话题,利用相关话题扩充机制和话题语义相似度度量,构建微博搜索索引文件。实验分析表明:相对于传... 在Web2.0时代,微博已成为一个有重要价值的信息平台。为了利用微博平台为用户提供较好的搜索服务,论文应用关联规则挖掘技术识别微博相关话题,利用相关话题扩充机制和话题语义相似度度量,构建微博搜索索引文件。实验分析表明:相对于传统的关键词搜索策略,论文提出的搜索策略能从浩瀚的微博信息平台中找到更加有效的搜索结果。 展开更多
关键词 Web文本挖掘微博搜索 用户影响力 关联规则 潜在语义分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部