期刊文献+
共找到217篇文章
< 1 2 11 >
每页显示 20 50 100
基于双向图注意力网络的潜在热点话题谣言检测 被引量:1
1
作者 李劭 蒋方婷 +1 位作者 杨鑫岩 梁刚 《计算机科学》 北大核心 2025年第3期277-286,共10页
现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言... 现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言的传播特征时,现有方法大多侧重于谣言传播过程中的静态特征,难以充分利用节点间的动态关系对复杂的传播过程进行表征,导致性能提升存在瓶颈。针对以上问题,文中提出了一种基于潜在热点话题和图注意力神经网络的谣言检测方法,该方法采用神经主题模型和潜在热点话题发现模型进行话题级别的谣言检测以克服冷启动问题,并设计了一个基于双向图注意力神经网络的检测模型TPC-BiGAT,分析谣言话题传播过程中的动态特征以进行谣言真实性检测。在3个公开数据集上进行了多次实验证明,该方法在准确率上较现有方法取得了3%~5%的显著提升,验证了所提方法的有效性。 展开更多
关键词 谣言检测 社交网络 潜在热点话题 图神经网络 主题聚类
在线阅读 下载PDF
微博用户和热点话题间的社交吸引法则研究 被引量:2
2
作者 安璐 刘媛圆 《情报杂志》 CSSCI 北大核心 2024年第8期113-123,共11页
[研究目的]探究微博用户和热点话题间社交吸引力的内在作用机制有助于深入理解社交吸引力的决定因素和热门话题的流行成因。[研究方法]以2022年微博平台的7类14个热点话题为研究对象,从用户行为视角构造用户与热点话题之间的吸引力测算... [研究目的]探究微博用户和热点话题间社交吸引力的内在作用机制有助于深入理解社交吸引力的决定因素和热门话题的流行成因。[研究方法]以2022年微博平台的7类14个热点话题为研究对象,从用户行为视角构造用户与热点话题之间的吸引力测算公式,从话题、用户、距离、环境属性出发,确定影响社交吸引力的23个指标。采用4种机器学习模型构建吸引力的影响因素模型,利用SHAP模型对结果最好的模型XGBoost进行解释,分析各项特征的贡献大小和相互影响关系。[研究结论]研究发现,用户属性的重要性非常明显,环境属性对社交吸引力基本没有显著贡献。在实践中,必要的高影响媒体转发造势、更多的话题上榜时间和更具有情感倾向的话题名称能带来更大的社交吸引力,帮助塑造与推进有益的热点话题,也为政府引导网络空间话题的健康发展提供决策参考。 展开更多
关键词 微博 热点话题 社交媒体用户 社交吸引力 SHAP
在线阅读 下载PDF
《中国卒中杂志》2024年度热点话题
3
《中国卒中杂志》 北大核心 2024年第12期I0003-I0003,共1页
每一篇论文都是科研探索的结晶,是理论与实践交汇的桥梁。2024年,《中国卒中杂志》公众号持续打造优质的学术交流、成果分享平台。经过一年的辛勤耕耘,众多优秀论文被广泛关注、阅读和转发。截至12月18日,我们根据根据阅读量、转发量数... 每一篇论文都是科研探索的结晶,是理论与实践交汇的桥梁。2024年,《中国卒中杂志》公众号持续打造优质的学术交流、成果分享平台。经过一年的辛勤耕耘,众多优秀论文被广泛关注、阅读和转发。截至12月18日,我们根据根据阅读量、转发量数据,盘点出“年度热点话题”,回顾本年度受到广泛关注的重要研究、观点和创新技术。 展开更多
关键词 阅读量 理论与实践 热点话题 学术交流 科研探索 转发量 分享平台 优秀论文
在线阅读 下载PDF
基于用户影响力的热点话题检测方法研究 被引量:5
4
作者 裘江南 谷文静 翟劼 《情报杂志》 CSSCI 北大核心 2017年第4期156-161,共6页
[目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直... [目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直观性较差。针对此问题,提出了基于用户影响力的热点话题检测方法。[方法/过程]首先识别用户特征要素,构建用户影响力模型,计算用户影响力;然后,综合考虑主题词影响力、影响力增长速度和增长斜率,提出基于用户影响力的微博热点话题主题词抽取方法,抽取主题词簇;之后,识别核心主题词并进行热点话题关键词抽取。最后,通过实验验证方法的有效性。[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题;该方法能有效提升实证性热点话题识别效率,减少娱乐性热点话题的识别;通过对不同时间窗口内同一话题的关键词抽取,可以实现对相应话题的热点跟踪。 展开更多
关键词 抽取.最后 通过实验验证方法的有效性.[结果/结论]实验结果表明:基于用户影响力的热点话题检测方法能够有效识别并直观表达出检测时间窗口内的典型热点话题 该方法能有效提升实证性热点话题识别效率 减少娱乐性热点话题的识别 通过对不同时间窗口内同一话题的关键词抽取 可以实现对相应话题热点跟踪.
在线阅读 下载PDF
面向热点话题时间序列的有效聚类算法研究 被引量:31
5
作者 韩忠明 陈妮 +2 位作者 乐嘉锦 段大高 孙践知 《计算机学报》 EI CSCD 北大核心 2012年第11期2337-2347,共11页
聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度... 聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析. 展开更多
关键词 聚类 时间序列 热点话题 小波
在线阅读 下载PDF
流量内容词语相关度的网络热点话题提取 被引量:27
6
作者 周亚东 孙钦东 +2 位作者 管晓宏 李卫 陶敬 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第10期1142-1145,1150,共5页
针对网络舆情分析的需求,给出了网络热点话题定义及其形式化描述,分析了流量内容中热点词语与热点话题的关系,提出了流量内容中热点词语的相关度计算算法.在此基础上,采用基于高密度连接区域的密度聚类方法得到热点词语簇,结合热点词语... 针对网络舆情分析的需求,给出了网络热点话题定义及其形式化描述,分析了流量内容中热点词语与热点话题的关系,提出了流量内容中热点词语的相关度计算算法.在此基础上,采用基于高密度连接区域的密度聚类方法得到热点词语簇,结合热点词语簇相关的网页标题及网站地址信息,得出网络热点话题的属性描述.实验结果表明,该算法能够有效获取当前网络中的热点话题,话题提取有效率达到16.7%,为网络热点话题传播特性研究提供了基础.与Web挖掘、话题监测与跟踪方法相比,所提算法通过选取合适的数据源,能更大程度地还原网络用户行为,从而得到了更为准确的网络信息传播状况. 展开更多
关键词 网络热点话题 流量内容 网络舆情分析
在线阅读 下载PDF
一种突发性热点话题在线发现与跟踪方法 被引量:23
7
作者 薛峰 周亚东 +3 位作者 高峰 刘霁 赵俊舟 党琪 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第12期64-69,116,共7页
针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现... 针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现与跟踪方法.该方法可有效解决传统的基于静态向量空间模型的热点话题发现与跟踪方法仅可分析静态文本的缺陷,并具有以下特点:在特征选择阶段动态地生成热点词特征库,利用模型统一文本和话题的表示,在文本表示时给予突发性热点词更大的权重.基于实际网络文本流数据的实验表明,该方法对突发性热点话题发现的精确率与召回率分别达到92.75%和80.34%,显著优于传统的基于静态向量空间模型方法的实验结果,并可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足. 展开更多
关键词 突发性热点话题 话题发现与跟踪 向量空间模型
在线阅读 下载PDF
基于有意义串聚类的微博热点话题发现方法 被引量:13
8
作者 贺敏 王丽宏 +2 位作者 杜攀 张瑾 程学旗 《通信学报》 EI CSCD 北大核心 2013年第S1期256-262,共7页
针对微博数据特征稀疏、内容碎片化的特点,提出一种基于有意义串聚类的热点话题发现方法。结合重复串计算、上下文邻接分析和语言规则过滤多种策略,提取能够表达独立完整语义的有意义串,并将微博数据建模在相对较小的有意义串空间,通过... 针对微博数据特征稀疏、内容碎片化的特点,提出一种基于有意义串聚类的热点话题发现方法。结合重复串计算、上下文邻接分析和语言规则过滤多种策略,提取能够表达独立完整语义的有意义串,并将微博数据建模在相对较小的有意义串空间,通过聚类产生候选话题,根据热度排序发现热点话题。微博数据实验结果表明,该方法在一定程度上实现对微博高维稀疏空间的降维,对于微博空间的热点话题发现有效可行。 展开更多
关键词 热点话题 微博 有意义串 特征聚类
在线阅读 下载PDF
基于自激点过程的网络热点话题传播模型 被引量:7
9
作者 韩忠明 张梦 +2 位作者 谭旭升 段大高 司慧琳 《计算机学报》 EI CSCD 北大核心 2016年第4期704-716,共13页
建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个... 建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个随机点过程.同时,SEPPM也考虑了话题传播的外部因素,综合形成话题传播模型.为了验证该模型的有效性,该文从仿真和实证两个角度分别进行了大量的实验比较,提出话题仿真算法,仿真结果说明SEPPM可以生成多种符合热点话题传播特征的模式.实际数据上的结果说明SEPPM不仅能够很好地拟合真实话题的传播过程,还能够有效地预测话题传播趋势. 展开更多
关键词 社会媒体 热点话题 传播模型 霍克斯过程 自激点过程 社交网络 数据挖掘
在线阅读 下载PDF
基于内容的热点话题传播模型 被引量:10
10
作者 韩忠明 张慧 张梦 《智能系统学报》 CSCD 北大核心 2013年第3期233-239,共7页
采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度... 采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度定义了单个用户传播话题的概率,融合话题的内容分类特性、用户传播概率、用户重入概率等因素,借鉴SIRS模型的基本思想,构建了话题传播模型(CSIRS).在无标度网络、小世界网络、随机网络和真实社会网络上作了不同实验,实验结果表明CSIRS模型不仅能够呈现一般传染病动力模型的传播模式,还能够呈现多个波动、小范围长时间传播、快速上升缓慢下降等社会网络热点话题的传播模式.该模型为融合网络结构和话题内容属性建模话题传播过程带来新的研究思路. 展开更多
关键词 热点话题 传播模型 传染病模型 话题传播模型
在线阅读 下载PDF
基于多中心模型的网络热点话题发现算法 被引量:28
11
作者 王巍 杨武 齐海凤 《南京理工大学学报》 EI CAS CSCD 北大核心 2009年第4期422-426,431,共6页
为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型。将报道内容之间的关联关系层次化,提高了对网络话题的描述能力。提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新... 为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型。将报道内容之间的关联关系层次化,提高了对网络话题的描述能力。提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新出现的报道是否属于已有网络话题,算法基于单遍聚类思想,通过引入话题中心的策略优化了算法的计算开销。实验结果表明:该算法可以全面、准确地发现网络热点话题,同时具有较为理想的性能,可应用于大规模网络动态流式数据环境下的热点话题发现。 展开更多
关键词 话题发现 热点话题 多中心 单遍聚类
在线阅读 下载PDF
融合热点话题的微博转发预测研究 被引量:12
12
作者 陈江 刘玮 +1 位作者 巢文涵 王丽宏 《中文信息学报》 CSCD 北大核心 2015年第6期150-158,共9页
微博转发行为是实现信息传播的重要方式,微博转发预测对微博影响力分析、微博话题分析具有重要价值。现有微博转发预测研究大多围绕消息属性、用户属性等微博自身特征,该文提出融合热点话题的微博转发预测方法,对背景热点话题内容和传... 微博转发行为是实现信息传播的重要方式,微博转发预测对微博影响力分析、微博话题分析具有重要价值。现有微博转发预测研究大多围绕消息属性、用户属性等微博自身特征,该文提出融合热点话题的微博转发预测方法,对背景热点话题内容和传播趋势对用户转发行为的影响进行量化分析,提出融合背景热点信息的转发兴趣、转发活跃度、行为模式等特征,并基于分类算法建立了面向热点话题相关微博的转发预测模型,在真实数据上的实验结果表明,该方法的预测准确性达到96.6%,提升幅度最高达到12.14%。 展开更多
关键词 转发行为 转发预测 热点话题
在线阅读 下载PDF
基于熵值的网络论坛热点话题发现 被引量:10
13
作者 孙永利 李东 张玥 《计算机工程》 CAS CSCD 2014年第6期312-316,共5页
针对网络论坛热点话题的识别、发现和舆情监测问题,提出一种基于热度熵值的热点话题发现方法。通过网络爬虫抓取网络论坛中的数据,在对数据进行预处理和分析热点话题属性特征的基础上,合理定义各属性的权重和话题的热度熵值,并以此对话... 针对网络论坛热点话题的识别、发现和舆情监测问题,提出一种基于热度熵值的热点话题发现方法。通过网络爬虫抓取网络论坛中的数据,在对数据进行预处理和分析热点话题属性特征的基础上,合理定义各属性的权重和话题的热度熵值,并以此对话题的热点信息进行分析、统计与评估,从而发现和追踪网络论坛中的热点话题。同时,对话题的热度进行细致划分和各种类型的定义,采用不同阈值策略计算不同类型的热度信息标注的准确率。实验结果表明,该方法合理、有效,相比于传统的话题语义分析方法具有较高的准确率,可作为互联网论坛舆情监测的依据。 展开更多
关键词 网络论坛 话题发现 属性特征 热度熵值 热点话题追踪 舆情监测
在线阅读 下载PDF
网络舆情热点话题聚类方法研究 被引量:25
14
作者 张寿华 刘振鹏 《小型微型计算机系统》 CSCD 北大核心 2013年第3期471-474,共4页
主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点... 主流的热点追踪算法都采用文本聚类技术来实现,在处理海量网页时,很难精准聚合中心结果,离需要的热点差距太远.现有的网络舆情系统监控的范围受限于使用者给出的关键词,使系统无法监测使用者未知的突发事件.针对网络舆情发生和传播特点,改善舆情信息采集策略;网络舆情的相关页面标题文字主题鲜明,据此提出自动挖掘热点关键词并根据关键词进行话题聚类的方法;根据新闻、论坛和博客的不同特点分别设计网络舆情热点分析模型.在此基础上,设计并实现了一个网络舆情监测系统.系统实际运行表明,该方案可以及时发掘热点话题并对突发事件实时追踪监测. 展开更多
关键词 网络舆情 话题聚类 热点话题 追踪监测
在线阅读 下载PDF
基于主题词的微博热点话题发现 被引量:11
15
作者 叶成绪 杨萍 刘少鹏 《计算机应用与软件》 CSCD 2016年第2期46-50,共5页
近年来,微博网站已成为海量信息的发布平台。微博丰富的信息为用户提供便利的同时,也带来了信息过载的风险。针对热点话题发现能够降低信息过载的风险,改善用户体验。结合最长公共子串和维基百科知识,提出一种基于主题词的中文微博热点... 近年来,微博网站已成为海量信息的发布平台。微博丰富的信息为用户提供便利的同时,也带来了信息过载的风险。针对热点话题发现能够降低信息过载的风险,改善用户体验。结合最长公共子串和维基百科知识,提出一种基于主题词的中文微博热点话题发现方法。首先,获取微博数据的高频最长公共子串,作为描述话题的候选主题词;其次,利用维基百科知识,对候选主题词进行筛选;最后,对主题词集合聚类以发现话题,并计算每个话题的能量,从中选取热点话题。在真实数据集上的实验表明,该方法能有效发现微博热点话题。 展开更多
关键词 主题词 维基百科 最长公共子串 热点话题发现 微博
在线阅读 下载PDF
基于词聚类的热点话题检测算法 被引量:27
16
作者 龙志祎 程葳 《计算机工程与设计》 CSCD 北大核心 2011年第6期2214-2216,F0003,共4页
对应用词聚类进行热点话题检测的算法进行了研究。通过将文档分词并用兼顾长短文章的规则进行特征抽取,将文档聚类空间转化为特征词聚类空间,采用基于互信息的词聚类算法产生热点话题类。以TDT5语料作为测试语料进行了热点话题召回率和... 对应用词聚类进行热点话题检测的算法进行了研究。通过将文档分词并用兼顾长短文章的规则进行特征抽取,将文档聚类空间转化为特征词聚类空间,采用基于互信息的词聚类算法产生热点话题类。以TDT5语料作为测试语料进行了热点话题召回率和话题类纯度评测,实验结果表明,采用基于词聚类的算法进行热点话题检测,热点话题的平均召回率达到83.8%,话题类的平均类纯度达到94.4%,检测出的热点话题类别易于理解。 展开更多
关键词 互信息 词聚类 热点话题发现 特征词抽取 词汇语义相似度
在线阅读 下载PDF
语义规则在微博热点话题情感分析中的应用 被引量:11
17
作者 赵文清 侯小可 沙海虹 《智能系统学报》 CSCD 北大核心 2014年第1期121-125,共5页
近来,针对微博热点话题的情感分析研究得到了广泛关注,而基于监督的学习方法在分析文本时会忽视词语的上下文联系。根据中文微博的特点,提出了一种基于语义规则的方法对微博热点话题进行情感分析。该方法首先需要人工整理出程度副词表... 近来,针对微博热点话题的情感分析研究得到了广泛关注,而基于监督的学习方法在分析文本时会忽视词语的上下文联系。根据中文微博的特点,提出了一种基于语义规则的方法对微博热点话题进行情感分析。该方法首先需要人工整理出程度副词表、否定词表和微博中默认表情符号的褒贬分类。然后在情感词语计算的基础上,考虑上下文中否定词和程度词对修饰情感词语的情感倾向和情感强度的影响,同时也设定规则计算表情符号对一条微博的情感倾向判断的作用。最后与基于情感词典的方法做实验对比,实验结果表明该方法在文本情感倾向性识别的准确率上有了一定提高。 展开更多
关键词 微博 热点话题 情感分析 语义规则 情感词典
在线阅读 下载PDF
我国网络舆情热点话题发现研究综述 被引量:14
18
作者 游丹丹 陈福集 《现代情报》 CSSCI 北大核心 2017年第3期165-171,共7页
随着互联网的快速发展,网络舆情对社会的影响不容忽视。若能够及时从海量数据中发现热点话题,追踪热点话题演变以及预测话题的倾向,对于帮助相关部门及时有效地对其引导和控制具有较大意义。本文通过对我国网络舆情热点话题发现的相关... 随着互联网的快速发展,网络舆情对社会的影响不容忽视。若能够及时从海量数据中发现热点话题,追踪热点话题演变以及预测话题的倾向,对于帮助相关部门及时有效地对其引导和控制具有较大意义。本文通过对我国网络舆情热点话题发现的相关文献进行收集、整理及分析,归纳其中的主要研究思想和方法,同时发现存在的不足,并提出进一步的展望,以期对后来研究者提供参考。 展开更多
关键词 网络舆情 热点话题发现 发现模型 综述
在线阅读 下载PDF
基于离散粒子群优化的微博热点话题发现算法 被引量:9
19
作者 马慧芳 吉余岗 +1 位作者 李晓红 周汝南 《计算机工程》 CAS CSCD 北大核心 2016年第3期208-213,共6页
结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚... 结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚类质量评价指标作为适应度函数对聚类结果进行不断迭代优化,获得聚类结果的最优解。实验结果表明,该算法能够在大量微博中快速发现热点话题,具有较高的热点话题发现准确性及运行效率。 展开更多
关键词 微博 热点话题发现 词项关系 文本表示模型 粒子群优化
在线阅读 下载PDF
基于主题聚簇评价的论坛热点话题挖掘 被引量:5
20
作者 江浩 陈兴蜀 杜敏 《计算机应用》 CSCD 北大核心 2013年第11期3071-3075,共5页
热点话题挖掘是舆情监控的重要技术基础。针对现有的论坛热点话题挖掘方法没有解决数据中词汇噪声较多且热度评价方式单一的问题,提出一种基于主题聚簇评价的热点话题挖掘方法。采用潜在狄里克雷分配主题模型对论坛文本数据建模,对映射... 热点话题挖掘是舆情监控的重要技术基础。针对现有的论坛热点话题挖掘方法没有解决数据中词汇噪声较多且热度评价方式单一的问题,提出一种基于主题聚簇评价的热点话题挖掘方法。采用潜在狄里克雷分配主题模型对论坛文本数据建模,对映射到主题空间的文档集去除主题噪声后用优化聚类中心选择的K-means++算法进行聚类,最后从主题突发度、主题纯净度和聚簇关注度三个方面对聚簇进行评价。通过实验分析得出主题噪声阈值设置为0.75,聚类中心数设置为50时,可以使聚类质量与聚类速度达到最优。真实数据集上的测试结果表明该方法可以有效地将聚簇按出现热点话题的可能性排序。最后设计了热点话题的展示方法。 展开更多
关键词 潜在狄里克雷分配 主题模型 K—means++聚类 聚簇评价 热点话题
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部