期刊文献+
共找到232篇文章
< 1 2 12 >
每页显示 20 50 100
融合情感与主题的协作会话质量检测算法
1
作者 叶俊民 阙信超 +2 位作者 张晨 宋艺爽 赵刚 《小型微型计算机系统》 北大核心 2025年第5期1048-1055,共8页
在协作学习过程中,协作会话质量是影响协作知识建构的关键因素之一,高质量的协作会话有助于培养学习者的反思和合作能力.如何检测协作会话质量是教育技术研究中的一个挑战性问题.本文提出了一种融合情感增强和主题相似度计算的协作会话... 在协作学习过程中,协作会话质量是影响协作知识建构的关键因素之一,高质量的协作会话有助于培养学习者的反思和合作能力.如何检测协作会话质量是教育技术研究中的一个挑战性问题.本文提出了一种融合情感增强和主题相似度计算的协作会话质量检测模型BRASE(BERT-Attention with Similarity and Emotion).首先,利用BERT对协作会话内容和主题信息进行编码;其次,通过Bi-LSTM和注意力机制捕获协作会话的上下文语义及关键词信息,以提取协作会话内容和会话主题的主要特征,在此基础上计算协作会话的主题相似度;最后,通过朴素贝叶斯算法计算协作会话情感得分来评估协作会话的质量.本文在课堂真实数据集上进行了大量实验,结果表明,BRASE模型在基于情感权重和主题相似度下对协作会话质量检测的平均准确度和F1值方面优于现有模型.因此,BRASE模型能够有效检测协作会话的质量. 展开更多
关键词 协作会话 情感增强 主题相似度 会话质量检测
在线阅读 下载PDF
基于语义加权网络的重点领域科学基金资助态势识别研究
2
作者 王伟 梁继文 杨建林 《现代情报》 北大核心 2025年第1期46-59,111,共15页
[目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧... [目的/意义]科学基金制度是各国(地区)提升科学研究水平的重要方式,准确识别科学基金的资助方向和资助成效是感知科技发展态势的关键。[方法/过程]为识别科学基金资助态势,在提出关键短语抽取规则后,利用语义相似度消除同、近义词的歧义影响,利用动态滑动窗口和语义相似度构建语义加权的词共现网络,并基于社团划分方法识别基金主题。在集成电路领域比较1812项中国国家自然科学基金和2807项美国国家科学基金的资助主题分布、资助力度变化和资助效果,该方法能够准确识别基金主题分布和资助成效。[结果/结论]中国国家自然科学基金和美国国家科学基金均涵盖了集成电路领域的主要研究主题,在重点资助方向和资助力度上有较大差异;中国国家自然科学基金资助的论文平均被引频次相对较低,受资助机构相对单一。 展开更多
关键词 科学基金 资助态势 社团划分 词共现网络 主题分析 集成电路
在线阅读 下载PDF
融合多层级特征表示的多领域谣言早期检测方法
3
作者 黄涛 肖玉芝 +2 位作者 向洁萍 金胜 霍宣蓉 《情报杂志》 北大核心 2025年第4期127-135,共9页
[研究目的]网络谣言的治理是当前社会广泛关注的问题,提高网络谣言在传播早期的识别效率,能更好的阻止谣言信息的传播并维护社会的和谐稳定。[研究方法]提出一种多领域话题下的早期谣言检测方法。通过协同注意力机制融合文本的词汇、短... [研究目的]网络谣言的治理是当前社会广泛关注的问题,提高网络谣言在传播早期的识别效率,能更好的阻止谣言信息的传播并维护社会的和谐稳定。[研究方法]提出一种多领域话题下的早期谣言检测方法。通过协同注意力机制融合文本的词汇、短语和句子级特征,构建多层级特征增强的单元门模块以挖掘谣言深层信息。利用该模块构建领域感知特征抽取器,捕获谣言文本的领域特征及偏差,形成多领域与多层级的谣言特征表示,判断是否为谣言。[研究结果/结论]在涵盖9个不同领域的公开数据集上的实验结果表明,该模型的准确率、F1值和AUC值分别达到了92.85%、93.11%和96.96%,能够有效的对多领域谣言进行早期检测。 展开更多
关键词 网络谣言 谣言识别 早期谣言检测 多领域话题 特征增强 领域感知
在线阅读 下载PDF
基于双向图注意力网络的潜在热点话题谣言检测
4
作者 李劭 蒋方婷 +1 位作者 杨鑫岩 梁刚 《计算机科学》 北大核心 2025年第3期277-286,共10页
现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言... 现有社交网络谣言检测方法大多将社交网络中的单个帖子视为检测目标,存在因数据量不足而导致的检测冷启动问题,影响检测性能。另外,现有方法没有对海量社交网络信息中与检测无关的信息进行过滤,导致检测时延较长,性能较差。在分析谣言的传播特征时,现有方法大多侧重于谣言传播过程中的静态特征,难以充分利用节点间的动态关系对复杂的传播过程进行表征,导致性能提升存在瓶颈。针对以上问题,文中提出了一种基于潜在热点话题和图注意力神经网络的谣言检测方法,该方法采用神经主题模型和潜在热点话题发现模型进行话题级别的谣言检测以克服冷启动问题,并设计了一个基于双向图注意力神经网络的检测模型TPC-BiGAT,分析谣言话题传播过程中的动态特征以进行谣言真实性检测。在3个公开数据集上进行了多次实验证明,该方法在准确率上较现有方法取得了3%~5%的显著提升,验证了所提方法的有效性。 展开更多
关键词 谣言检测 社交网络 潜在热点话题 图神经网络 主题聚类
在线阅读 下载PDF
技术主题动态演化分析的一种新方法:DPL-BMM模型 被引量:6
5
作者 宋凯 陈悦 《情报学报》 CSSCI CSCD 北大核心 2024年第1期25-33,共9页
揭示技术演化脉络是把握技术发展规律的前提,基于专利信息的主题挖掘是基于技术发展微观机制呈现宏观规律的重要研究内容,对技术超前布局和创新驱动实践具有重大意义。技术主题动态演化分析DPL-BMM(Dirichlet process biterm-based mixt... 揭示技术演化脉络是把握技术发展规律的前提,基于专利信息的主题挖掘是基于技术发展微观机制呈现宏观规律的重要研究内容,对技术超前布局和创新驱动实践具有重大意义。技术主题动态演化分析DPL-BMM(Dirichlet process biterm-based mixture model with labelling)是一种附有标签的基于双项狄利克雷过程的混合模型,其突破了传统主题模型在进行主题识别时需固定主题数目的局限,通过增加技术主题表示模块使识别到的技术主题内容更加明确。本文以人工智能领域技术为例进行实证分析,研究结果表明,该方法对技术主题及其演化脉络展示具有实际应用价值。 展开更多
关键词 技术演化 主题识别 人工智能 可视化
在线阅读 下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测
6
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 CSSCI 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式聚类 主题词提取 组合相似度 动态聚类算法 词熵
在线阅读 下载PDF
MMCSC:一种跨模态的假新闻检测方法 被引量:1
7
作者 赵越 郝琨 +1 位作者 赵敬 信俊昌 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期18-25,共8页
目前基于新闻内容的假新闻检测方法没有考虑到不同模态更高层的语义关联,缺少可以依据的信息对新闻进行判断,从而缺乏对有重要辨别特征的新闻的社交网络信息进行有效使用.针对这个问题,提出了基于新闻内容的假新闻检测方法,通过提取文... 目前基于新闻内容的假新闻检测方法没有考虑到不同模态更高层的语义关联,缺少可以依据的信息对新闻进行判断,从而缺乏对有重要辨别特征的新闻的社交网络信息进行有效使用.针对这个问题,提出了基于新闻内容的假新闻检测方法,通过提取文本、图像和视频等多模态新闻的高层语义特征,分析不同模态高层语义信息,设计跨模态主题一致性和跨模态情感一致性计算方法.在此基础上,设计了一种跨模态内容语义一致性的假新闻检测模型MMCSC(multi-modal feature content semantic consistency).实验证明,相比于传统方法,所提出的MMCSC有较好的检测效果. 展开更多
关键词 假新闻检测 内容语义一致性 跨模态主题一致性 跨模态情感一致性
在线阅读 下载PDF
半监督SBERT-SP微博热点话题检测方法 被引量:1
8
作者 李彦 邓宇浩 《计算机工程与设计》 北大核心 2024年第11期3329-3336,共8页
在话题检测任务中,面对微博这类短文本时,针对SBERT模型的特征提取能力的局限性,以及在聚类阶段,单遍聚类算法存在的小簇问题和效率问题,对两者改进,提出一种基于半监督SBERT与SinglePass(semi-supervised SBERT with SinglePass cluste... 在话题检测任务中,面对微博这类短文本时,针对SBERT模型的特征提取能力的局限性,以及在聚类阶段,单遍聚类算法存在的小簇问题和效率问题,对两者改进,提出一种基于半监督SBERT与SinglePass(semi-supervised SBERT with SinglePass clustering,Semi-SBERT-SP)的微博热点话题检测方法,将SBERT模型结合半监督训练,提高其短文本特征提取能力。在聚类阶段过程中引入时间窗口和降维,提高算法效率,增加一个合并层,处理算法产生的小簇。在话题表示层,提出一种融入词热度的词贡献指标,用于提取话题簇中的关键词。实验结果表明,该方法在准确率、F1、互信息3个指标上均优于对比模型或方法,能够有效检测出微博中包含的热点话题。 展开更多
关键词 微博 话题检测 短文本 预训练模型 监督学习 孪生网络 单遍聚类
在线阅读 下载PDF
突发事件网络舆情主题转变路径及其风险评估 被引量:1
9
作者 周炜 安璐 韩瑞莲 《情报学报》 CSSCI CSCD 北大核心 2024年第10期1227-1241,共15页
探索突发事件网络舆情主题转变节点,并据此展开多阶段网络舆情风险评估,对精准处置突发事件网络舆情危机、提供动态舆情引导策略具有重要参考意义。本文提出一种突发事件情境下网络舆情主题转变路径识别及多阶段风险评估方法。首先,融合... 探索突发事件网络舆情主题转变节点,并据此展开多阶段网络舆情风险评估,对精准处置突发事件网络舆情危机、提供动态舆情引导策略具有重要参考意义。本文提出一种突发事件情境下网络舆情主题转变路径识别及多阶段风险评估方法。首先,融合RoBERTa (robustly optimized BERT pretraining approach)模型提出时序语义-共词网络,并基于Louvain-CFDP (clustering by fast search and find of density peaks)算法进行网络社区主题发现;其次,提出主题状态转变检测模型,据此生成主题转变路径,识别并分析多类型转变路径及其风险波动特征。以“日本核污染水排海”事件为例进行实证分析,识别事件发展型、情绪集聚型及衍生事件型3种转变路径类型,分别对这3种类型路径的特点、风险特征及差异进行分析。研究结果表明,本文提出的主题转变路径及风险评估研究方法能够完整、全面地展现突发事件在社交媒体上的话题转变,为管理部门快速锁定高风险话题,制定精准、有效的舆情风险引导方案提供借鉴与参考。 展开更多
关键词 主题转变检测模型 主题转变路径 舆情风险 突发事件
在线阅读 下载PDF
CCSD:面向话题的讽刺识别方法
10
作者 刘其龙 李弼程 黄志勇 《计算机科学》 CSCD 北大核心 2024年第9期310-318,共9页
随着社交媒体的发展,越来越多的人在社交平台上发表对热点话题的看法,其中讽刺手法的运用严重影响了社交媒体中情感分析的精度。目前面向话题的讽刺识别研究未同时考虑上下文和常识知识的作用,也忽略了在同一个话题下进行讽刺识别的场... 随着社交媒体的发展,越来越多的人在社交平台上发表对热点话题的看法,其中讽刺手法的运用严重影响了社交媒体中情感分析的精度。目前面向话题的讽刺识别研究未同时考虑上下文和常识知识的作用,也忽略了在同一个话题下进行讽刺识别的场景。为此,提出了基于上下文和常识的讽刺识别模型(Sarcasm Detection with Context and Common Sense,CCSD)。首先,模型使用C 3 KG常识库生成常识文本,并将目标句、话题上下文和常识文本作为预训练BERT模型的输入。其次,使用注意力机制来关注目标句和常识中重要的信息。最后,通过门控机制和特征融合,实现讽刺识别。文中构建了一个面向话题的讽刺识别数据集,以验证模型在特定话题中的有效性。实验结果表明,相比基线模型,新模型的性能更优。 展开更多
关键词 讽刺识别 面向话题的讽刺识别 上下文 常识知识 注意力机制
在线阅读 下载PDF
基于消息传递和图先验分布的微博主题模型
11
作者 王浩成 贺瑞芳 +1 位作者 吴辰昊 刘焕宇 《软件学报》 EI CSCD 北大核心 2024年第11期5133-5148,共16页
检测社交媒体文本中的潜在主题是一项有意义的任务.由于帖子具有表达简短、非正规的特点,其将带来严重的数据稀疏问题.不仅如此,基于变分自编码器(variational auto-encoder,VAE)的模型在主题推断过程中还忽视了用户间的社交关系,考虑VA... 检测社交媒体文本中的潜在主题是一项有意义的任务.由于帖子具有表达简短、非正规的特点,其将带来严重的数据稀疏问题.不仅如此,基于变分自编码器(variational auto-encoder,VAE)的模型在主题推断过程中还忽视了用户间的社交关系,考虑VAE假设输入的数据点间是相互独立的.这导致了推断的潜在主题变量间缺少了相关性信息,进而导致主题不够连贯.社交网络结构信息不仅聚合上下文信息的线索,还暗示了用户间的主题相关性.因此,提出基于消息传递和图先验分布的微博主题模型,其借助图卷积网络(graph convolution network,GCN)编码更加丰富的上下文信息,并且在变分自编码器推断主题的过程中,通过图先验分布整合用户交互关系以促进对多数据点复杂关系的理解,从而更好地挖掘社交媒体主题信息.在3个真实微博数据集上的实验证明了所提方法的有效性. 展开更多
关键词 社交媒体主题检测 用户相关性 图先验分布
在线阅读 下载PDF
话题识别与跟踪中的层次化话题识别技术研究 被引量:49
12
作者 于满泉 骆卫华 +1 位作者 许洪波 白硕 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期489-495,共7页
话题识别与跟踪(topic detection and tracking,TDT)旨在发展一系列基于事件的信息组织技术,层次化话题识别(hierarchical topic detection,HTD)是其中一项全新的任务定义形式.通过连续的大规模评测,话题识别与跟踪已成为国际上自然语... 话题识别与跟踪(topic detection and tracking,TDT)旨在发展一系列基于事件的信息组织技术,层次化话题识别(hierarchical topic detection,HTD)是其中一项全新的任务定义形式.通过连续的大规模评测,话题识别与跟踪已成为国际上自然语言处理尤其是信息检索领域的一个研究热点.为此,将自然语言处理与信息检索技术相结合,提出了针对事件特点的切实有效的单粒度话题识别方法,并提出了基于多层聚类的MLCS算法对话题进行层次化组织.所提出的方法具有很好的效果,在TDT2004的HTD评测中,该方法取得了第2名的成绩. 展开更多
关键词 话题识别与跟踪 层次化话题识别 多层聚类 命名实体 指代消解
在线阅读 下载PDF
基于增量型聚类的自动话题检测研究 被引量:23
13
作者 张小明 李舟军 巢文涵 《软件学报》 EI CSCD 北大核心 2012年第6期1578-1587,共10页
随着网络信息飞速的发展,收集并组织相关信息变得越来越困难.话题检测与跟踪(topic detection andtracking,简称TDT)就是为解决该问题而提出来的研究方向.话题检测是TDT中重要的研究任务之一,其主要研究内容是把讨论相同话题的故事聚类... 随着网络信息飞速的发展,收集并组织相关信息变得越来越困难.话题检测与跟踪(topic detection andtracking,简称TDT)就是为解决该问题而提出来的研究方向.话题检测是TDT中重要的研究任务之一,其主要研究内容是把讨论相同话题的故事聚类到一起.虽然话题检测已经有了多年的研究,但面对日益变化的网络信息,它具有了更大的挑战性.提出了一种基于增量型聚类的和自动话题检测方法,该方法旨在提高话题检测的效率,并且能够自动检测出文本库中话题的数量.采用改进的权重算法计算特征的权重,通过自适应地提炼具有较强的主题辨别能力的文本特征来提高文档聚类的准确率,并且在聚类过程中利用BIC来判断话题类别的数目,同时利用话题的延续性特征来预聚类文档,并以此提高话题检测的速度.基于TDT-4语料库的实验结果表明,该方法能够大幅度提高话题检测的效率和准确率. 展开更多
关键词 话题检测与跟踪 TDT 话题检测 增量型聚类 权重计算
在线阅读 下载PDF
一种突发性热点话题在线发现与跟踪方法 被引量:23
14
作者 薛峰 周亚东 +3 位作者 高峰 刘霁 赵俊舟 党琪 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第12期64-69,116,共7页
针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现... 针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型———动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现与跟踪方法.该方法可有效解决传统的基于静态向量空间模型的热点话题发现与跟踪方法仅可分析静态文本的缺陷,并具有以下特点:在特征选择阶段动态地生成热点词特征库,利用模型统一文本和话题的表示,在文本表示时给予突发性热点词更大的权重.基于实际网络文本流数据的实验表明,该方法对突发性热点话题发现的精确率与召回率分别达到92.75%和80.34%,显著优于传统的基于静态向量空间模型方法的实验结果,并可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足. 展开更多
关键词 突发性热点话题 话题发现与跟踪 向量空间模型
在线阅读 下载PDF
层次化话题发现与跟踪方法及系统实现 被引量:11
15
作者 邱立坤 龙志祎 +1 位作者 钟华 程葳 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期157-160,共4页
自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因... 自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因在于计算机自动分析产生的层次化话题必须与现实世界有客观的联系。据此提出一个面向大规模真实数据的有充分理论依据的层次化话题发现与跟踪方法,并在集群系统上予以实现。 展开更多
关键词 话题发现与跟踪 层次化话题识别 层次化话题跟踪 多层聚类 事件结构
在线阅读 下载PDF
基于子话题分治匹配的新事件检测 被引量:26
16
作者 洪宇 张宇 +2 位作者 范基礼 刘挺 李生 《计算机学报》 EI CSCD 北大核心 2008年第4期687-695,共9页
新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提... 新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型.实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859. 展开更多
关键词 新事件检测 话题检测与跟踪 子话题
在线阅读 下载PDF
孤立点预处理和Single-Pass聚类结合的微博话题检测方法 被引量:12
17
作者 叶施仁 杨英 +1 位作者 杨长春 朱明峰 《计算机应用研究》 CSCD 北大核心 2016年第8期2294-2297,共4页
针对如何快速发现微博中的热点话题,提出了一种具有更高准确率的中文微博话题检测方案。首先,优化了微博文本的特征选择,经过分析获得的这些博文特征有助于不同词性对话题表达的重要性;其次,在此基础上,提出了通过计算博文阈值的方法,... 针对如何快速发现微博中的热点话题,提出了一种具有更高准确率的中文微博话题检测方案。首先,优化了微博文本的特征选择,经过分析获得的这些博文特征有助于不同词性对话题表达的重要性;其次,在此基础上,提出了通过计算博文阈值的方法,将零散主题的博文作为噪声过滤,并用来降低博文集的维度;在现有Single-Pass聚类算法的基础上,引入了主题词的概念,根据中心向量的特征权重选择主题词,最终形成一种孤立点预处理与Single-Pass相结合的微博话题检测方法。实验结果表明,相比传统的Single-Pass算法,该方法有效去除了数据集的大部分孤立点,不仅具有较低的漏检率和误检率,而且在时间损耗方面表现更佳。 展开更多
关键词 微博 热点话题 增量聚类 孤立点 话题检测
在线阅读 下载PDF
社交媒体话题检测与追踪技术研究综述 被引量:18
18
作者 张仰森 段宇翔 +1 位作者 黄改娟 蒋玉茹 《中文信息学报》 CSCD 北大核心 2019年第7期1-10,30,共11页
随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检... 随着计算机的普及与互联网的高速发展,Facebook、Twitter、新浪微博等社交媒体逐渐成为人们信息交流的主要渠道。然而,由于社交媒体信息具有数量庞大、结构复杂、传播速度快等特点,人们无法从中快速准确地获取想要的信息。于是,话题检测与追踪技术应运而生,它将用户关注的信息从大量无序信息中筛选出来,经过细致的过滤和有效的整合,生成简单、清晰的话题信息,并在此基础上实现对话题的追踪和发展趋势分析。该文对社交媒体上的话题检测与追踪工作进行综述,首先论述了话题检测方面的三类方法,包括基于主题模型的话题检测、基于改进聚类算法的话题检测和基于多特征融合的话题检测;其次,对话题追踪的研究成果进行了介绍,主要分为非自适应话题追踪和自适应话题追踪两大类;最后,列举出社交媒体话题的检测与追踪中存在的问题以及对未来研究的展望。 展开更多
关键词 话题检测 话题追踪 聚类 主题模型
在线阅读 下载PDF
一种基于LDA主题模型的话题发现方法 被引量:22
19
作者 郭蓝天 李扬 +2 位作者 慕德俊 杨涛 李哲 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第4期698-702,共5页
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题... 话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。 展开更多
关键词 词向量 LDA模型 话题发现 困惑度
在线阅读 下载PDF
基于语义域语言模型的中文话题关联检测 被引量:19
20
作者 洪宇 张宇 +2 位作者 范基礼 刘挺 李生 《软件学报》 EI CSCD 北大核心 2008年第9期2265-2275,共11页
关联检测是话题检测与跟踪领域的基础性研究,其任务是检测任意新闻报道对是否论述同一话题.通过分析报道内容的结构关系和语义的分布规律,提出基于语义域语言模型的关联性检测方法,并在此基础上检验融入依存分析的语义描述策略对该模型... 关联检测是话题检测与跟踪领域的基础性研究,其任务是检测任意新闻报道对是否论述同一话题.通过分析报道内容的结构关系和语义的分布规律,提出基于语义域语言模型的关联性检测方法,并在此基础上检验融入依存分析的语义描述策略对该模型性能的影响.实验采用TDT4中文语料进行评测,结果显示语义域语言模型显著改进了现有检测系统的性能,其最小DET代价降低了约3个百分点. 展开更多
关键词 关联检测 话题检测与跟踪 语义域 语言模型 依存分析
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部