期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
创业领域动态能力研究综述——基于LDA主题模型 被引量:3
1
作者 马鸿佳 肖彬 韩姝婷 《南开管理评论》 北大核心 2025年第1期163-174,共12页
VUCA时代外部环境瞬息万变,动态能力已成为组织长期生存、发展及应对动荡环境的关键能力。先前的动态能力研究大多基于成熟企业,创业企业由于年龄、规模劣势,更易面临生存与发展的巨大挑战,更具灵活性的创业企业动态能力可能具备特殊性... VUCA时代外部环境瞬息万变,动态能力已成为组织长期生存、发展及应对动荡环境的关键能力。先前的动态能力研究大多基于成熟企业,创业企业由于年龄、规模劣势,更易面临生存与发展的巨大挑战,更具灵活性的创业企业动态能力可能具备特殊性。然而,尽管学术界对创业领域动态能力的研究兴趣日益浓厚,但相关研究较为零散,且理论体系尚未形成。因此,本研究以创业领域动态能力的352篇英文文献为研究对象,基于LDA主题模型聚合出15个主题,结合人工编码及LDAvis可视化工具确定了内涵和微观基础、前因、边界条件和结果四个研究内容。在此基础上,对相关主题的关键中英文文献进行系统化梳理,构建了创业领域动态能力的综合研究框架,结合该框架呼吁学者进一步关注超越组织层面的动态能力研究,探索数据驱动的创业企业动态能力研究及拓展创业领域的动态能力研究方法、数据来源。 展开更多
关键词 创业领域 动态能力 主题模型 文献回顾
在线阅读 下载PDF
基于DTM-LPA的突发事件话题演化方法研究——以H7N9微博为例 被引量:12
2
作者 吴小兰 章成志 《图书与情报》 CSSCI 北大核心 2015年第3期9-16,共8页
传统的动态话题模型在高维、稀疏的微博数据上进行话题演化分析时,存在话题数无法确定与结果可解释性差的问题,为此文章提出了一种结合动态话题模型与社区发现技术的话题演化方法,即DTM-LPA方法,即首先利用动态话题模型选取不同时间窗... 传统的动态话题模型在高维、稀疏的微博数据上进行话题演化分析时,存在话题数无法确定与结果可解释性差的问题,为此文章提出了一种结合动态话题模型与社区发现技术的话题演化方法,即DTM-LPA方法,即首先利用动态话题模型选取不同时间窗口中具有较高价值的演化词;然后根据各个时间窗口上的微博构造演化词共现网络;再借用标签传播算法找到演化词之间的社区,并根据演化词社区来追踪各个时间窗口上的话题。最后,文章以新浪微博上H7N9禽流感事件为例进行了实证研究,实验结果表明文章所提出的方法能真实地实现微博话题演化分析。 展开更多
关键词 话题演化 动态话题模型 标签传播算法 社区发现 突发事件
在线阅读 下载PDF
基于Topic Signature的动态文摘更新方法 被引量:2
3
作者 张祯 樊兴悦 +1 位作者 郭禹田 吴国华 《计算机工程》 CAS CSCD 北大核心 2018年第6期169-175,共7页
目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根... 目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根据句间相似度对每条语句的主题代表性和信息多样性进行评分,利用Topic Signature模型评估语句的新颖性,以提取事件中的更新演进信息。在此基础上,依据摘要生成策略,缩小解的可行域,以保证在短时间内生成高质量的文摘。实验结果表明,该方法无需进行模型训练和语言匹配,能够有效降低时间复杂度,提高文摘提取效率。 展开更多
关键词 动态文摘 topic Signature模型 密度峰值 整数规划模型 自然语言处理
在线阅读 下载PDF
基于动态主题情感模型的文本聚类算法
4
作者 胡萍 《吉林大学学报(理学版)》 北大核心 2025年第2期528-536,共9页
针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模... 针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模型的文本聚类算法.利用真实新冠疫情Twitter文本数据集进行实验,实验结果表明,该模型的性能优于基线模型,提高了情感特征区分度,使文本主题与对应的情感极性联合生成时间节点,进而使模型有处理时间演化的能力. 展开更多
关键词 动态主题情感模型 文本挖掘 情感标签 时间戳 文本聚类 困惑度
在线阅读 下载PDF
基于动态主题网络的新兴技术主题识别——以氢燃料电池领域为例 被引量:4
5
作者 慎金花 王薇 +1 位作者 张更平 陈红艺 《情报杂志》 CSSCI 北大核心 2024年第9期92-100,共9页
[研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题... [研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题相似度矩阵绘制动态主题网络,识别具有创新性和连续性的主题为候选主题,评估候选主题的新颖性和影响力,确定新兴技术主题;以氢燃料电池领域为例进行实证检验。[研究结论]研究表明,SBERT-LDA-IPC模型提高了主题聚类的连贯性和准确性,结合国家在氢燃料电池产业发布的系列政策作为验证依据,识别出的三个新兴技术主题,与国家政策制定和产业发展方向一致。 展开更多
关键词 动态主题网络 主题演化 主题识别 专利信息 新兴技术 SBERT-LDA-IPC模型 氢燃料电池
在线阅读 下载PDF
AIGC议题的动态演进与传播结构:基于微博和Twitter的比较分析 被引量:7
6
作者 张尔坤 张洪忠 +1 位作者 姚俊臣 王诗然 《西安交通大学学报(社会科学版)》 CSSCI 北大核心 2024年第3期176-186,共11页
不同文化背景和社会情境可能会形成不同的技术认知,基于跨平台比较视角,采用动态主题模型等工具比较微博和Twitter中人工智能生成内容(AIGC)议题在发展趋势与传播结构上的差异,探讨促成这些差异的多维因素。研究发现:在微博中,用户更关... 不同文化背景和社会情境可能会形成不同的技术认知,基于跨平台比较视角,采用动态主题模型等工具比较微博和Twitter中人工智能生成内容(AIGC)议题在发展趋势与传播结构上的差异,探讨促成这些差异的多维因素。研究发现:在微博中,用户更关注AIGC的经济和商业价值,侧重探讨新技术与经济发展的关系;在Twitter中,AIGC讨论与技术逻辑具有更紧密的联系,诸多文化界、产业界博主将技术对产业、伦理的影响和对未来的想象推到更重要的讨论位置。研究认为,由经济要素驱动的AIGC讨论机遇与风险并存,在关注AIGC经济价值的同时,也要警惕资本、市场对技术认知和技术发展的过度干预,防止技术背离“以人为本”的价值初衷。最后,宏观层面的语境也并非稳定不变,未来应当继续关注技术认知的结构性变化以及其将如何影响新技术发展等问题。 展开更多
关键词 人工智能生成内容 主题建构 传播结构 技术认知 微博 TWITTER 动态主题模型 社交媒体
在线阅读 下载PDF
基于动态主题模型融合多维数据的微博社区发现算法 被引量:25
7
作者 刘冰玉 王翠荣 +3 位作者 王聪 王军伟 王兴伟 黄敏 《软件学报》 EI CSCD 北大核心 2017年第2期246-261,共16页
随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博... 随着微博用户的不断增加,微博网络已成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM(discovery community by dynamic topic model)算法.DC-DTM算法首先将微博网络映射为有向加权网络,网络中边的方向反映节点之间的关注关系,利用所提出的DTM(dynamic topic model)计算出节点之间的语义相似度,并将其作为节点间连边的权重.DTM是一种微博主题模型.该模型不仅能够挖掘博客的主题分布,而且能够计算出某一主题中用户的影响力大小.其次,利用所提出的复杂度较低的标签传播算法WLPA(weighted lebel propagation)进行微博网络的社区发现.该算法的初始化阶段将影响力大的用户节点作为初始节点,标签按照节点的影响力从大到小进行传播,避免了传统标签传播算法逆流现象的发生,提高了标签传播算法的稳定性.真实数据上的实验结果表明,DTM模型能够很好地对微博进行主题挖掘,DC-DTM算法能够有效地挖掘出微博网络的社区. 展开更多
关键词 新浪微博 文本挖掘 DC-dtm 吉布斯采样 LDA 主题模型
在线阅读 下载PDF
话题跟踪中静态和动态话题模型的核捕捉衰减 被引量:19
8
作者 洪宇 仓玉 +2 位作者 姚建民 周国栋 朱巧明 《软件学报》 EI CSCD 北大核心 2012年第5期1100-1119,共20页
话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3... 话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(National Institute of Standards and Technology)提出的最小检测错误权衡系数评测法,并结合所提出的核捕捉衰减评价方法,对各类主要话题模型进行测试.实验结果显示,结构化的动态话题模型具有最佳的跟踪性能,且突发式增量式学习和时序事件链的更新算法分别给予动态话题模型0.4%和3.3%的性能改进. 展开更多
关键词 话题跟踪 静态话题模型 动态话题模型 核捕捉衰减 突发式增量式学习 时序事件链
在线阅读 下载PDF
基于主题模型的新疆暴恐舆情分析 被引量:7
9
作者 张绍武 邵华 +1 位作者 林鸿飞 杨亮 《中文信息学报》 CSCD 北大核心 2018年第5期105-113,共9页
随着互联网的飞速发展,网络舆情引发的问题也越发突出。尤其是近年来发生的新疆暴恐事件,已成为公众关注的焦点。主题演化是网络舆情分析的重要内容之一,为了把握关于新疆的舆情动态,该文从主题热度变化、内容变化及关键词等多方面进行... 随着互联网的飞速发展,网络舆情引发的问题也越发突出。尤其是近年来发生的新疆暴恐事件,已成为公众关注的焦点。主题演化是网络舆情分析的重要内容之一,为了把握关于新疆的舆情动态,该文从主题热度变化、内容变化及关键词等多方面进行了研究。该文首先抓取了2013年1月到2015年12月互联网中关于新疆暴恐事件的新闻,并以此作为数据集建立了动态主题模型,实现对新闻的主题演化分析。该模型采用两次非负矩阵分解来生成主题,以层级式狄利克雷过程为对比实验,通过可视化分析与比较,总结出新疆暴恐事件的一些规律。 展开更多
关键词 动态主题模型 层级式狄利克雷过程 主题模型 可视化
在线阅读 下载PDF
基于主题模型的BBS话题演化趋势分析 被引量:49
10
作者 曹丽娜 唐锡晋 《管理科学学报》 CSSCI 北大核心 2014年第11期109-121,共13页
互联网引发的舆情问题愈发突出,网络舆情研究已被深度关注.话题演化是网络舆情分析的重要内容之一,本文尝试从话题热度变化和内容变化两方面研究舆情动态.本文选取天涯论坛民生讨论的主要版块——天涯杂谈的首发帖为舆情来源,分析比较... 互联网引发的舆情问题愈发突出,网络舆情研究已被深度关注.话题演化是网络舆情分析的重要内容之一,本文尝试从话题热度变化和内容变化两方面研究舆情动态.本文选取天涯论坛民生讨论的主要版块——天涯杂谈的首发帖为舆情来源,分析比较一系列主题模型后,建立动态主题模型(DTM).通过挖掘随时间变化的动态话题链,从词语变化的微观角度分析热门事件下公众意见的变迁过程,还原事件的整个发展过程.本文提出话题热度计算方法,通过计算2012全年天涯杂谈版块下所有新发帖的话题热度值变化及可视化分析,总结了BBS话题的三个规律. 展开更多
关键词 主题模型 dtm 话题演化 天涯论坛
在线阅读 下载PDF
基于加权动态兴趣度的微博个性化推荐 被引量:12
11
作者 陶永才 何宗真 +2 位作者 石磊 卫琳 曹仰杰 《计算机应用》 CSCD 北大核心 2014年第12期3491-3496,共6页
针对微博信息量大、用户兴趣随时间变化特征,提出一种基于加权动态兴趣度(WDDI)的微博个性化推荐模型。WDDI模型考虑微博转发特征,并引入时间因子,利用微博主题模型基于转发的狄利克雷分配(RT-LDA)对用户微博进行研究,建立用户对主题的... 针对微博信息量大、用户兴趣随时间变化特征,提出一种基于加权动态兴趣度(WDDI)的微博个性化推荐模型。WDDI模型考虑微博转发特征,并引入时间因子,利用微博主题模型基于转发的狄利克雷分配(RT-LDA)对用户微博进行研究,建立用户对主题的个体动态兴趣模型。通过用户与其关注用户的相似度和交互频率获取用户的群体动态兴趣,将用户个体兴趣与群体兴趣加权结合得到加权动态主题兴趣模型。对用户接收的新微博按动态兴趣度降序排列,实现微博动态个性化推荐。实验表明,WDDI模型较之传统推荐模型,在微博服务中能够更准确地反映用户动态兴趣。 展开更多
关键词 加权 主题模型 动态兴趣 个性化推荐
在线阅读 下载PDF
一种结合有监督学习的动态主题模型 被引量:11
12
作者 蒋卓人 陈燕 +2 位作者 高良才 汤帜 刘晓钟 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期367-376,共10页
针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM)。该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题... 针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM)。该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题与标签之间的映射关系,提高主题的表达解释能力。通过在一个跨越25年"以自然语言处理领域的中文期刊论文为主导"的中文语料库上的实验,证明该模型相较于静态的有监督主题模型和无监督的动态主题模型,具有更好的语义解释概括能力,能更准确地反映文档的主题结构,更精确地捕捉主题–词汇概率分布的动态演化。 展开更多
关键词 有监督学习 动态主题模型 变分推理
在线阅读 下载PDF
基于反馈报道的话题模型动态修正方法 被引量:3
13
作者 郑燕 鲁燃 赵爱华 《计算机应用》 CSCD 北大核心 2012年第5期1343-1346,共4页
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同... 在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同话题的特性,提出了在修正话题模型时增大相关命名实体权重的方法,从而获得更准确的话题表示模型。实验结果表明,该方法能有效避免话题漂移现象,降低话题追踪过程中的漏报率和错报率。 展开更多
关键词 话题追踪 话题模型 动态阈值 命名 实体 反馈报道
在线阅读 下载PDF
基于时间片划分的舆情话题演化模型研究 被引量:3
14
作者 陈婷 曲霏 陈福集 《华中师范大学学报(自然科学版)》 CAS 北大核心 2015年第6期890-894,共5页
着眼于舆情话题演化的时序特性、衍生特性和话题漂移现象,在分析话题演化特性的基础上构建了基于时间片划分的话题动态演化模型并通过数理分析和实验仿真对模型的有效性进行了验证.实验结果说明划分时间片的话题演化模型可以在保证热点... 着眼于舆情话题演化的时序特性、衍生特性和话题漂移现象,在分析话题演化特性的基础上构建了基于时间片划分的话题动态演化模型并通过数理分析和实验仿真对模型的有效性进行了验证.实验结果说明划分时间片的话题演化模型可以在保证热点话题追踪准确性前提下可进一步通过缩减信息流规模来提高话题追踪效率,从而解决以往话题追踪算法中由于舆情话题的漂移和衍生特性导致的追踪效率低下的问题. 展开更多
关键词 网络舆情 话题演化动态模型 话题热度 模型仿真
在线阅读 下载PDF
基于意见领袖参与行为的微博话题热度预测研究 被引量:5
15
作者 赵龙文 公荣涛 +1 位作者 陈明艳 姚海波 《情报杂志》 CSSCI 北大核心 2013年第12期42-46,11,共6页
随着微博应用的迅猛发展,互联网成为当今社会重要的舆论场。从海量微博信息中了解并预测出网民所关注话题的发展趋势成为一个具有挑战性的研究课题。提出基于意见领袖参与行为的微博话题热度预测模型,以意见领袖的影响力及其参与行为等... 随着微博应用的迅猛发展,互联网成为当今社会重要的舆论场。从海量微博信息中了解并预测出网民所关注话题的发展趋势成为一个具有挑战性的研究课题。提出基于意见领袖参与行为的微博话题热度预测模型,以意见领袖的影响力及其参与行为等指标,研究微博热点话题的发展趋势和特征,分析并验证了模型对不同话题类型的适用性,针对话题演化过程的阶段性变动特征,对模型进行了改进和完善,提出了基于动态系数的多元线性回归预测模型。实验结果表明,预测模型在不考虑外界因素刺激的情况下可以获得较好的预测结果。 展开更多
关键词 意见领袖 微博话题 热度预测 动态回归模型
在线阅读 下载PDF
基于SCIR的微博舆情话题传播模型研究 被引量:45
16
作者 丁学君 《计算机工程与应用》 CSCD 北大核心 2015年第8期20-26,78,共8页
微博是舆情话题传播的重要渠道,研究微博网络中的舆情话题传播机制,将有利于对舆情话题的传播过程进行分析与监控,而传统的网络信息传播模型却无法真实地描述微博网络中的舆情话题传播机制。针对以上问题,分析了微博网络中的信息互动模... 微博是舆情话题传播的重要渠道,研究微博网络中的舆情话题传播机制,将有利于对舆情话题的传播过程进行分析与监控,而传统的网络信息传播模型却无法真实地描述微博网络中的舆情话题传播机制。针对以上问题,分析了微博网络中的信息互动模式及舆情话题的传播特点,以传染病动力学中的SIR模型为基础,通过引入一个新的节点状态——接触状态,构建了基于SCIR(Susceptible Contacted Infected Removed)的微博网络舆情话题传播模型。仿真结果表明,该模型可以很好地描述微博网络中的舆情话题传播规律。 展开更多
关键词 微博 舆情话题 传播模型 传染病动力学
在线阅读 下载PDF
DOLDA模型设计与主题演化分析 被引量:3
17
作者 蒋权 郑山红 +1 位作者 刘凯 李万龙 《计算机工程与设计》 北大核心 2018年第2期446-451,485,共7页
为解决OLDA模型挖掘大规模文档主题时计算效率低下和不能发现新主题的问题,提出一种分布式的DOLDA模型(distribute online LDA,DOLDA)。建立分布式矩阵存储主题-词项,设计一种动态负载均衡策略来提升计算速度和线程调度的性能,根据Zipf... 为解决OLDA模型挖掘大规模文档主题时计算效率低下和不能发现新主题的问题,提出一种分布式的DOLDA模型(distribute online LDA,DOLDA)。建立分布式矩阵存储主题-词项,设计一种动态负载均衡策略来提升计算速度和线程调度的性能,根据Zipf定律结合主题的遗传度提出一种文档权值设置方法。在Spark分布式计算平台的实验结果表明,相比OLDA模型,DOLDA模型能够提高近16%的加速比,有效地在线分析主题的演化。 展开更多
关键词 主题挖掘 分布式计算 在线的潜在狄利克雷分布模型 动态负载均衡 主题演化
在线阅读 下载PDF
基于传染病模型的社交网络舆情话题传播 被引量:19
18
作者 谭娟 《计算机工程与应用》 CSCD 北大核心 2015年第12期118-122,共5页
针对传统模型难以真实地描述社交网络舆情话题传播过程,提出一种基于传染病模型的社交网络舆情话题传播模型。分析了社交网络舆情话题的传播特点,根据传染病动力学机制,将内部感染概率、外部感染概率、免疫概率以及直接免疫概率引入舆... 针对传统模型难以真实地描述社交网络舆情话题传播过程,提出一种基于传染病模型的社交网络舆情话题传播模型。分析了社交网络舆情话题的传播特点,根据传染病动力学机制,将内部感染概率、外部感染概率、免疫概率以及直接免疫概率引入舆情话题传播过程中,构建了社交网络舆情话题传播模型,在Matlab 2012平台下采用Facebook数据集进行仿真测试。仿真实验结果表明,该模型可以准确描述社交网络中的话题传播行为特征,研究结果可以为社交网络舆论管理者提供有价值的参考意见。 展开更多
关键词 社交网络 舆情话题 传播模型 传染病动力学
在线阅读 下载PDF
动态话题追踪中的误报检测 被引量:1
19
作者 吴树芳 徐建民 《计算机应用研究》 CSCD 北大核心 2015年第2期547-551,共5页
针对动态话题追踪模型高误报率的现象,提出了动态追踪中的误报检测来判断追踪到的相关报道是否误报,进而降低动态模型的误报率。考虑到新报道是否和话题相关,除了依据两者的相似度外,还涉及时间距离、差值关系、分布关系、追踪到的报道... 针对动态话题追踪模型高误报率的现象,提出了动态追踪中的误报检测来判断追踪到的相关报道是否误报,进而降低动态模型的误报率。考虑到新报道是否和话题相关,除了依据两者的相似度外,还涉及时间距离、差值关系、分布关系、追踪到的报道和话题核心报道的相似度四方面内容,给出了误报检测因子计算式。实验采用TDT4测试集合和DET曲线进行评测,通过反复实验获得了误报检测因子δ的阈值,与基于信念网络的动态话题追踪模型相比,使用误报检测后模型的最优(Cdet)norm降低了5.032%。 展开更多
关键词 动态话题模型 话题追踪 误报检测 信念网络
在线阅读 下载PDF
话题关联识别中报道信息的动态扩充研究 被引量:2
20
作者 张晓艳 王挺 《计算机科学》 CSCD 北大核心 2009年第11期200-203,241,共5页
话题关联识别用于判断新闻报道对流中每对中的两篇报道是否描述了同一个话题。为解决其中报道篇幅短小、稀疏问题严重及其内容存在漂移等问题,提出了一种动态信息扩充技术,用于改进报道表示模型。该技术用过去最新的话题相关报道来扩充... 话题关联识别用于判断新闻报道对流中每对中的两篇报道是否描述了同一个话题。为解决其中报道篇幅短小、稀疏问题严重及其内容存在漂移等问题,提出了一种动态信息扩充技术,用于改进报道表示模型。该技术用过去最新的话题相关报道来扩充当前报道,动态更新原有模型。此外,还研究了扩充信息的精化问题,通过有选择地加重一些重要特征的权重来减小扩充过程中噪音带来的影响。该方法在TDT4中的中文语料上进行了实验,结果表明动态信息扩充技术能够较大幅度地改进话题关联识别的性能,对多种特征采取的精化技术也对性能改进产生了较大影响。 展开更多
关键词 话题关联识别 动态信息扩充 报道模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部