期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
话题跟踪中静态和动态话题模型的核捕捉衰减 被引量:19
1
作者 洪宇 仓玉 +2 位作者 姚建民 周国栋 朱巧明 《软件学报》 EI CSCD 北大核心 2012年第5期1100-1119,共20页
话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3... 话题跟踪是一项针对新闻话题进行相关信息识别、挖掘和自组织的研究课题,其关键问题之一是如何建立符合话题形态的统计模型.话题形态的研究涉及两个问题,其一是话题的结构特性,其二是话题变形.对比分析了现有词包式、层次树式和链式这3类主流话题模型的形态特征,尤其深入探讨了静态和动态话题模型拟合话题脉络的优势和劣势,并提出一种基于特征重叠比的核捕捉衰减评价策略,专门用于衡量静态和动态话题模型追踪话题发展趋势的能力.在此基础上,分别给出突发式增量式学习方法和时序事件链的更新算法,借以提高动态话题模型的核捕捉性能.实验基于国际标准评测语料TDT4,采用NIST(National Institute of Standards and Technology)提出的最小检测错误权衡系数评测法,并结合所提出的核捕捉衰减评价方法,对各类主要话题模型进行测试.实验结果显示,结构化的动态话题模型具有最佳的跟踪性能,且突发式增量式学习和时序事件链的更新算法分别给予动态话题模型0.4%和3.3%的性能改进. 展开更多
关键词 话题跟踪 静态话题模型 动态话题模型 核捕捉衰减 突发式增量式学习 时序事件链
在线阅读 下载PDF
基于半监督话题模型的用户查询日志命名实体挖掘 被引量:6
2
作者 曹雷 郭嘉丰 +1 位作者 白露 程学旗 《中文信息学报》 CSCD 北大核心 2012年第5期26-32,共7页
基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体... 基于用户查询日志的命名实体挖掘,目标是从用户查询日志中挖掘具有指定类别的命名实体。已有研究工作提出一种基于种子实体的挖掘方法,利用实体类别与候选实体之间的模板分布相似性来对候选实体进行排序。然而该挖掘方法忽略了命名实体具有歧义性、查询模板具有多义性和未标注实体信息,因而不能够有效的对候选实体进行排序。该文采用半监督话题模型,利用查询模板之间的关系来学习实体类别的模板分布,进而改善候选实体的排序效果。实验结果表明了该文提出方法的有效性。 展开更多
关键词 用户查询日志 命名实体挖掘 半监督话题模型
在线阅读 下载PDF
基于知识话题模型的文本蕴涵识别 被引量:4
3
作者 任函 盛雅琦 +1 位作者 冯文贺 刘茂福 《中文信息学报》 CSCD 北大核心 2015年第6期119-126,共8页
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之... 该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。 展开更多
关键词 文本蕴涵识别 话题模型 蕴涵分类 推理知识
在线阅读 下载PDF
基于话题模型的科技文献话题发现和趋势分析 被引量:28
4
作者 贺亮 李芳 《中文信息学报》 CSCD 北大核心 2012年第2期109-115,共7页
自动挖掘科技文献话题,总结发展趋势及最新研究动态,有助于科技工作者的研究。该文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后针对热门和冷门话题以及影响力高和... 自动挖掘科技文献话题,总结发展趋势及最新研究动态,有助于科技工作者的研究。该文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后针对热门和冷门话题以及影响力高和影响力低的话题,进行了趋势分析。该文提出的话题强度和影响力计算方法,可以针对任何文集。对ACL论文集的实验,显示了计算语言学领域过去的发展状况。和其他方法的对比实验,也验证了该文提出的话题强度和影响力的计算方法是正确和可行的。 展开更多
关键词 话题模型 趋势分析
在线阅读 下载PDF
一种面向涌现的比较性话题模型 被引量:2
5
作者 谭文堂 王桢文 +2 位作者 殷风景 葛斌 肖卫东 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期146-155,共10页
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进... 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。 展开更多
关键词 比较性文本挖掘 涌现 话题模型 CDCMLDA模型
在线阅读 下载PDF
基于反馈报道的话题模型动态修正方法 被引量:3
6
作者 郑燕 鲁燃 赵爱华 《计算机应用》 CSCD 北大核心 2012年第5期1343-1346,共4页
在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同... 在话题追踪过程中,由于给定的初始话题相关报道少,而且话题具有动态演变的特点造成话题模型不准确。针对这一问题,提出了利用动态阈值收集反馈报道构造话题修正模型,实现了话题模型的动态修正;同时结合命名实体能够更加有效地区分不同话题的特性,提出了在修正话题模型时增大相关命名实体权重的方法,从而获得更准确的话题表示模型。实验结果表明,该方法能有效避免话题漂移现象,降低话题追踪过程中的漏报率和错报率。 展开更多
关键词 话题追踪 话题模型 动态阈值 命名 实体 反馈报道
在线阅读 下载PDF
基于深度神经网络的嵌入式向量及话题模型 被引量:4
7
作者 何永强 秦勤 王俊鹏 《计算机工程与设计》 北大核心 2016年第12期3384-3388,3399,共6页
在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档... 在对文档集合进行话题分析的过程中,为描述文档中单词间的依赖关系,提高话题分析的效果,提出一种基于反馈递归神经网络的嵌入式向量生成及话题模型。在将单词表示为One-hot向量后,采用递归神经网络将文档嵌入在低维的向量空间。在文档的嵌入式向量计算过程中,采用LSTM(long short-term memory)描述单词间的前向依赖关系,提出一种反馈神经网络用于描述单词间的后向依赖关系。在话题分析模型中,采用原文档和变异文档对作为正样本,采用原文档和随机文档对作为负样本进行模型的训练。实验结果表明,该方法时间和空间复杂度低,具有更好的话题分析效果。 展开更多
关键词 话题模型 递归神经网络 深度学习 反馈机制 嵌入式
在线阅读 下载PDF
网络场域、文化认同与劳工关注社群 基于话题模型与社群侦测的大数据分析 被引量:34
8
作者 黄荣贵 《社会》 CSSCI 北大核心 2017年第2期26-50,共25页
基于"网络与文化"和关系社会学的理论,本文指出网络场域与所沟通的文化内容之间存在互构关系。本文使用话题模型分析了关注劳工议题的用户所发布的51 288条博文,结果显示,劳工话题大致涉及以下几方面:文化与公益、工人的困境... 基于"网络与文化"和关系社会学的理论,本文指出网络场域与所沟通的文化内容之间存在互构关系。本文使用话题模型分析了关注劳工议题的用户所发布的51 288条博文,结果显示,劳工话题大致涉及以下几方面:文化与公益、工人的困境与问题、维权行动与工人组织、制度与劳工权。对用户间互动模式的社群侦测揭示了5个主要社群,结合社群关注的议题,作者将其称为:工人家园社群、工人维权社群、工人文化社群、劳工制度关注社群、工人权益关注社群。本文进一步指出劳工研究领域的两个新趋势:(1)随着新生代工人群体的壮大,工人文化与城市融入等议题受到较多关注;(2)微博促进研究者与劳工组织的互动,在一定程度上有助于后者从制度层面反思工人的境况。最后,本文讨论了大数据分析在网络文化与社会心态研究中的应用。 展开更多
关键词 劳工NGO 大数据 话题模型 互动社群 社会网络分析
在线阅读 下载PDF
中美数字孪生研究主题的比较分析——兼论基于结构话题模型的文献主题数据挖掘方法 被引量:10
9
作者 李海峰 《情报杂志》 CSSCI 北大核心 2022年第1期156-163,共8页
[研究目的]数字孪生是实现工业4.0的关键技术,揭示中美两国数字孪生研究主题的异同对我国数字孪生的研究与发展具有重要意义。[研究方法]以WOS核心合集中的期刊文献作为分析样本,利用结构话题模型分析方法获得了15个主要的研究主题,然... [研究目的]数字孪生是实现工业4.0的关键技术,揭示中美两国数字孪生研究主题的异同对我国数字孪生的研究与发展具有重要意义。[研究方法]以WOS核心合集中的期刊文献作为分析样本,利用结构话题模型分析方法获得了15个主要的研究主题,然后进行了主题数量、主题内容和主题时序演化等维度的比较分析。[研究结论]中美两国数字孪生研究主题存在较小的共同研究旨趣,研究内容总体差异较大,主题数量差异较小,研究范围差异较大。中美研究者对同一话题的关注内容具有各自鲜明特征。大部分研究主题的强度随着时间发展呈现出了显著变化。根据中美数字孪生研究的主题差异,未来我国需要推动数字孪生关键技术的研发,建立健全数字孪生的研发机制,加速推进数字孪生技术应用领域。 展开更多
关键词 数字孪生 中美比较 工业4.0 数据挖掘 结构话题模型
在线阅读 下载PDF
中美“人工智能+教育”研究的话题比较分析——兼论基于结构话题模型的文献主题数据挖掘方法探析 被引量:7
10
作者 李海峰 《情报杂志》 CSSCI 北大核心 2020年第12期179-187,共9页
[目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及... [目的/意义]揭示中国和美国“人工智能+教育”研究的话题异同对于促进我国人工智能教育发展具有重要意义。[方法/过程]以Web of Science数据库中人工智能教育的相关文献为分析对象,采用结构话题模型分析方法,对话题结构、话题内容以及话题时序变化等进行了模型估计和比较分析。[结果/结论]研究结果发现,中美“人工智能+教育”研究涵盖了15个主要话题。美国研究者倾向于机器学习、教育机器人以及智能知识管理系统等11个智能技术性话题,中国研究者关注教育游戏、教学代理和智能医疗等4个教学性话题。他们在同一话题的预期比例和话题关键词内容等方面存在着显著差异,大部分研究话题的时序发展强度各异。基于结构话题模型的文献分析,不仅揭示了两国在话题数量、内容偏好以及强度时序发展等方面的异同,而且为我国人工智能教育的基础性研究、研究体系创建、建立健全研发机制等建议的提出提供了依据。 展开更多
关键词 人工智能+教育 结构话题模型 人工智能教育应用 教育人工智能比较 文本数据挖掘
在线阅读 下载PDF
基于节点重要性的LDA社会网络话题模型研究
11
作者 叶娟 陈启买 《计算机应用研究》 CSCD 北大核心 2016年第3期693-695,共3页
在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(late... 在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(latent Dirichlet allocation)社会网络话题模型。在该模型中,提出了流行性组件的概念,并提出了一种包含了流行性组件的扩展话题模型。通过实验结果表明,提出的包含流行性组件的扩展话题模型具有更好的预测能力,其预测结果的准确性明显优于现有的相关研究。 展开更多
关键词 LDA 话题模型 社会网络 流行性组件
在线阅读 下载PDF
基于词语关联和话题模型的反腐败文献分析
12
作者 李莉 吴江 《江西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2018年第4期34-41,共8页
本项研究以定量方法对2016年中国的反腐败研究情况进行了系统梳理。基于关键词-摘要指数和加权中心度指数的典型词语提炼和语义网络图显示,"政治生活""廉政文化""从严治党"等词语在反腐败研究中占据的地... 本项研究以定量方法对2016年中国的反腐败研究情况进行了系统梳理。基于关键词-摘要指数和加权中心度指数的典型词语提炼和语义网络图显示,"政治生活""廉政文化""从严治党"等词语在反腐败研究中占据的地位,反映了政策实践层面与学术研究之间紧密的对应关系。基于LDA话题模型的分析进一步展现了当下中国反腐败研究的热点议题和创新路径,体现了相关领域研究的丰富性与深入性。 展开更多
关键词 反腐败 廉政 文本分析 话题模型
在线阅读 下载PDF
基于话题模型的专家发现方法 被引量:6
13
作者 刘健 李绮 +1 位作者 刘宝宏 张云 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第2期127-131,共5页
专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词... 专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。 展开更多
关键词 实体检索 专家发现 基于话题模型 排序截断
在线阅读 下载PDF
基于层次话题模型的煤矿安全事故致因要素研究 被引量:10
14
作者 林永明 《安全与环境学报》 CAS CSCD 北大核心 2018年第2期619-623,共5页
为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因... 为促进安全发展,强化煤矿安全管理的科技支撑,在事故致因理论基础上,利用文本挖掘中的话题模型和创新性构建的层次致因要素话题模型,对我国2000—2015年发生的386起重特大煤矿事故调查报告进行了深入地挖掘、分析和研究。发现事故致因隐含的规律及各类事故之间的关联与共性,并进一步研究发现不同致因要素随时间的演化规律及致灾倾向,为煤矿安全管理找出重点,指导煤矿安全生产管理实践。 展开更多
关键词 安全管理工程 煤矿安全事故 致因要素 层次话题模型
在线阅读 下载PDF
基于OLDA的热点话题演化跟踪模型 被引量:18
15
作者 陈兴蜀 高悦 +3 位作者 江浩 杜敏 王海舟 何建云 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第5期130-136,共7页
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现... 为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪. 展开更多
关键词 文本处理 LDA话题模型 话题演化 话题跟踪 HTOLDA话题模型
在线阅读 下载PDF
基于LDA模型的论坛热点话题识别和追踪 被引量:23
16
作者 徐佳俊 杨飏 +1 位作者 姚天昉 付中阳 《中文信息学报》 CSCD 北大核心 2016年第1期43-49,共7页
在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题。然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小。该文提出的方法利... 在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题。然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小。该文提出的方法利用LDA模型对语料集进行建模,将话题从中抽取出来,根据生成的话题空间找到相应的话题支持文档,计算文档支持率作为话题强度;将话题强度反映在时间轴上,得到话题的强度趋势;通过在不同时间段上对语料重新建模,并结合全局话题,得到话题的内容演化路径。实验结果说明,上述方法是合理和有效的。 展开更多
关键词 论坛 话题模型 趋势分析 话题追踪 LDA
在线阅读 下载PDF
基于三维文档向量的自适应话题追踪器模型 被引量:11
17
作者 张辉 周敬民 +1 位作者 王亮 赵莉萍 《中文信息学报》 CSCD 北大核心 2010年第5期70-76,共7页
话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道... 话题追踪(TT)是研究自动追踪事件动态发展过程的一种信息智能获取技术,是话题检测与追踪(TDT)技术的一个子任务,其目标在于自动发现新闻报道信息流中与某一已知话题有关的新报道。该文通过分析传统文档向量空间模型的不足,结合新闻报道的特征,提出了一种三维文档向量模型,在此基础上建立了一种符合新闻报道特征的话题模型。该话题模型在追踪过程中能够根据事件的动态发展进行自我学习和自我修正。结合话题模型,该文还设计了一种自适应的KNN新闻话题追踪器,从而形成了一种完整的中文话题追踪器模型。实验数据表明该方法在描述新闻话题、避免话题漂移方面具有一定优势,在中文话题追踪领域取得了较好效果。 展开更多
关键词 话题追踪 话题模型 三维文档向量模型 自适应KNN追踪器
在线阅读 下载PDF
基于双态模型的微博话题跟踪方法研究 被引量:2
18
作者 陈红阳 汪林林 +2 位作者 鲁江坤 唐志 王飞雪 《计算机工程与应用》 CSCD 北大核心 2017年第16期144-148,共5页
针对话题先验相关报道稀疏性及在话题发展过程中所产生的漂移问题,结合微博文本特点提出了一种基于双态模型的微博话题跟踪方法。该方法首先提出了双态话题模型的构建方法,将其划分为永久存储区域和临时存储区域,分别用于保持跟踪话题... 针对话题先验相关报道稀疏性及在话题发展过程中所产生的漂移问题,结合微博文本特点提出了一种基于双态模型的微博话题跟踪方法。该方法首先提出了双态话题模型的构建方法,将其划分为永久存储区域和临时存储区域,分别用于保持跟踪话题的中心和跟踪话题部分特征词的变迁;并在跟踪过程中动态更新话题模型,能有效应对微博话题发展所产生的漂移。将该方法与其他微博话题跟踪方法进行对比,结果表明,该方法使得漏检率和误检率等指标均得到降低,有效地提高了话题跟踪的效果。 展开更多
关键词 微博短文本 语义相似度 双态话题模型 话题漂移 话题跟踪
在线阅读 下载PDF
一种面向观点挖掘的多粒度话题情感联合模型 被引量:4
19
作者 赵煜 蔡皖东 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2011年第3期181-188,共8页
为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有... 为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有方法存在的领域依赖问题.通过在测试语料库上进行实验,该模型在文本情感倾向性分类任务中的准确率达到82.6%,具有和监督分类系统相当的性能;挖掘话题集合呈现层次化、语义相关的特点,证明了MG-TSJ模型对观点挖掘是可行的和有效的. 展开更多
关键词 观点挖掘 话题模型 多粒度话题情感联合模型 非监督学习 蒙特卡罗模拟法
在线阅读 下载PDF
一种融合词序信息的多粒度文本话题情感联合模型 被引量:2
20
作者 赵煜 邵必林 边根庆 《西安交通大学学报》 EI CAS CSCD 北大核心 2014年第11期103-108,共6页
针对基本话题模型只能抽取粗粒度上下文信息的问题,通过对潜在狄里克雷分配(LDA)模型进行扩展,建立了一种利用词序信息的多粒度话题情感联合模型(MTSU-Col)。MTSU-Col模型客观表达了词汇、全局/局部话题、情感标签和词序信息之间的关联... 针对基本话题模型只能抽取粗粒度上下文信息的问题,通过对潜在狄里克雷分配(LDA)模型进行扩展,建立了一种利用词序信息的多粒度话题情感联合模型(MTSU-Col)。MTSU-Col模型客观表达了词汇、全局/局部话题、情感标签和词序信息之间的关联关系,使模型中话题和情感的建模更加符合文本的语义表达,有效解决了现有话题、情感分析方法存在的领域依赖问题,从而实现了文本多粒度话题信息和情感倾向信息的同步非监督获取。实验表明:利用MTSU-Col模型对文本进行情感倾向性分类,可使综合评价指标F1值达到84%,整体性能与监督分类方法支持向量机(SVM)类似,均优于未采用词序信息的分析方法。由于挖掘话题集合具有层次化、语义相关的特点,因此MTSU-Col模型对观点挖掘是可行、有效的。 展开更多
关键词 话题模型 文本情感分析 联合模型 词序信息
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部