期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于分层狄利克雷过程模型的文本分割 被引量:2
1
作者 李天彩 王波 +1 位作者 席耀一 张佳明 《数据采集与处理》 CSCD 北大核心 2017年第2期408-416,共9页
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process... 文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖于主题个数的人工设置。针对此问题,本文提出了一种基于分层狄利克雷过程(Hierarchical Dirichlet process,HDP)模型的文本分割方法。首先使用HDP模型获取文本在主题空间的向量表示,然后将主题向量用于C99分割算法实现文本分割,最后使用两种优化策略对结果进行优化。实验结果表明,基于HDP模型的方法能够摆脱对人工设置主题个数的依赖,有效提高了文本分割的性能。 展开更多
关键词 主题模型 文本分割 分层狄利克雷过程 CRF构造
在线阅读 下载PDF
基于改进TF-IDF与BERT的领域情感词典构建方法 被引量:6
2
作者 蒋昊达 赵春蕾 +1 位作者 陈瀚 王春东 《计算机科学》 CSCD 北大核心 2024年第S01期150-158,共9页
领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于... 领域情感词典的构建是领域文本情感分析的基础。现有的领域情感词典构建方法存在所筛选候选情感词冗余度高、情感极性判断失准、领域依赖性强等问题。为了提高所筛选候选情感词的领域性和判断领域情感词极性的准确程度,提出了一种基于改进词频-逆文档频率(TF-IDF)与BERT的领域情感词典构建方法。该方法在筛选领域候选情感词阶段对TF-IDF算法进行改进,将隐含狄利克雷分布(LDA)算法与改进后的TF-IDF算法结合,进行领域性修正,提升了所筛选候选情感词的领域性;在候选情感词极性判断阶段,将情感倾向点互信息算法(SO-PMI)与BERT结合,利用领域情感词微调BERT分类模型,提高了判断领域候选情感词情感极性的准确程度。在不同领域的用户评论数据集上进行实验,结果表明,该方法可以提高所构建领域情感词典的质量,使用该方法构建的领域情感词典用于汽车领域和手机领域文本情感分析的F1值分别达到78.02%和88.35%。 展开更多
关键词 情感分析 领域情感词典 词频-逆文档频率 隐含狄利克雷分布 情感倾向点互信息算法 BERT模型
在线阅读 下载PDF
液体火箭发动机的分层贝叶斯变分推理故障诊断方法 被引量:1
3
作者 刘久富 丁晓彬 +4 位作者 汪恒宇 王彪 刘海阳 杨忠 王志胜 《北京理工大学学报》 EI CAS CSCD 北大核心 2022年第3期289-296,共8页
针对稀疏数据场景下,传统的多项式-狄利克雷模型存在一定的分类精度问题,提出一种基于变分推理的分层贝叶斯网络的参数估计方法.通过在传统的多项式-狄利克雷模型中引入超先验,构建出的分层多项式-狄利克雷模型可用于贝叶斯网络中的条... 针对稀疏数据场景下,传统的多项式-狄利克雷模型存在一定的分类精度问题,提出一种基于变分推理的分层贝叶斯网络的参数估计方法.通过在传统的多项式-狄利克雷模型中引入超先验,构建出的分层多项式-狄利克雷模型可用于贝叶斯网络中的条件分布估计.对分层多项式-狄利克雷模型的先验依赖结构进行分析研究,提出一种快速准确的自组织变分推理算法.与传统的分类模型相比,本文提出的分层多项式-狄利克雷模型在处理小数据集液体火箭发动机的故障分类中有显著的性能提高. 展开更多
关键词 贝叶斯网络 液体火箭发动机 分层多项式-狄利克雷模型 变分推理算法
在线阅读 下载PDF
基于HDP-CHMM的机械设备性能退化评估 被引量:6
4
作者 王恒 季云 +1 位作者 朱龙彪 刘肖 《振动.测试与诊断》 EI CSCD 北大核心 2018年第4期733-737,共5页
针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能... 针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能退化评估方法。该方法利用分层狄利克雷模型的分层聚类原理,在狄利克雷过程(Dirichlet process,简称DP)模型的基础上进行扩展,利用多组关联数据实现了模型结构根据观测数据的自适应变化和动态调整,获得设备运行过程中的最优退化状态数,并结合连续隐马尔可夫模型(continuous hidden Markov model,简称CHMM)良好的分析和建模能力,获得设备退化状态转移路径,实现机械设备运行过程中的退化状态识别和性能评估。利用滚动轴承全寿命数据的多组特征值进行了应用研究,并与基于K-S检验算法的机械设备零部件性能退化评估方法进行了比较。结果表明,HDP-CHMM模型可以对轴承实际运行状态转移过程进行建模,有效识别轴承运行中的不同退化状态,为基于状态的设备维修提供了理论指导。 展开更多
关键词 分层狄利克雷模型 连续隐马尔可夫模型 性能退化评估 滚动轴承
在线阅读 下载PDF
基于HDP-HMM的机械设备故障预测方法研究 被引量:7
5
作者 王恒 周易文 +1 位作者 瞿家明 季云 《振动与冲击》 EI CSCD 北大核心 2019年第8期173-179,共7页
针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,... 针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,获得设备运行过程中的隐状态数;基于HDP-HMM所建立的退化状态动态转移关系,确定设备早期故障点和功能故障点,实现设备的健康等级评估和故障预测。利用美国USFI/UCR智能维护系统中心提供的滚动轴承全寿命数据进行了应用研究。结果表明,针对多观测序列,HDP-HMM能有效实现组合聚类,识别结果不依赖于算法初始参数的选择,具有较强的鲁棒性;与基于K-S检验的退化评估算法比较表明,HDP-HMM更能有效描述设备实际退化过程。 展开更多
关键词 分层狄利克雷过程-隐马尔科夫模型(HDP-HMM) 退化状态 故障预测
在线阅读 下载PDF
一种基于标签的改进主题演化模型
6
作者 姚立 张曦煌 《计算机工程》 CAS CSCD 北大核心 2019年第4期205-210,216,共7页
传统主题演化(ToT)模型通常忽略原始数据中的标签元信息。为此,建立一种基于标签的改进ToT模型。针对传统权重算法忽略词汇在文档集类别间和类别内的分布对权重产生影响的问题,结合文档标题特征,使用改进词频-反重力距算法进行权重分析... 传统主题演化(ToT)模型通常忽略原始数据中的标签元信息。为此,建立一种基于标签的改进ToT模型。针对传统权重算法忽略词汇在文档集类别间和类别内的分布对权重产生影响的问题,结合文档标题特征,使用改进词频-反重力距算法进行权重分析,以扩展模型的生成过程。在ToT模型的基础上引入原始文档的标签属性,构建改进模型并使用吉布斯采样算法估计其参数。实验结果表明,与ToT模型相比,该模型具有较高的泛化能力。 展开更多
关键词 标签 主题演化模型 狄利克雷分配 词频-反重力距算法 吉布斯采样
在线阅读 下载PDF
面向产品属性的用户情感模型 被引量:4
7
作者 贾闻俊 张晖 +2 位作者 杨春明 赵旭剑 李波 《计算机应用》 CSCD 北大核心 2016年第1期175-180,共6页
传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过... 传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过程(HDP)将名词实体聚类形成产品属性并自动获取其数量;然后,结合产品属性中名词实体的权重和评价短语以及情感词典作为先验,利用潜在狄利克雷分布(LDA)对产品属性进行情感分类。实验结果表明,该模型具有较高的情感分类准确率,情感分类平均准确率达87%。该模型与传统的情感模型相比在抽取产品属性和评价短语的情感分类上具有较高的准确率。 展开更多
关键词 情感模型 细粒度 产品属性 分层狄利克雷过程 潜在狄利克雷分布
在线阅读 下载PDF
面向微博文本流的负面情感突发话题检测 被引量:6
8
作者 李艳红 赵宏伟 +1 位作者 王素格 李德玉 《计算机应用》 CSCD 北大核心 2020年第12期3458-3464,共7页
如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话... 如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话题检测(NE-BTD)算法。首先,将微博中的主题词对的加速度和负面情感强度变化率作为负面情感突发话题的判定依据;然后,利用突发词对的速度确定负面情感突发话题的窗口范围;最后,使用一种基于吉布斯采样的狄利克雷多项式混合模型(GSDMM)聚类算法得到窗口中负面情感突发话题的主题结构。在实验中将所提出的NE-BTD算法与已有的一种基于情感方法的话题检测(EBM-TD)算法进行对比,结果表明所提出的NE-BTD算法相较EBM-TD算法准确率和召回率至少提高了20%,并且可以至少提前40 min检出负面情感突发话题。 展开更多
关键词 微博 文本流 突发话题 负面情感 狄利克雷多项式混合模型
在线阅读 下载PDF
HDP采样消息传递算法 被引量:1
9
作者 王杰 严建峰 +1 位作者 刘晓升 杨璐 《计算机应用研究》 CSCD 北大核心 2016年第7期1994-1998,共5页
分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法... 分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法与LDA以及HDP算法在混淆度方面进行对比。实验结果表明,该算法相比HDP采样算法收敛较快,最终也能收敛到LDA模型最优主题数目下的混淆度。 展开更多
关键词 消息传递算法 分层狄利克雷过程 采样 无参主题模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部