期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于MB-HDP模型的微博主题挖掘 被引量:31
1
作者 刘少鹏 印鉴 +2 位作者 欧阳佳 黄云 杨晓颖 《计算机学报》 EI CSCD 北大核心 2015年第7期1408-1419,共12页
主题模型是挖掘微博潜在主题的重要工具.然而,现有的主题模型多由Latent Dirichlet Allocation(LDA)派生,它需要用户预先指定主题数目.为了自动挖掘微博主题,作者提出了一个基于分层Dirichlet过程(Hierarchical Dirichlet Process,HDP)... 主题模型是挖掘微博潜在主题的重要工具.然而,现有的主题模型多由Latent Dirichlet Allocation(LDA)派生,它需要用户预先指定主题数目.为了自动挖掘微博主题,作者提出了一个基于分层Dirichlet过程(Hierarchical Dirichlet Process,HDP)的非参数贝叶斯模型MB-HDP.首先,针对微博应用场景,假设消息是不可交换的;接着,利用微博的时间信息、用户兴趣以及话题标签,聚合主题相关的消息以解决微博短文本的数据稀疏问题;然后,扩展Chinese Restaurant Franchise(CRF)对微博数据进行主题建模;最后,设计一个相应的Markov Chain Monte Carlo(MCMC)采样方法,推导MB-HDP模型的分布参数.实验表明,在生成主题质量、内容困惑度和模型复杂度等指标上,MB-HDP模型明显优于LDA和HDP两种模型. 展开更多
关键词 主题挖掘 微博 分层dirichlet过程 MB-hdp
在线阅读 下载PDF
分层Dirichlet过程及其应用综述 被引量:41
2
作者 周建英 王飞跃 曾大军 《自动化学报》 EI CSCD 北大核心 2011年第4期389-407,共19页
Dirichlet过程是一种应用于非参数贝叶斯模型中的随机过程,特别是作为先验分布应用在概率图模型中.与传统的参数模型相比,Dirichlet过程的应用更加广泛且模型更加灵活,特别是应用于聚类问题时,该过程能够自动确定聚类数目和生成聚类中... Dirichlet过程是一种应用于非参数贝叶斯模型中的随机过程,特别是作为先验分布应用在概率图模型中.与传统的参数模型相比,Dirichlet过程的应用更加广泛且模型更加灵活,特别是应用于聚类问题时,该过程能够自动确定聚类数目和生成聚类中心的分布参数.因此,近年来,在理论和应用上均得到了迅速的发展,引起越来越多的关注.本文首先介绍Dirichlet过程,而后描述了以Dirichlet过程为先验分布的Dirichlet过程混合模型及其应用,接着概述分层Dirichlet过程及其在相关算法构造中的应用,最后对分层Dirichlet过程的理论和应用进行了总结,并对未来的发展方向作了探讨. 展开更多
关键词 dirichlet过程 概率图模型 聚类 分层dirichlet过程
在线阅读 下载PDF
基于HDP的汽车专利主题演化研究 被引量:10
3
作者 王亮 张绍武 +2 位作者 丁堃 许侃 林鸿飞 《情报学报》 CSSCI 北大核心 2014年第9期944-951,共8页
近年来专利数据呈爆炸式增长,从专利文本信息中准确地获取主题信息并将其可视化逐渐成为一个重要的研究方向。专利主题演化研究能够挖掘出专利中潜在的发展模式,对相关研究具有重要参考价值。本文将分层的狄利克雷过程(HDP)应用到... 近年来专利数据呈爆炸式增长,从专利文本信息中准确地获取主题信息并将其可视化逐渐成为一个重要的研究方向。专利主题演化研究能够挖掘出专利中潜在的发展模式,对相关研究具有重要参考价值。本文将分层的狄利克雷过程(HDP)应用到专利主题聚类中,通过当前主题与加入历史数据之后的主题变化来挖掘主题的分流与合流,最后对主题信息利用叠式图进行可视化展示。实验结合实际的汽车专利数据进行分析研究,发现汽车专利主要分为三个大主题,而且各个主题之间有分流、合流,有逐年递增也有逐年递减,有新生主题也有消亡主题等各种形式,并发现从2006年开始汽车安全领域和汽车新能源领域分别独立成为一个主题并呈逐年增长的趋势。 展开更多
关键词 hdp 主题聚类 主题演化 汽车专利
在线阅读 下载PDF
基于HDP-HMM的机械设备故障预测方法研究 被引量:7
4
作者 王恒 周易文 +1 位作者 瞿家明 季云 《振动与冲击》 EI CSCD 北大核心 2019年第8期173-179,共7页
针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,... 针对隐马尔科夫模型状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-隐马尔科夫模型(HDP-HMM)的机械设备故障预测方法。该算法通过构造HDP作为HMM参数的先验分布,利用HDP分层共享和自动聚类的优点,实现了模型结构动态更新,获得设备运行过程中的隐状态数;基于HDP-HMM所建立的退化状态动态转移关系,确定设备早期故障点和功能故障点,实现设备的健康等级评估和故障预测。利用美国USFI/UCR智能维护系统中心提供的滚动轴承全寿命数据进行了应用研究。结果表明,针对多观测序列,HDP-HMM能有效实现组合聚类,识别结果不依赖于算法初始参数的选择,具有较强的鲁棒性;与基于K-S检验的退化评估算法比较表明,HDP-HMM更能有效描述设备实际退化过程。 展开更多
关键词 分层狄利克雷过程-隐马尔科夫模型(hdp-HMM) 退化状态 故障预测
在线阅读 下载PDF
基于HDP-CHMM的机械设备性能退化评估 被引量:6
5
作者 王恒 季云 +1 位作者 朱龙彪 刘肖 《振动.测试与诊断》 EI CSCD 北大核心 2018年第4期733-737,共5页
针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能... 针对传统隐马尔可夫模型(hidden Markov model,简称HMM)状态数必须预先设定的不足,提出了一种基于分层狄利克雷过程-连续隐马尔可夫模型(hierarchical Dirichlet process-continuous hidden Markov model,简称HDP-CHMM)的机械设备性能退化评估方法。该方法利用分层狄利克雷模型的分层聚类原理,在狄利克雷过程(Dirichlet process,简称DP)模型的基础上进行扩展,利用多组关联数据实现了模型结构根据观测数据的自适应变化和动态调整,获得设备运行过程中的最优退化状态数,并结合连续隐马尔可夫模型(continuous hidden Markov model,简称CHMM)良好的分析和建模能力,获得设备退化状态转移路径,实现机械设备运行过程中的退化状态识别和性能评估。利用滚动轴承全寿命数据的多组特征值进行了应用研究,并与基于K-S检验算法的机械设备零部件性能退化评估方法进行了比较。结果表明,HDP-CHMM模型可以对轴承实际运行状态转移过程进行建模,有效识别轴承运行中的不同退化状态,为基于状态的设备维修提供了理论指导。 展开更多
关键词 分层狄利克雷模型 连续隐马尔可夫模型 性能退化评估 滚动轴承
在线阅读 下载PDF
基于HDP模型的领域微博主题演化研究 被引量:2
6
作者 高永兵 杨利莹 +1 位作者 胡文江 马占飞 《计算机工程》 CAS CSCD 北大核心 2018年第2期1-8,共8页
领域微博中包含较多的专业领域信息,并且随时间表现出较强的演化性。为分析领域的主题演化情况,构建一个基于分层Dirichlet过程(HDP)的DM-HDP模型。以用户为单位抽取领域相关的微博,利用微博的领域特征和时间特征,提取领域相关带有明显... 领域微博中包含较多的专业领域信息,并且随时间表现出较强的演化性。为分析领域的主题演化情况,构建一个基于分层Dirichlet过程(HDP)的DM-HDP模型。以用户为单位抽取领域相关的微博,利用微博的领域特征和时间特征,提取领域相关带有明显时间特征的微博并自动挖掘其主题分布,最终构建领域主题演化分析过程。实验结果表明,基于DM-HDP模型的分析方法能够表现领域微博主题的演化过程,与基于LDA和HDP模型的方法相比,在内容困惑度和模型复杂度等方面均具有明显优势。 展开更多
关键词 领域微博 主题挖掘 分层dirichlet模型 DM-hdp模型 GIBBS采样 主题演化
在线阅读 下载PDF
HDP-HSMM的磨削声发射砂轮钝化状态识别 被引量:7
7
作者 钟利民 李丽娟 +3 位作者 杨京 梁彬 程建春 刘翔雄 《应用声学》 CSCD 北大核心 2019年第2期151-158,共8页
在高精度金属材料磨削加工中,刀具即砂轮的状态对加工效率和加工质量具有重要的影响。钝化程度较高的砂轮不适于加工精密工件,需提前预警并修整更换砂轮。该文提出一种通过磨削声发射信号来检测砂轮钝化状态的方法。首先,对于采集到的... 在高精度金属材料磨削加工中,刀具即砂轮的状态对加工效率和加工质量具有重要的影响。钝化程度较高的砂轮不适于加工精密工件,需提前预警并修整更换砂轮。该文提出一种通过磨削声发射信号来检测砂轮钝化状态的方法。首先,对于采集到的信号进行小波软阈值降噪。然后,将其分割成多个有重叠的帧,并提取每帧信号的8个特征组成声发射数据集。最后,通过分层Dirichlet过程-隐半马尔可夫模型来建立声发射数据集和不同的砂轮钝化状态之间的非线性关系,旨在识别砂轮钝化状态。结果表明,上述检测方法能有效识别砂轮的不同钝化状态并能对整个加工过程中的砂轮钝化程度进行自动划分,其在测试数据集上的准确率达到93.7%,可以为实际工业应用提供理论指导。 展开更多
关键词 砂轮钝化 分层dirichlet过程-隐半马尔可夫模型 磨削声发射 小波阈值降噪
在线阅读 下载PDF
HDP采样消息传递算法 被引量:1
8
作者 王杰 严建峰 +1 位作者 刘晓升 杨璐 《计算机应用研究》 CSCD 北大核心 2016年第7期1994-1998,共5页
分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法... 分层狄利克雷过程是一种贝叶斯无参模型,用于分析海量数据的概率主题模型,解决潜在狄利克雷分布无法解决的动态聚类的问题。从因子图的角度出发将消息传递算法与吉布斯采样算法结合用于解决贝叶斯无参模型后验概率推断问题,最终将该算法与LDA以及HDP算法在混淆度方面进行对比。实验结果表明,该算法相比HDP采样算法收敛较快,最终也能收敛到LDA模型最优主题数目下的混淆度。 展开更多
关键词 消息传递算法 分层狄利克雷过程 采样 无参主题模型
在线阅读 下载PDF
采用HDPHMM符号化器的语音查询样例检测方法 被引量:1
9
作者 曹建凯 张连海 《信号处理》 CSCD 北大核心 2017年第5期703-710,共8页
提出一种基于层级狄利克雷过程隐马尔科夫模型(HDPHMM)符号化器的无监督语音查询样例检测(Qb E-STD)方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过... 提出一种基于层级狄利克雷过程隐马尔科夫模型(HDPHMM)符号化器的无监督语音查询样例检测(Qb E-STD)方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过对顶层状态假设一个层级狄利克雷过程先验,获得非参贝叶斯模型HDPHMM。使用无标注语音数据对该模型进行训练,然后对测试语音和查询样例输出后验概率特征矢量,使用非负矩阵分解算法对后验概率进行优化得到新的特征,然后在此基础上,应用修正分段动态时间规整算法进行检索,构成Qb E-STD系统。实验结果表明,相比于基于高斯混合模型符号化器的基线系统,本文所提出的方法性能更优,检索精度得到显著提升。 展开更多
关键词 无监督 语音查询样例检测 层级狄利克雷过程 非负矩阵分解
在线阅读 下载PDF
基于HDP的监督多标签文本分类研究 被引量:2
10
作者 谢晨阳 卢焱鑫 《计算机工程与应用》 CSCD 北大核心 2017年第23期18-23,46,共7页
随着互联网和信息技术的发展,大量的多标签文本数据快速产生。在文本分类中如何确定合适的分类数目以及如何更加准确地辨别文档的标签是亟待解决的问题。提出的HL_LDA模型通过层次狄利克雷过程自动确定分类的数目,通过发掘多标签文档的... 随着互联网和信息技术的发展,大量的多标签文本数据快速产生。在文本分类中如何确定合适的分类数目以及如何更加准确地辨别文档的标签是亟待解决的问题。提出的HL_LDA模型通过层次狄利克雷过程自动确定分类的数目,通过发掘多标签文档的标签之间的层次信息提高分类的质量。实验结果表明在不同类型的数据集中,和经典的LDA,SVM等方法相比,HL_LDA在精度,F1-score等评估指标上明显优于现有的方法。 展开更多
关键词 多标签 文本分类 标签依赖 层次狄利克雷过程
在线阅读 下载PDF
带粘性的层次Dirichlet过程聚类方法 被引量:1
11
作者 李涵 张娜 《统计与信息论坛》 CSSCI 北大核心 2019年第8期20-26,共7页
对由多个指标组成的多元数据进行聚类分析时,数据维度的增加、各指标与总体聚类的相关性程度不一致以及各指标服从的分布不同会增加聚类的复杂性,影响聚类结果的准确性,因此需要通过合适的方法来对多元数据进行聚类分析。针对这一问题,... 对由多个指标组成的多元数据进行聚类分析时,数据维度的增加、各指标与总体聚类的相关性程度不一致以及各指标服从的分布不同会增加聚类的复杂性,影响聚类结果的准确性,因此需要通过合适的方法来对多元数据进行聚类分析。针对这一问题,提出改进的带粘性的层次Dirichlet过程(sticky Hierarchical Dirichlet Process)方法来实现对多元数据的降维聚类,以解决各指标服从不同分布的问题,并用粘性参数反映各指标与总体聚类之间的相关性。用MCMC方法来估计模型参数。通过对仿真模拟数据和IRIS数据集的聚类分析,证实了该方法的有效性,同时发现单个指标与总体聚类的相关性越大,则相应的粘性参数越大,从而反映该指标在总体聚类中的重要性程度越高;并且当各指标数据中有粘性较大的指标时,带粘性的层次Dirichlet过程方法明显优于其他聚类方法,能够显著提高分类的准确性。 展开更多
关键词 聚类分析 带粘性的层次dirichlet过程 整合分析 多元数据
在线阅读 下载PDF
面向复杂主题建模的流式层次狄里克雷过程 被引量:6
12
作者 韩忠明 张梦玫 +2 位作者 李梦琪 段大高 陈谊 《计算机学报》 EI CSCD 北大核心 2019年第7期1539-1552,共14页
互联网已经成为真实事件信息的主要来源.针对互联网海量新闻语料的主题挖掘是新闻事件的组织和追踪任务中关键的一环.主题模型已被广泛应用于挖掘和分析新闻等文本语料,LDA(Latent Dirichlet Allocation)是最常见的主题模型,然而现有基... 互联网已经成为真实事件信息的主要来源.针对互联网海量新闻语料的主题挖掘是新闻事件的组织和追踪任务中关键的一环.主题模型已被广泛应用于挖掘和分析新闻等文本语料,LDA(Latent Dirichlet Allocation)是最常见的主题模型,然而现有基于LDA的方法没有考虑到主题之间的层次关系,且需要预先提供主题个数.作为LDA模型的扩展,层次狄里克雷过程(Hierarchical Dirichlet Process,HDP)是非参数贝叶斯主题模型,HDP能够自动确定主题个数.对于具有层次等特性的复杂主题,HDP难以挖掘出隐式层次结构,且容易产生噪音主题.为了解决这个问题,该文提出了基于HDP改进的非参数贝叶斯模型:流式层次狄里利克雷过程(Flow Hierarchical Dirichlet Process,FHDP),FHDP通过在HDP模型中加入流动操作,加强了对主题之间的同属领域信息的利用,以便于更好的对主题进行层次分析.利用加入了流动操作的中国连锁餐馆模型(Chinese Restaurant Franchise,CRF)对数据进行建模,设计相应的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)采样方法,以推导FHDP模型的分布参数分布.FHDP的主要贡献在于:(1)对含有层次关系的主题建模时,减少了无意义信息.解决了HDP得到主题不明确的问题,扩大了HDP的应用领域;(2)由于在FHDP中加强了对主题隐含领域信息的利用,主题的层次关系变得更加明确.为了客观衡量FHDP和HDP的性能差异,利用模拟和真实数据进行了大量实验.实验表明,在轮廓系数、主题覆盖度、单字对数似然等指标上,FHDP模型明显优于HDP模型。 展开更多
关键词 层次狄里克雷过程 主题模型 非参数贝叶斯模型 马尔可夫蒙特卡罗 流式层次狄里克雷过程
在线阅读 下载PDF
视频监控中可变人体行为的识别 被引量:13
13
作者 满君丰 李倩倩 温向兵 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期492-497,共6页
为有效识别视频监控中的人体行为,提出了新的人体行为识别模型和前景提取方法.对前景提取,采用背景边缘模型与背景模型相结合的前景检测方法,有效避免了光照、阴影等外部因素的影响.为了快速发现人体运动过程中产生的新行为,采用分层Dir... 为有效识别视频监控中的人体行为,提出了新的人体行为识别模型和前景提取方法.对前景提取,采用背景边缘模型与背景模型相结合的前景检测方法,有效避免了光照、阴影等外部因素的影响.为了快速发现人体运动过程中产生的新行为,采用分层Dirichlet过程聚类人体特征数据来判断是否有未知人体行为产生,用无限HMM对含有未知行为模式的特征向量进行有监督学习,由管理者将其添加到知识库中.当知识库的行为模式达到一定规模时,系统可以无监督地对人体行为进行分析.通过仿真实验证实了提出的方法在人体行为识别方面较其他方法具有独特的优势. 展开更多
关键词 视频监控 行为模式 行为识别 前景提取 多层dirichlet过程
在线阅读 下载PDF
视频监控中针对拥挤人群的人体分割与跟踪 被引量:7
14
作者 温向兵 满君丰 +1 位作者 李倩倩 李长云 《小型微型计算机系统》 CSCD 北大核心 2012年第4期891-895,共5页
视频监控中,拥挤人群的相互遮挡给人体分割和跟踪带来很大困难.为了解决该问题,提出人体模型和人体边缘曲线相结合的人体分割方法.针对分割可能造成人体特征值存在较大的缺损、畸变问题,采用具有较高鲁棒性的BP(Back Propaga-tion)神经... 视频监控中,拥挤人群的相互遮挡给人体分割和跟踪带来很大困难.为了解决该问题,提出人体模型和人体边缘曲线相结合的人体分割方法.针对分割可能造成人体特征值存在较大的缺损、畸变问题,采用具有较高鲁棒性的BP(Back Propaga-tion)神经网络作为跟踪模型.为了提高BP网络的自主学习能力,采用分层Dirichlet过程来判断是否有新类别的人体特征数据产生,进而为BP网络的学习提供决策.通过仿真实验证实:本文提出的遮挡处理方法能够有效解决人体部分遮挡问题,与其他方法相比,具有简单且实时性好的优点;此外,分层Dirichlet过程与BP网络的结合提高了跟踪系统的自主学习能力. 展开更多
关键词 拥挤人群 人体模型 分层dirichlet过程 BP神经网络 前景边缘曲线
在线阅读 下载PDF
融合SOM功能聚类与DeepFM质量预测的API服务推荐方法 被引量:25
15
作者 曹步清 肖巧翔 +1 位作者 张祥平 刘建勋 《计算机学报》 EI CSCD 北大核心 2019年第6期1367-1383,共17页
由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已... 由于越来越多的企业和组织纷纷将自己的业务、数据或资源封装成服务,并通过API的形式发布到互联网上,API服务的数量呈现倍增趋势.在此背景下,如何从这样一个大规模的API服务集合中,快速有效地找到满足开发者用户Mashup需求的API服务,已成为一个挑战性问题.为此,本文聚焦于“推荐合适的API服务以构建高质量Mashup应用”问题,以面向服务内容的功能聚类为基础,结合基于多维服务质量的评分预测,提出一种融合SOM功能聚类与DeepFM质量预测的API服务推荐方法,用于创建高质量的Mashup应用.该方法首先采用Wikipedia 作为外部语料库扩充API服务文档的内容并利用HDP模型建模其主题分布.通过WikiExtractor抽取出Wikipedia中的语料数据,并利用Word2vec工具训练该语料数据获得其词向量模型.利用训练好的Wikipedia词向量模型对API服务描述文档进行扩充.针对扩充后的API服务文档,使用HDP主题建模技术,挖掘出其隐含的主题信息,自动确定最优主题个数,以准确地度量API服务文档之间的语义相似度.然后,采用SOM神经网络进行面向主题的API服务聚类.在HDP主题建模之后,对获得的“API服务文档-主题”向量采用SOM神经网络聚类算法进行主题聚类,通过自组织过程,将众多的API服务划分到不同的功能类簇中,每一个功能类中包含多个具有相似功能的API服务.接下来,针对API服务类簇中所有具有相似功能的API服务,利用DeepFM模型建模和挖掘其多维QoS属性之间的复杂交互关系,预测并排序API服务的质量得分.DeepFM模型自动地提取出QoS数据中(包括流行度、共现次数等)的有效的特征组合关系(包括高阶特征和低阶特征组合关系),预测并排序每一个API服务相对于目标Mashup应用的质量得分,推荐得分靠前的 N 个API服务给开发者用户.最后,在真实Web服务数据集上进行了实验比较与分析,实验结果表明:本文方法在准确率、召回率、纯度、熵、DCG、HMD等性能方面都要整体优于其它六种方法.相比于TF-IDF、LDA-K-CF、LDA-K-FM、HDP-K-CF、HDP-K-FM、HDP-S - FM,本文方法的准确率指标分别提升了196.2%、49%、33.8%、31.2%、12.3%、10.3%,DCG值分别提升了161.8%、26.4%、18.6%、16.2%、6.73%、4.5%. 展开更多
关键词 API推荐 Mashup应用 hdp主题模型 SOM神经网络 深度因子分解机
在线阅读 下载PDF
采用自适应先验表观模型的目标跟踪方法
16
作者 孙建中 熊忠阳 张玉芳 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2013年第5期69-75,共7页
为有效解决可变目标在跟踪过程中的"漂移"问题,提出一种基于自适应先验表观模型的目标跟踪方法。该方法首先在一致架构内融合HDP-EVO演化聚类模型和在线Boosting学习。以Dirichlet过程为先验分布,对总体表观示例进行聚类分析... 为有效解决可变目标在跟踪过程中的"漂移"问题,提出一种基于自适应先验表观模型的目标跟踪方法。该方法首先在一致架构内融合HDP-EVO演化聚类模型和在线Boosting学习。以Dirichlet过程为先验分布,对总体表观示例进行聚类分析,获得随时间自适应演化的表观类先验知识,进而利用共享的表观类混合比例的权重平滑约束各时刻的表观模型。改进Gibbs抽样过程,使之能融入目标示例的分类误差,并交替迭代地从数据中自主学习聚类和表观分类器。最后,根据表观模型中各表观类的权重系数组合它们的分类评分去定位目标位置。仿真实验表明新方法学习的表观模型能较鲁棒地自适应于目标的表观变化,提高了跟踪精度。 展开更多
关键词 表观模型 自适应先验 层次dirichlet过程 聚类分析 分类器
在线阅读 下载PDF
融合多维信息的主题自适应Web API推荐方法 被引量:5
17
作者 李鸿超 刘建勋 +1 位作者 曹步清 石敏 《软件学报》 EI CSCD 北大核心 2018年第11期3374-3387,共14页
如何根据用户的自然语言需求描述自动生成或推荐用于解决问题的WebAPI服务集合,并辅助构建Mashup,是业务流程管理者和服务组合者关注的热点之一.如何提高推荐的质量,是大家关注的焦点.为此,提出了一种融合多维信息的主题自适应Web API... 如何根据用户的自然语言需求描述自动生成或推荐用于解决问题的WebAPI服务集合,并辅助构建Mashup,是业务流程管理者和服务组合者关注的热点之一.如何提高推荐的质量,是大家关注的焦点.为此,提出了一种融合多维信息的主题自适应Web API推荐方法 HDP-FM(hierarchical Dirichlet processes-factorization machines)为Mashup的创建推荐Web APIs集合.该方法以Web API的描述文档为语料库,利用HDP模型训练每个Web API的主题分布向量;其次,利用已生成的主题模型预测每个Mashup的主题分布向量,用于相似度的计算;最后,将Mashup之间的相似度、WebAPI之间的相似度、Web API的流行度和共现性作为因子分解机模型的输入,评分排序获取用于推荐的WebAPIs集合.为了验证HDP-FM方法的性能,使用从ProgrammableWeb平台上爬取的真实数据进行多组实验,实验结果表明,HDP-FM方法在准确率、召回率、F-measure和NDCG@N等方面具有较好的性能. 展开更多
关键词 Web API推荐 hdp(hierarchical dirichlet process) 因子分解 Mashup创建
在线阅读 下载PDF
面向产品属性的用户情感模型 被引量:4
18
作者 贾闻俊 张晖 +2 位作者 杨春明 赵旭剑 李波 《计算机应用》 CSCD 北大核心 2016年第1期175-180,共6页
传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过... 传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种细粒度的面向产品属性的用户情感模型(USM)。首先,利用分层狄利克雷过程(HDP)将名词实体聚类形成产品属性并自动获取其数量;然后,结合产品属性中名词实体的权重和评价短语以及情感词典作为先验,利用潜在狄利克雷分布(LDA)对产品属性进行情感分类。实验结果表明,该模型具有较高的情感分类准确率,情感分类平均准确率达87%。该模型与传统的情感模型相比在抽取产品属性和评价短语的情感分类上具有较高的准确率。 展开更多
关键词 情感模型 细粒度 产品属性 分层狄利克雷过程 潜在狄利克雷分布
在线阅读 下载PDF
基于层次狄利克雷过程的交互式主题建模 被引量:9
19
作者 严宇宇 陶煜波 林海 《软件学报》 EI CSCD 北大核心 2016年第5期1114-1126,共13页
随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用户的领域专业知识对模型结果进行修正.针对这一问题,提出了一... 随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用户的领域专业知识对模型结果进行修正.针对这一问题,提出了一个交互式可视分析系统,帮助用户对主题模型进行交互修正.首先对层次狄利克雷过程进行了改进,使其支持单词约束;然后,使用矩阵视图对主题模型进行展示,并使用语义相关的词云布局帮助用户寻找单词约束,用户通过添加单词约束迭代优化主题模型;最后,通过案例分析及用户研究来评价该系统的可用性. 展开更多
关键词 文本可视化 主题模型 文本分析 层次狄利克雷过程
在线阅读 下载PDF
无监督实体关系触发词词典自动构建 被引量:3
20
作者 刘绍毓 席耀一 +2 位作者 李弼程 唐永旺 陈刚 《计算机应用与软件》 CSCD 2016年第5期72-76,共5页
传统的实体关系触发词词典构建主要采用人工方法和有监督的扩展学习方法。但是,上述两种方法都需要大量的人工参与,并且当关系类型发生变化时需要重新构建触发词词典。提出一种无监督的实体关系触发词词典自动构建方法。首先,对关系实... 传统的实体关系触发词词典构建主要采用人工方法和有监督的扩展学习方法。但是,上述两种方法都需要大量的人工参与,并且当关系类型发生变化时需要重新构建触发词词典。提出一种无监督的实体关系触发词词典自动构建方法。首先,对关系实例文档集进行分层狄利克雷过程建模,通过主题过滤和词语概率权重过滤构建候选触发词集合;然后,利用依存句法分析对候选触发词集合进行再次过滤以得到最终的触发词词典。该方法有效避免了传统实体关系触发词词典构建所需的大量人工参与。实验表明,基于分层狄利克雷过程和依存句法分析的实体关系触发词词典自动构建方法有效降低了人工标注成本,取得了较高的准确率。 展开更多
关键词 实体关系触发词词典 分层狄利克雷过程 依存句法分析
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部