期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
概率生成模型变分推理方法综述 被引量:3
1
作者 陈亚瑞 杨巨成 +2 位作者 史艳翠 王嫄 赵婷婷 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期617-632,共16页
概率生成模型是知识表示的重要方法,在该模型上计算似然函数的概率推理问题一般是难解的.变分推理是重要的确定性近似推理方法,具有较快的收敛速度、坚实的理论基础.尤其随着大数据时代的到来,概率生成模型变分推理方法受到工业界和学... 概率生成模型是知识表示的重要方法,在该模型上计算似然函数的概率推理问题一般是难解的.变分推理是重要的确定性近似推理方法,具有较快的收敛速度、坚实的理论基础.尤其随着大数据时代的到来,概率生成模型变分推理方法受到工业界和学术界的极大关注.综述了多种概率生成模型变分推理框架及最新进展,具体包括:首先综述了概率生成模型变分推理一般框架及基于变分推理的生成模型参数学习过程;然后对于条件共轭指数族分布,给出了具有解析优化式的变分推理框架及该框架下可扩展的随机化变分推理;进一步,对于一般概率分布,给出了基于随机梯度的黑盒变分推理框架,并简述了该框架下多种变分推理算法的具体实现;最后分析了结构化变分推理,通过不同方式丰富变分分布提高推理精度并改善近似推理一致性.此外,展望了概率生成模型变分推理的发展趋势. 展开更多
关键词 概率生成模型 变分推理 条件共轭指数族 黑盒变分推理 结构化变分推理
在线阅读 下载PDF
基于概率生成模型的网络数据分类方法 被引量:2
2
作者 王桢文 肖卫东 谭文堂 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2642-2650,共9页
利用实体之间的相互关系来对实体进行分类的网络数据分类是数据挖掘的一个重要研究内容.现有的网络数据分类方法普遍根据邻居节点的类别来对节点进行分类.这些方法在同质性程度较高的网络中达到了很高的分类精度.然而在现实世界中,存在... 利用实体之间的相互关系来对实体进行分类的网络数据分类是数据挖掘的一个重要研究内容.现有的网络数据分类方法普遍根据邻居节点的类别来对节点进行分类.这些方法在同质性程度较高的网络中达到了很高的分类精度.然而在现实世界中,存在许多同质性程度很低的网络.在低同质性网络中,大多数相连节点的类别不同,所以现有方法难以正确预测出节点的类别.因此,提出了一种新的网络数据分类方法.其主要思路是建立一个描述网络的概率生成模型.在这个概率生成模型中,将网络中的边作为观察变量,将未知类别节点的类别作为潜在变量.通过吉布斯采样方法对模型进行求解,计算出潜在变量的取值,从而得到未知类别节点的类别.在真实数据集上的对比实验表明,提出的分类方法在低同质性网络上有更好的分类性能. 展开更多
关键词 网络数据 网络数据分类 节点分类 概率生成模型 同质性
在线阅读 下载PDF
基于概率生成模型的微博话题传播群体划分方法
3
作者 陈静 刘琰 王煦中 《计算机科学》 CSCD 北大核心 2016年第8期223-228,239,共7页
事件以话题形式在微博中迅速传播,并能够产生巨大的影响力。因此,对参与话题传播过程的用户进行分析以及发现具有不同主题兴趣情感倾向性的群体受到政府和企业的广泛关注。现阶段,绝大多数应用到微博的群体发现算法都是从单个用户出发,... 事件以话题形式在微博中迅速传播,并能够产生巨大的影响力。因此,对参与话题传播过程的用户进行分析以及发现具有不同主题兴趣情感倾向性的群体受到政府和企业的广泛关注。现阶段,绝大多数应用到微博的群体发现算法都是从单个用户出发,仅考虑了用户社会联系,与用户共享内容相隔离,其群体发现的结果不具有语义信息。少数算法综合了用户社会联系与内容,却忽略了微博本身的结构特性。因此从微博话题的角度出发,综合考虑话题传播过程中的用户交互、微博文本内容以及情感极性,同时结合用户的行为信息,提出了一个基于概率生成模型的微博话题传播群体划分方法 BP-STG。采用吉布斯抽样对模型进行推导,不仅能够挖掘出具有不同主题倾向性的群体,同时还能够挖掘出群体的情感倾向分布以及用户在群体中的活跃度及其行为表现。此外,模型还能够推广到许多带有社交网络性质的媒体中。在获取的新浪微博两个话题数据集上的实验表明,BP-STG模型不仅能够有效地对微博话题传播群体进行划分,而且能够发现群体内部活跃用户以及用户在群体中的行为模式。 展开更多
关键词 微博话题 概率生成模型 群体划分 情感元素 行为模式
在线阅读 下载PDF
基于概率主题模型的社交网络层次化社区发现算法 被引量:6
4
作者 毕娟 秦志光 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第6期898-903,共6页
针对传统的社区发现算法大多基于网络拓扑结构寻找独立的社区结构,忽略了用户兴趣属性,并且不能有效地发现社区间的相关性和层次关系等问题。该文提出一种新型的基于PAM(pachinko allocation model)概率主题模型的层次化网络社区发现算... 针对传统的社区发现算法大多基于网络拓扑结构寻找独立的社区结构,忽略了用户兴趣属性,并且不能有效地发现社区间的相关性和层次关系等问题。该文提出一种新型的基于PAM(pachinko allocation model)概率主题模型的层次化网络社区发现算法,综合考虑了用户的兴趣和用户的社交网络关系,在同一模型平台上实现层次化的社区结构发现和用户兴趣挖掘,并捕捉和揭示社区之间的关联性和重叠性等特征。模型采用Gibbs采样方法进行参数推导。在真实数据集上的实验结果验证了所提出算法的可行性和有效性。 展开更多
关键词 层次化社区发现 LDA 概率生成模型 社交网络
在线阅读 下载PDF
熵正则化下的变分深度生成聚类模型
5
作者 张志远 陈亚瑞 +2 位作者 杨剑宁 丁文强 杨巨成 《计算机科学与探索》 CSCD 北大核心 2023年第2期376-384,共9页
基于深度学习的聚类方法可以自动学习到数据的隐层特征表示,并可方便应用于高维大规模数据集上。传统深度聚类方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分析,同时缺... 基于深度学习的聚类方法可以自动学习到数据的隐层特征表示,并可方便应用于高维大规模数据集上。传统深度聚类方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分析,同时缺乏对施加约束后的离散隐向量分布的分析。提出熵正则化下的变分深度生成聚类模型(VDGC-ER),以变分自编码为基础框架,对连续向量进行高斯混合先验建模,并以高斯混合中的离散隐向量作为类别向量。通过对离散隐向量引入样本熵正则化项增强预测聚类类别的区分度,同时对离散隐向量定义聚合样本熵正则化项以降低聚类不平衡,避免局部最优,并提升生成数据多样性。之后,采用蒙特卡洛采样及重参策略估计VDGC-ER模型的优化目标,并利用随机梯度下降法求解模型参数。最后在MNIST数据集、REUTERS数据集、REUTERS-10K数据集和HHAR数据集上设计了对比实验,验证了VDGCER模型不仅可以生成高质量的样本,而且可以显著提升聚类精度。 展开更多
关键词 变分自编码 概率生成模型 变分推理 熵正则化 聚类
在线阅读 下载PDF
锚社区时序网络图生成算法
6
作者 郑舒文 王朝坤 《计算机科学》 CSCD 北大核心 2024年第1期113-123,共11页
图数据相关分析任务往往需要合成数据集来检验和评估算法的有效性和高效性。真实世界图数据不仅在拓扑上具有社区结构特征,还往往在时序上呈现出一定的演化特性,社区节点可能在锚定时间窗口内频繁交互。然而,现有合成方法存在一定局限... 图数据相关分析任务往往需要合成数据集来检验和评估算法的有效性和高效性。真实世界图数据不仅在拓扑上具有社区结构特征,还往往在时序上呈现出一定的演化特性,社区节点可能在锚定时间窗口内频繁交互。然而,现有合成方法存在一定局限性。大多方法或仅关注网络中的社区结构,或仅关注网络中的时序信息,无法生成节点锚时频繁交互的社区。为克服此局限,提出了锚社区概念及定义以刻画社区内节点锚时频繁交互的特性;接着,基于分布概率生成模型提出了一般时序图生成算法;进一步地,提出了锚社区时序网络图生成算法(GTN-AC),不仅允许用户配置锚定时间窗口,还允许用户指定度数分布和时间戳分布。实验结果表明,相较于基准方法,GTN-AC能在保证较优生成质量的同时拥有较快的生成速度。 展开更多
关键词 时序网络 锚定时间窗口 锚社区 分布概率生成模型 生成
在线阅读 下载PDF
基于MB-LDA模型的微博主题挖掘 被引量:170
7
作者 张晨逸 孙建伶 丁轶群 《计算机研究与发展》 EI CSCD 北大核心 2011年第10期1795-1802,共8页
随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本... 随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘. 展开更多
关键词 微博 主题挖掘 LDA 概率生成模型 社交网络
在线阅读 下载PDF
基于多特征扩展pLSA模型的场景图像分类 被引量:10
8
作者 江悦 王润生 《信号处理》 CSCD 北大核心 2010年第4期539-544,共6页
场景图像分类近年来受到人们的广泛关注,而基于统计模型的方法更是场景分类中的研究热点。我们提出了一种新的基于多特征融合和扩展pLSA模型的场景图像分类框架。对每幅图像首先用多尺度规则分割确定局部基元,然后提取每个局部基元的多... 场景图像分类近年来受到人们的广泛关注,而基于统计模型的方法更是场景分类中的研究热点。我们提出了一种新的基于多特征融合和扩展pLSA模型的场景图像分类框架。对每幅图像首先用多尺度规则分割确定局部基元,然后提取每个局部基元的多分辨率直方图矩特征和SIFT特征,最后用扩展的概率生成模型对图像集进行建模,测试。我们的方法不仅能够很好的表示图像的语义特性而且在模型的训练阶段是无监督的。我们针对目前常用的3个数据库,做了三组对比实验,均取得了比以前的方法更好的识别结果。 展开更多
关键词 多分辨率直方图矩特征 场景分类 概率生成模型
在线阅读 下载PDF
基于MRT-LDA模型的微博文本分类 被引量:3
9
作者 庞雄文 万本帅 王盼 《计算机科学》 CSCD 北大核心 2017年第8期236-241,259,共7页
微博的广泛使用产生了大量微博数据,这些数据中包含有大量有价值的信息。然而由于微博信息的文本内容简短且其本身带有一些结构化的社会网络方面的信息,传统的主题模型建模方法并不能十分有效地处理微博信息。根据微博信息的特点,提出... 微博的广泛使用产生了大量微博数据,这些数据中包含有大量有价值的信息。然而由于微博信息的文本内容简短且其本身带有一些结构化的社会网络方面的信息,传统的主题模型建模方法并不能十分有效地处理微博信息。根据微博信息的特点,提出一个基于Latent Dirichlet Allocation(LDA)的微博生成模型MRT-LDA,利用微博之间的转发、对话、支持(赞)和评论等关系来计算微博之间的相关性,综合考虑微博之间的相关性和同一用户微博信息间的关系,来辅助对微博的主题进行挖掘。采用吉布斯抽样法对模型进行推导,结果表明该模型能有效地对微博数据进行文本挖掘。 展开更多
关键词 微博 主题挖掘 LDA MRT-LDA 概率生成模型 社交网络
在线阅读 下载PDF
一种内容和地点感知的个性化POI推荐模型
10
作者 梁弼 刘笃晋 +1 位作者 熊伦 许晓红 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2022年第6期693-700,共8页
针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出... 针对兴趣点(point of interest,POI)推荐中用户-POI交互矩阵数据稀疏问题,当前研究仅通过探索地理位置、内容信息及社会关系等上下文因素来缓解该问题,缺乏对这些上下文因素共同作用情况的综合分析及利用.为此,采用概率生成的方法提出一种内容和地点感知的主题模型(content-location-aware topic model,CLATM),用以模拟用户在决策过程中的签到行为.该模型由内容主题建模和地点主题建模两个核心模块构成,用户签到内容依赖内容主题和地点主题,内容主题和地点主题在一定程度上共同决定用户签到地点,地理位置依赖于地点主题并服从高斯分布.该模型不仅恰当地整合了内容、地点和地理位置等重要的上下文因素,且充分利用这些因素之间的潜在关系有效缓解了数据稀疏性.在Foursquare和Yelp两个真实的位置社交网络数据集上对CLATM进行性能评测,实验结果表明,该模型在召回率(recall)和归一化折损累计增益(normalized discounted cumulative gain,NDCG)指标上均优于基准,recall@20和NDCG@20最大分别提高约141.09%和94.44%.综合使用上下文因素的共同作用能有效提升POI推荐性能. 展开更多
关键词 人工智能 兴趣点推荐 数据稀疏性 内容主题 地点主题 上下文因素 潜在关系 概率生成模型 位置社交网络
在线阅读 下载PDF
基于用户签到行为的兴趣点推荐 被引量:50
11
作者 任星怡 宋美娜 宋俊德 《计算机学报》 EI CSCD 北大核心 2017年第1期28-51,共24页
随着大数据技术的快速发展,推荐系统成为大数据领域里的一个重要的研究方向.随着基于位置社交网络(Location-Based Social Networks,LBSN)的快速发展,兴趣点(Point-Of-Interest,POI)推荐成为一个重要的研究热点,帮助人们发现有趣的并吸... 随着大数据技术的快速发展,推荐系统成为大数据领域里的一个重要的研究方向.随着基于位置社交网络(Location-Based Social Networks,LBSN)的快速发展,兴趣点(Point-Of-Interest,POI)推荐成为一个重要的研究热点,帮助人们发现有趣的并吸引人的位置,特别是当用户在异地旅行的时候.由于用户的签到行为具有高稀疏性,为兴趣点推荐带来很大的挑战.为处理用户签到数据的稀疏性问题,越来越多的研究结合地理影响、时间效应、社会相关性、内容信息和流行度影响这些方面的因素为提高兴趣点推荐的性能.然而,目前的研究缺乏一种综合分析上述所有因素共同作用的方法来处理兴趣点的数据稀疏问题,特别是异地推荐场景被目前大多数研究工作所忽略.针对以上所述的挑战,文中提出一种联合概率生成模型,称为GTSCP,模拟用户签到行为的决策过程,该模型有效地融合上述因素来处理数据稀疏性,特别是异地推荐场景.文章所提的兴趣点推荐方法包含离线模型和在线推荐两个部分.文中所提的GTSCP联合模型支持本地和异地两种推荐场景.文章在多个真实LBSNs的大规模签到数据集上进行实验,结果表明该算法相比其它先进的兴趣点推荐算法具有更好的推荐效果. 展开更多
关键词 基于位置的社交网络 兴趣点推荐 概率生成模型 用户签到行为 联合模型
在线阅读 下载PDF
面向伴随型机器人同步运动的递进式步态时相检测算法 被引量:4
12
作者 张金艺 秦政 +1 位作者 林羽晨 姜玉稀 《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第1期113-120,共8页
在面向伴随型机器人的研究中,步态时相检测是保持人机同步运动的关键。然而,提高检测精度需要收集和分析更多步态时相信息,这导致检测延时冗长,无法满足实时性需求。针对此问题提出一种面向伴随型机器人同步运动的递进式步态时相检测算... 在面向伴随型机器人的研究中,步态时相检测是保持人机同步运动的关键。然而,提高检测精度需要收集和分析更多步态时相信息,这导致检测延时冗长,无法满足实时性需求。针对此问题提出一种面向伴随型机器人同步运动的递进式步态时相检测算法,主要依托惯性测量单元和贝叶斯信息准则构建概率生成模型的物理层和决策层,对步态时相进行初步的快速检测;当检测达不到判决阈值时,在决策层中引入记忆网络,预测下一段时间的步态时相参数,从而为概率生成模型提供更多的决策信息,并依据多次判决结果递进地完成步态时相精准的增量检测。实验结果表明:算法的步态时相检测准确率达97.8%;决策时间为28.3 ms,相较于自适应贝叶斯算法降低了约30%。 展开更多
关键词 伴随型机器人 同步运动 步态时相检测 贝叶斯信息准则 概率生成模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部