题名 面向属性网络社团检测的度修正广义随机块模型
1
作者
王笑
戴芳
郭文艳
王军锋
机构
西安理工大学理学院
出处
《软件学报》
北大核心
2025年第5期2308-2320,共13页
文摘
随机块模型可以拟合各种网络的生成,挖掘网络的隐含结构与潜在联系,在社团检测中具有明显的优势.广义随机块模型GSB是基于链接社团的思想发现广义社团的,但其仅适用于有向无属性网络.针对无向属性网络,对网络拓扑信息建模的同时对节点属性进行建模,提出一种度修正的属性网络广义随机块模型DCGSB(degree corrected general stochastic block model).在该模型中,假设网络拓扑信息和属性信息的生成过程都服从幂函数形式的分布,并且引入节点的度来刻画网络的无标度特性,可以更好地拟合真实网络的生成.利用期望最大化算法对DCGSB模型的参数进行估计,通过硬划分处理,得到节点隶属度,进而完成社团检测.在3个含有不同结构的真实属性网络数据集上进行实验,并与10种社团检测算法进行对比,结果表明DCGSB模型不仅继承了GSB模型的优点,能发现广义社团,而且由于属性信息和节点度的引入,使其社团检测能力优于其他10种比较算法.
关键词
随机块模型
节点度
属性网络
社团检测
Keywords
stochastic block model(SBM)
node degree
attributed network
community detection
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于随机块模型的社区隐藏统一框架
2
作者
刘栋
刘侠
贾若雪
张文生
机构
河南师范大学计算机与信息工程学院
教育人工智能与个性化学习河南省重点实验室(河南师范大学)
教学资源与教育质量评估大数据河南省工程实验室(河南师范大学)
中国科学院自动化研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第7期1850-1862,共13页
基金
国家自然科学基金项目(62072160)。
文摘
社区检测是复杂网络分析的重要工具之一,可帮助深入了解网络的社区结构和节点间潜在的关系,但同时也带来了隐私泄露问题.社区隐藏作为社区检测的伴生问题,旨在以最小的边扰动代价破坏网络的社区结构,近年来受到越来越多学者的关注.但现有的社区隐藏方法忽略了网络的生成机制且缺少针对不同尺度隐藏的统一框架,因此提出了一种基于随机块模型的社区隐藏(community hiding-stochastic block model,HC-SBM)算法,该算法从网络生成机制角度构建了社区隐藏的统一框架,即实现微观(个体)、介观(社区)、宏观(网络)3个尺度上的社区检测算法攻击.其基本思想是基于随机块模型刻画网络的生成机制,特别是网络社区形成和分裂的规律和模式,挖掘生成过程中的关键性链接以及链接集合,最终通过最小代价扰动策略破坏网络社区结构.通过在真实网络上的大量实验,并与4种先进的基准算法进行比较,表明了提出的HC-SBM算法在社区隐藏效果更优.
关键词
社区隐藏
社区检测
随机块模型
生成机制
社会网络分析
Keywords
community hiding
community detection
stochastic block model
generation mechanism
social network analysis
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种基于随机块模型的快速广义社区发现算法
被引量:11
3
作者
柴变芳
于剑
贾彩燕
王静红
机构
交通数据分析与挖掘北京市重点实验室(北京交通大学)
石家庄经济学院信息工程系
河北师范大学信息技术学院
出处
《软件学报》
EI
CSCD
北大核心
2013年第11期2699-2709,共11页
基金
国家自然科学基金(61033013
61370129)
+5 种基金
教育部创新团队项目(K10JB00440)
北京市自然科学基金(4112046)
中央高校基本科研业务费专项资金
河北省科技厅项目(13210702D)
河北省教育厅项目(ZD2010128)
民航局科技基金项目(K12I00 051)
文摘
随机块模型可以生成各种不同结构(称作广义社区,包括传统社区、二分结构、层次结构等)的网络,也可以根据概率对等原则发现网络中的广义社区.但简单的随机块模型在网络生成过程建模和模型学习方面存在许多问题,导致不能很好地发现实际网络的结构,其扩展模型GSB(general stochastic block)基于链接社区思想发现广义社区,但时间复杂度限制其在中大型规模网络中的应用.为了在无任何先验的情形下探索不同规模网络的潜在结构,基于GSB模型设计一种快速算法FGSB,更快地发现网络的广义社区.FGSB在迭代过程中动态学习网络结构参数,将GSB模型的参数重新组织,减少不必要的参数,降低算法的存储空间;对收敛节点和边的参数进行裁剪,减少每次迭代的相关计算,节省算法的运行时间.FGSB与GSB模型求解算法有相同的结构发现能力,但FGSB耗费的存储空间和运行时间比GSB模型求解算法要低.在不同规模的人工网络和实际网络上验证得出:在近似相同的准确率下,FGSB比GSB模型求解算法快,且可发现大型网络的广义社区.
关键词
随机块模型
广义社区
时间复杂度
复杂网络
Keywords
stochastic block model
general community
time complexity
complex network
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 一种高效的随机块模型学习算法
被引量:8
4
作者
赵学华
杨博
陈贺昌
机构
深圳信息职业技术学院数字媒体学院
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室(吉林大学)
出处
《软件学报》
EI
CSCD
北大核心
2016年第9期2248-2264,共17页
基金
国家自然科学基金(61133011
61373053
+6 种基金
61300146
61170092
61202308
61572226)
吉林省自然科学基金(20150101052JC)
广东省自然科学基金(2016A030310072)
吉林大学符号计算与知识工程教育部重点实验室开放课题(93K172016 K19)~~
文摘
由于随机块模型能够有效处理不具有先验知识的网络,对其研究成为了机器学习、网络数据挖掘和社会网络分析等领域的研究热点.如何设计出具有模型选择能力的快速随机块模型学习算法,是目前随机块模型研究面临的一个主要挑战.提出一种精细随机块模型及其快速学习算法.该学习方法基于提出的模型与最小消息长度推导出一个新成本函数,利用期望最大化参数估计方法,实现了边评价模型边估计参数的并行学习策略,以此方式显著降低随机块模型学习的时间复杂性.分别采用人工网络与真实网络,从学习时间和学习精度两方面对提出的学习算法进行了验证,并与现有的代表性随机块模型学习方法进行了对比.实验结果表明:提出的算法能够在保持学习精度的情况下显著降低时间复杂性,在学习精度和时间之间取得很好的折衷;在无任何先验知识的情况下,可处理的网络规模从几百节点提高至几万节点.另外,通过网络链接预测的实验,其结果也表明了提出的模型及学习算法相比现有随机块模型和学习方法具有更好的泛化能力.
关键词
网络数据挖掘
社会网络分析
随机块模型
模型 选择
链接预测
Keywords
network oriented data mining
social network analysis
stochastic block model
model selection
link prediction
分类号
TP108
[自动化与计算机技术—控制理论与控制工程]
题名 基于混合隶属度随机块模型社会网络结构分析
被引量:1
5
作者
师锋洋
王莉
黄博
机构
太原理工大学计算机科学与技术学院
出处
《太原理工大学学报》
CAS
北大核心
2015年第5期561-565,570,共6页
基金
国家"863"高技术研究发展计划项目基金:基于用户兴趣模型的媒体大数据内容整合与可视化技术(2014AA015204)
山西省自然科学基金项目:动态社会网络隐结构推断与演化的关键技术研究(2014011022-1)
文摘
由于大规模社会网络中存在着多种结构,且这些结构对于大规模社会网络的研究至关重要,但现有的结构发现方法大多只能够发现单一的结构或事先确定的结构,不能较为全面的反应大规模社会网络的特征。为解决上述社会网络中多结构发现的问题,引入了混合隶属度随机块模型MMSBM(Mixed Membership Stochastic Block Model)。它不仅能够生成不同结构的网络,同时还可以根据随机等价原则发现网络中的其他结构。通过在两个不同规模的微博数据集上进行结构发现实验,结果表明MMSBM能够同时发现社会网络中的多种结构,与实际观测结构基本吻合,但其计算复杂度较高,在实际应用中仍难以推广。
关键词
随机块模型
社会网络
混合隶属度随机块模型
结构分析
社区
聚团
Keywords
stochastic block model
social networks
mixed membership stochastic block mod-el
structural analysis
community
clique
分类号
TP399
[自动化与计算机技术—计算机应用技术]
题名 正则化度修正随机块模型的演化网络社团发现
被引量:3
6
作者
王亭亭
戴维迪
焦鹏飞
李晓明
机构
天津大学计算机科学与技术学院
天津市认知计算与应用重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第8期134-138,共5页
基金
天津市技术创新引导专项优秀科技特派员基金资助项目(14JCTPJC00517)
文摘
目前大多数用于社团发现问题的模型只适用于静态网络而忽视了时序信息,因此,无法较好地建模真实世界数据。针对该问题,提出一种基于度修正随机块模型的演化社团发现模型。根据演化聚类框架的原理,基于社团隶属矩阵将一个正则项引入到度修正随机块模型的目标函数中。利用网络交叉验证方法进行模型选择,处理社团个数随时间变化的演化网络,从而克服由于假定社团个数为常量而导致的与真实世界数据不相符合的问题。实验结果表明,与经典的动态随机块模型和Facet Net相比,该模型具有较高的准确性和较低的误差率。
关键词
演化网络
演化分析
社团发现
模型 选择
随机块模型
节点特性
Keywords
evolving network
evolutionary analysis
community detection
model selection
stochastic block model
node peculiarity
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种度修正的属性网络随机块模型
被引量:3
7
作者
郑忆美
贾彩燕
常振海
李轩涯
机构
北京交通大学计算机与信息技术学院
交通数据分析与挖掘北京市重点实验室(北京交通大学)
天水师范学院数学与统计学院
百度在线网络技术(北京)有限公司
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第8期1650-1662,共13页
基金
国家自然科学基金项目(61876016,61632004)
中央高校基本科研业务费专项资金项目(2019JBZ110)
百度松果计划开放研究基金项目。
文摘
社区检测是复杂网络分析中的重要任务,现有的社区检测方法多侧重于利用单纯的网络结构,而融合节点属性的方法也主要针对传统的社区结构,不能检测网络中的二部图结构、混合结构等情况.此外,网络中每个节点的度会影响网络中链接的构成,同样会影响社区结构的分布.因此,提出一种基于随机块模型的属性网络社区检测方法DPSB_PG.不同于其他属性网络中的生成式模型,该方法中节点链接和节点属性的产生均服从泊松分布,并基于随机块模型考虑社区间相连接的概率,重点在节点链接的生成过程中融合度修正的思想,最后利用期望最大化EM算法推断模型中的参数,得到网络中节点的社区隶属度.真实网络上的实验结果显示:模型继承了随机块模型的优点,能够检测网络中的广义社区结构,且由于度修正的引入,具有很好的数据拟合能力,因此在属性网络与非属性网络社区检测性能上优于其他现有相关算法.
关键词
度修正
泊松分布
随机块模型
广义结构
属性网络
Keywords
degree corrected
Poisson distribution
stochastic block model
general structure
attributed networks
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于随机块模型的多层次服务生态系统演化分析
被引量:2
8
作者
刘明义
涂志莹
徐晓飞
王忠杰
机构
哈尔滨工业大学计算学部
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第4期798-811,共14页
基金
国家重点研发计划(No.2018YFB1402500)
国家自然科学基金(No.61772155,61832004,61802089)资助.
文摘
随着云计算、边缘计算和移动计算等新技术的快速发展,可用服务的数量和多样性呈现出爆炸式增长.服务之间快速增长的合作、竞争关系催生了“服务生态系统”这一新现象.复杂多变的市场环境使得服务的变化频率越来越高,因此服务生态系统的演化研究是当前一个重要的研究问题,发现其演化过程中蕴含的潜在演化模式以帮助服务提供者和市场监管者做出决策.为此,服务生态系统演化分析成为了软件服务工程领域的研究热点之一,许多的研究工作依托当前流行的开源服务生态系统ProgrammableWeb展开.然而,现有服务生态系统演化分析视角比较单一,分析内容局限于服务生态系统宏观的网络拓扑性质,这种分析方式极大的限制了服务生态系统演化分析的应用场景.本文首先利用带权重的度修正随机块模型对服务生态系统进行建模,基于随机块模型中的参数变化,从服务生态整体、服务社区和服务个体三个层次对服务生态系统的演化进行了全面的分析,提出了面向服务生态整体层面的演化点发现算法、面向服务社区层面的社区演化事件检测算法、面向服务个体的个体发展阶段划分算法.基于一个典型的Web服务生态系统ProgrammableWeb的真实数据集进行了实验,实验结果验证了本文方法的有效性.
关键词
服务生态系统
演化分析
随机块模型
Programmable
Web
API
Keywords
service ecosystem
evolution analysis
stochastic block model
Programmable Web
API
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于统计推理的社区发现模型综述
被引量:4
9
作者
柴变芳
贾彩燕
于剑
机构
北京交通大学计算机与信息技术学院
石家庄经济学院信息工程系
出处
《计算机科学》
CSCD
北大核心
2012年第8期1-7,30,共8页
基金
国家自然科学基金项目(61033013)
北京市自然科学基金(4112046)
河北省自然科学基金项目(F2008000204)资助
文摘
社区有助于揭示复杂网络结构和个体间的关系。研究人员从不同视角提出很多社区发现方法,用来识别团内紧密、团间稀疏的网络结构。自2006年以来,提出了一些基于统计推理的社区发现方法,它们可识别实际网络中更多的潜在结构,并以其可靠的理论基础和优越的结构识别能力成为当前的主流。该类方法的主要目标是建立符合实际网络的生成模型以拟合观测网络,将社区发现问题转化为贝叶斯推理问题。首先给出社区发现中生成模型的相关定义;其次按照模型中社区组成元素将已有统计推理模型分为节点社区推理模型和链接社区推理模型,并深入探讨各种模型的设计思想及实现算法;再次,总结各模型适用的网络类型及规模、发现的社区结构、算法复杂度等,给出一种选择已有基于统计推理的社区发现模型的方法,并利用基准数据集对已有典型统计推理模型进行验证及分析;最后探讨了基于统计推理模型的社区发现存在的主要问题和未来发展的方向。
关键词
社区发现
概率模型
随机块模型
统计推理
混合隶属度
Keywords
Community detection
Probabilistic model
Stochastic block model
Statistical inference
Mixed membership
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于WB-MMSB模型的微博网络社区发现
被引量:1
10
作者
徐建民
武晓波
吴树芳
粟武林
机构
河北大学数学与计算机学院
河北大学管理学院
出处
《计算机科学》
CSCD
北大核心
2015年第3期65-70,共6页
基金
中国博士后科学基金项目(20070420700)
河北省自然科学基金项目(F2011201146)资助
文摘
提出了一个用于微博网络社区发现的模型WB-MMSB,该模型考虑了微博网络中节点存在的单向关系,节点的社区隶属度从链入主题隶属度和链出主题隶属度两个方面表示。用指数族分布和平均场变分推理方法推导了模型中各变量的表示,并用SVI算法计算模型涉及的参数。实验在新浪微博数据集上进行,采用归一化互信息和困惑度进行评估,结果表明,WB-MMSB模型的社区发现能力优于aMMSB模型,并且其收敛速度快于aMMSB模型。
关键词
微博网络
社区发现
混合隶属度随机块模型
重叠社区
Keywords
Micro-blog network
Community detection
Mixed membership stochastic block model
Overlapping commu-nities
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 内容网络广义社区发现有效算法
被引量:3
11
作者
柴变芳
赵晓鹏
贾彩燕
于剑
机构
北京交通大学交通数据分析与挖掘北京市重点实验室
石家庄经济学院信息工程系
河北省财政厅综合治税办公室
出处
《计算机科学与探索》
CSCD
2014年第9期1076-1084,共9页
基金
中央高校基本科研业务费专项资金~~
文摘
在对网络无任何先验知识情形下,PPSB-DC模型(popularity and productivity stochastic block model and discriminative content model)利用网络的内容和链接对网络生成过程进行建模,可有效地发现广义社区及社区间的链接模式。但该概率模型的参数估计算法耗时,初始链接模式参数设置敏感,限制了该模型的应用。对参数求解算法进行了改进,设计了一个有效的内容网络广义社区发现算法EPPSBDC(efficient PPSB-DC)。该算法通过采取抽样和并行技术,提高了算法运行速度,通过引入链接概率先验,消除了算法对初始参数的敏感性。在内容网络上与同类算法进行了比较,验证了EPPSBDC算法的有效性。
关键词
广义社区发现
大规模内容网络
随机块模型
抽样
Keywords
general community detection
massive content networks
stochastic block model
sampling
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于复发瞬间链接间隔的动态网络社区发现
被引量:1
12
作者
赵晓兵
王佳顺
机构
浙江财经大学数据与科学学院
出处
《统计与信息论坛》
CSSCI
北大核心
2023年第4期3-18,共16页
基金
国家社会科学基金项目“大数据环境下基于随机块模型的复杂网络社区发现理论、算法和应用”(18BTJ023)。
文摘
纵向网络数据是较为常见的复杂网络数据,也是目前网络数据分析的热点之一。随机块模型是网络社区发现的经典模型,但是该模型无法直接用于模拟纵向网络数据。基于随机块模型,引入半参数比例风险模型去分析纵向网络数据,并利用随机块模型来描述复发瞬间链接间隔。结合变分EM算法,采用两步估计来分别估计模型参数和非参数部分,通过不同场景下的模拟试验来验证所提议模型的优良性,最后利用法国小学生的社交网络数据进行了实证分析。模拟和实证结果表明,在统计计算的时效和参数或非参数估计的精度上,本文所提出的网络数据模型和统计分析方法比现存文献的模型和方法具有较好的优势。
关键词
随机块模型
边际比例风险模型
变分EM算法
传染病防控
Keywords
stochastic block model
marginal proportional hazards model
variational EM algorithm
infectious disease prevention and control
分类号
O21
[理学—概率论与数理统计]
题名 基于网络拓扑与节点元数据的社团检测算法
被引量:1
13
作者
刘宇廷
毕海滨
郭强
倪颖杰
机构
江南计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第11期178-183,共6页
基金
国家自然科学基金(91430214)
"核高基"重大专项(2015ZX01040-201)
文摘
传统社团检测算法利用网络拓扑挖掘社团结构,忽略了真实复杂网络中节点自身属性等信息在社团归属方面的重要作用。为此,提出基于网络拓扑与节点元数据的复杂网络社团检测算法。将高维的节点元数据建模为混合高斯模型,结合随机块模型建立似然概率模型,通过求解模型最优解得到网络的最优划分结果。在基准网络与Facebook网络上的实验结果表明,该算法不仅能准确挖掘网络中的社团结构,而且可结合真实社团情况给出合理解释。
关键词
复杂网络
社团检测
节点元数据
高斯混合模型
随机块模型
Keywords
complex network
community detection
node metadata
Gaussian Mixture Model(GMM)
random block model
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于种子节点扩展的社区发现方法
被引量:2
14
作者
李红宁
赵迪
张皓旭
机构
西安电子科技大学通信工程学院
西安电子科技大学计算机学院
出处
《通信学报》
EI
CSCD
北大核心
2018年第A02期138-143,共6页
文摘
现实生活中的许多复杂互联的系统可以被抽象为网络结构,通过这种抽象可以更好地研究和分析这些系统。社区可检测性研究的是"社区能否检测"的问题。社区可检测性研究是社区发现算法的一个前提工作,现有的社区可检测性方法一般是在均匀社区的前提下工作的。针对非均匀条件下的社区可检测性的问题,提出了一种基于SBM的社区可检测性方法,并进一步的验证表明,提出的社区可检测性方法在非均匀社区的条件下可以完成社区可检测性的工作。
关键词
复杂网络
社区
社区可检测性
随机块模型
Keywords
complex network
community
community detectability
stochastic block model
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于置信传播的复杂网络社团发现算法
15
作者
尤心心
葛檬
机构
天津大学软件学院
出处
《计算机应用》
CSCD
北大核心
2017年第11期3115-3118,共4页
基金
国家自然科学基金资助项目(61303110
61502334)
天津大学北洋学者.青年骨干教师项目(2017XRG-0016)~~
文摘
经典的置信传播(BP)算法能够通过有限次数的迭代,推断出所有节点的边缘概率分布和最大似然概率。针对该算法在迭代过程中产生的影响精度和收敛速度的强烈震荡,找出了造成震荡的三个主要因素:强势能、紧密的环路和矛盾的方向,并有针对性地改进了该算法的核心更新规则;同时又进一步提出了异步消息传递方式,克服传统置信传播算法采用的同步消息传播方式的收敛慢、效率低等缺点。利用随机块模型拟合网络的生成过程,利用经典的期望最大化算法对模型进行求解,分别利用改进前后的置信传播算法推断隐变量的后验概率。在五个真实网络上的实验表明,两个改进均使得精度和速度不同程度地提高。
关键词
复杂网络
社团发现
置信传播
随机块模型
收敛速度
Keywords
complex network
community detection
Belief Propagation (BP)
stochastic block model
convergence rate
分类号
TP393
[自动化与计算机技术—计算机应用技术]